当今社会是一个快速发展的社会,科学技术发达,信息流动,人与人之间的交流越来越密切,生活越来越方便,大数据就是这个高科技时代的产物。随着大数据的不断普及,未来将与更多行业结合,就业前景非常好。越来越多的组织,无论大小,新进入市场的还是已建立的,都准备为大数据初级工程师支付高薪。
大数据工程师有什么特征
1. 海量数据:在当今的数字时代,人们的日常生活正在产生大量的数据。大数据不再以GB或TB来衡量,而是以PB、EB或ZB来衡量,从TB跃升到PB、EB甚至ZB级别。顾名思义,这是大数据的第一个特征。
2. 数据种类繁多:全球结构化数据和非结构化数据的增长率分别为32%和63%,其中web日志、音视频、图片、地理位置信息等非结构化数据的数量约占80%,并在逐步增加。然而,产生人类智能的大数据往往是这种非结构化数据。
3. 数据价值密度低:大数据的重点不在于数据量的增长,而在于信息爆炸时代对数据价值的重新挖掘。如何挖掘大数据的有效信息至关重要。值密度与数据总量的大小成反比。虽然低价值密度是大数据日益突出的特征,但研究和分析大数据仍具有深远的意义,大数据的价值仍不可估量。
4. 数据生成和处理速度:美国互联网数据中心指出,企业数据正以每年55%的速度增长,互联网数据将以每年50%的速度增长,并且每两年将翻一番。除了数据的大小,数据的价值还与数据处理的速度成正比,即数据处理的速度越快、越及时,其发挥的效率和价值就越大。
大数据工程师就业机会
根据“十四五”规划,大数据产业规模预计超过3万亿元。为了实现这一目标,中国的大数据技术必须将数据存储、计算、传输等领域提高到国际先进水平。
特别是进入数字时代,落实新发展理念,全面深层次激活数据要素潜力,释放数据要素价值,将带动大数据产业高质量发展。数据显示,从2018年到2023年,中国大数据产业规模呈逐年增长趋势。到2020年底,中国大数据产业规模将达到6388亿元;预计到2023年,中国大数据产业规模将达到10099.3亿元。
大数据工程师需具备的能力
数学和统计学背景
在我们采访的BAT三大互联网公司中,对大数据工程师的要求都是具有统计和数学背景的硕士或博士学位。沈志勇认为,缺乏理论背景的数据工作者更容易在技能上进入一个危险地带——一堆数字,根据不同的数据模型和算法总能算出一些结果,但如果你不知道它代表什么,那就不是真正有意义的结果,而且这样的结果很容易误导你。“只有掌握了一定的理论知识,你才能理解模型,重用模型,甚至创新模型来解决实际问题。”沈志勇说。
计算机编码能力
实际开发能力和大规模数据处理能力是成为大数据工程师的一些基本要素。“因为很多数据的价值来自于挖掘的过程,你必须亲自动手才能发现黄金的价值。”郑立峰说。
例如,人们在社交网络上生成的许多记录现在都是非结构化数据,如何从这些毫无头绪的文本、声音、图像甚至视频中提取有意义的信息取决于大数据工程师。即使在一些团队中,大数据工程师的角色主要是业务分析,熟悉计算机处理大数据的方式也是很重要的。