大数据工程师到底是什么?

作者&投稿:单于修 (若有异议请与网页底部的电邮联系)
大数据工程师是做什么的~

大数据工程师主要是,分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务:
找出过去事件的特征:大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。
预测未来可能发生的事情:通过引入关键因素,大数据工程师可以预测未来的消费趋势。
找出最优化的结果:根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。


扩展资料
大数据工程师需要学习的知识

1、linux
大数据集群主要建立在linux操作系统上,Linux是一套免费使用和自由传播的类Unix操作系统。而这部分的内容是大家在学习大数据中必须要学习的,只有学好Linux才能在工作中更加的得心应手。
2、Hadoop
我觉的大家听过大数据就一定会听过hadoop。Hadoop是一个能够对大量数据进行离线分布式处理的软件框架,运算时利用mapreduce对数据进行处理。

参考资料来源:百度百科-大数据分析师

当前大数据平台开发岗位的附加值还是比较高的,大数据平台开发岗位往往集中在大型互联网企业,随着云计算逐渐从IaaS向PaaS过渡,大数据平台开发也会基于行业特点来开发针对性比较强的PaaS平台,这是整合行业资源并搭建技术生态的一个关键。搭建PaaS平台不仅需要掌握大数据知识,同时还需要掌握云计算知识,实际上大数据和云计算本身就有比较紧密的联系,二者在技术体系结构上都是以分布式存储和分布式计算为基础,只不过关注点不同而已。


大数据运维工程师以搭建大数据平台为主,虽然这部分岗位的门槛相对比较低,但是需要学习的内容还是比较多的,而且内容也比较杂,网络知识、数据库管理知识、操作系统(Linux)知识、大数据平台(含开源和商用平台)知识都需要掌握一些,对于实践操作的要求会比较高。


最后,当前大数据工程师往往并不包含专业的数据分析岗位,一般数据分析岗位都会单独列出来,这部分岗位涉及到算法岗、开发岗(实现)和数据呈现岗等,数据分析岗位对于从业者的数学基础要求比较高,同时还需要掌握大量的数据分析工具,当然也离不开Python、Sql等知识。

用阿里巴巴集团研究员薛贵荣的话来说,大数据工程师就是一群“玩数据”的人,玩出数据的商业价值,让数据变成生产力。大数据和传统数据的最大区别在于,它是在线的、实时的,规模海量且形式不规整,无章法可循,因此“会玩”这些数据的人就很重要。

沈志勇认为如果把大数据想象成一座不停累积的矿山,那么大数据工程师的工作就是,“第一步,定位并抽取信息所在的数据集,相当于探矿和采矿。第二步,把它变成直接可以做判断的信息,相当于冶炼。最后是应用,把数据可视化等。”

因此分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务。通过这三个工作方向,他们帮助企业做出更好的商业决策。



1.找出过去事件的特征
大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。比如,腾讯的数据团队正在搭建一个数据仓库,把公司所有网络平台上数量庞大、不规整的数据信息进行梳理,总结出可供查询的特征,来支持公司各类业务对数据的需求,包括广告投放、游戏开发、社交网络等。
找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。“你可以知道他是什么样的人、他的年纪、兴趣爱好,是不是互联网付费用户、喜欢玩什么类型的游戏,平常喜欢在网上做什么事情。”腾讯云计算有限公司北京研发中心总经理郑立峰说。下一步到了业务层面,就可以针对各类人群推荐相关服务,比如手游,或是基于不同特征和需求衍生出新的业务模式,比如微信的电影票业务。
2.预测未来可能发生的事情
通过引入关键因素,大数据工程师可以预测未来的消费趋势。在阿里妈妈的营销平台上,工程师正试图通过引入气象数据来帮助淘宝卖家做生意。“比如今年夏天不热,很可能某些产品就没有去年畅销,除了空调、电扇,背心、游泳衣等都可能会受其影响。那么我们就会建立气象数据和销售数据之间的关系,找到与之相关的品类,提前警示卖家周转库存。”薛贵荣说。
在百度,沈志勇支持“百度预测”部分产品的模型研发,试图用大数据为更广泛的人群服务。已经上线的包括世界杯预测、高考预测、景点预测等。以百度景点预测为例,大数据工程师需要收集所有可能影响一段时间内景点人流量的关键因素进行预测,并为全国各个景点未来的拥挤度分级—在接下来的若干天时间里,它究竟是畅通、拥挤,还是一般拥挤?
3.找出最优化的结果
根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。
以腾讯来说,郑立峰认为能反映大数据工程师工作的最简单直接的例子就是选项测试(AB Test),即帮助产品经理在A、B两个备选方案中做出选择。在过去,决策者只能依据经验进行判断,但如今大数据工程师可以通过大范围地实时测试—比如,在社交网络产品的例子中,让一半用户看到A界面,另一半使用B界面,观察统计一段时间内的点击率和转化率,以此帮助市场部做出最终选择。

写 SQL (很多入职一两年的大数据工程师主要的工作就是写 SQL )

2 为集群搭大数据环境(一般公司招大数据工程师环境都已经搭好了,公司内部会有现成的大数据平台,但我这边会私下搞一套测试环境,毕竟公司内部的大数据系统权限限制很多,严重影响开发效率)

3 维护大数据平台(这个应该是每个大数据工程师都做过的工作,或多或少会承担“运维”的工作)

4 数据迁移(有部分公司需要把数据从传统的数据库 Oracle、MySQL 等数据迁移到大数据集群中,这个是比较繁琐的工作,吃力不讨好)

5 应用迁移(有部分公司需要把应用从传统的数据库 Oracle、MySQL 等数据库的存储过程程序或者SQL脚本迁移到大数据平台上,这个过程也是非常繁琐的工作,无聊,高度重复且麻烦,吃力不讨好)

6 数据采集(采集日志数据、文件数据、接口数据,这个涉及到各种格式的转换,一般用得比较多的是 Flume 和 Logstash)

7 数据处理
7.1 离线数据处理(这个一般就是写写 SQL 然后扔到 Hive 中跑,其实和第一点有点重复了)
7.2 实时数据处理(这个涉及到消息队列,Kafka,Spark,Flink 这些,组件,一般就是 Flume 采集到数据发给 Kafka 然后 Spark 消费 Kafka 的数据进行处理)

8 数据可视化(这个我司是用 Spring Boot 连接后台数据与前端,前端用自己魔改的 echarts)

9 大数据平台开发(偏Java方向的,大概就是把开源的组件整合起来整成一个可用的大数据平台这样,常见的是各种难用的 PaaS 平台)

10 数据中台开发(中台需要支持接入各种数据源,把各种数据源清洗转换为可用的数据,然后再基于原始数据搭建起宽表层,一般为了节省开发成本和服务器资源,都是基于宽表层查询出业务数据)

11 搭建数据仓库(这里的数据仓库的搭建不是指 Hive ,Hive 是搭建数仓的工具,数仓搭建一般会分为三层 ODS、DW、DM 层,其中DW是最重要的,它又可以分为DWD,DWM,DWS,这个层级只是逻辑上的概念,类似于把表名按照层级区分开来的操作,分层的目的是防止开发数据应用的时候直接访问底层数据,可以减少资源,注意,减少资源开销是减少 内存 和 CPU 的开销,分层后磁盘占用会大大增加,磁盘不值钱所以没什么关系,分层可以使数据表的逻辑更加清晰,方便进一步的开发操作,如果分层没有做好会导致逻辑混乱,新来的员工难以接手业务,提高公司的运营成本,还有这个建数仓也分为建离线和实时的)

总之就是离不开写 SQL ...

一般的话大数据是负责公司互联网数据分析的一个职位,简单的说如购物网站上的根据你的浏览给你推荐一些商品,另外还有从海量的数据中分析出对公司发现有指引作用的信息等都是大数据需要做的,现在来说大数据需求非常大,很有发展前景


数据分析工程师都做什么工作?
1、任何技术类的岗位做得经验丰富,都不会太差,至少都是月薪过万+;2、大数据分析工程师,你得了解python,至少会写点脚本;其次也可以了解一些分析工具 如excel、tableau可视化分析工具、数据库(mysql)、如果需要更深入也可以了解一下大数据开发工具 hadoop、spark、hive、R、scala、java、云计算、机...

数据工程师是属于开发还是实施
数据工程师既有开发,也有实施部分。大数据工程师可以从事对大量数据的采集、清洗、分析、治理、挖掘,并对这些数据加以利用、管理、维护和服务的相关技术工作。大数据工程师是利用大数据技术处理大量数据的专业技术人员,大数据工程师专业技术水平等级培训考试分初级、中级、高级三个级别。2016年工信部印发《大...

数据挖掘工程师是干什么的
数据挖掘工程师是数据师(Datician['detn])的一种。是从大量的数据中通过算法搜索隐藏于其中知识的工程技术专业人员。这些知识可用使企业决策智能化,自动化,从而使企业提高工作效率,减少错误决策的可能性,以在激烈的竞争中处于不败之地。数据挖掘工程师的职责:1、根据自己对行业,以及公司业务的了解,...

数据库系统工程师是干什么的?
1、能参与应用信息系统的规划、设计、构建、运行和管理,能按照用户需求,设计、建立、运行、维护高质量的数据库和数据仓库;2、作为数据管理员管理信息系统中的数据资源,作为数据库管理员建立和维护核心数据库;3、担任数据库系统有关的技术支持,同时具备一定的网络结构设计及组网能力;4、具有工程师的...

数据库研发工程师是做什么的
数据库开发工程师是指设计、开发、维护管理大型数据库的专业人才,一般工作内容是:1、设计并优化数据库物理建设方案;2、制定数据库备份和恢复策略及工作流程与规范;3、在项目实施中,承担数据库的实施工作;4、针对数据库应用系统运行中出现的问题,提出解决方案;5、监督UNIX,Tandem,NT 等系统上数据库...

大数据是干嘛的?就业薪资咋样?
大数据工程师有不少细分方向,不同的方向需要具备不同的知识结构,通常情况下大数据工程师分为四个具体的工作领域,分别是大数据底层平台研发、大数据应用开发、大数据分析和大数据运维。大数据专业是做什么的?分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务:1、找出过去事...

所谓的大数据分析师到底是干什么的?
数据分析主要是做数据的收集、挖掘、清洗、分析,最后形成具有业务价值的分析报告. 大包括数据体量的大,也包括数据维度的广.大数据工程师是个很重要的工作,就是通过分析数据来找出过去事件的特征。通过引入关键因素,大数据工程师可以预测未来的消费趋势。在阿里妈妈的营销平台上,工程师正试图通过引入气象...

数据挖掘工程师一般都做什么?
数据挖掘工程师是做什么的?数据挖掘,从字面上理解,就是在数据中找到有用的东西,哪些东西有用就要看具体的业务目标了。最简单的就是统计应用了,比如电商数据,如淘宝统计过哪个省购买泳衣最多、哪个省的女生胸罩最大等,进一步,可以基于用户的浏览、点击、收藏、购买等行为推断用户的年龄、性别、购买...

大数据运营工程师是干什么的?
近年来随着互联网技术的发展,大数据运营工程师也随之火热起来,但是还有许多像题主这样还不了解这个职业到底是干什么的,今天在此为大家详细解答一下,希望对大家有所帮助!对于有些企业而言,数据运维工程师和DBA是比较接近的,但是DBA的涉及的知识面可能会更宽泛一些,有些DBA是做SQL开发、存储过程开发...

数据开发工程师(Java)是什么职位
岗位职责:- 负责贝壳找房平台大数据平台架构的规划、设计与实施- 参与建设、维护、优化基于实时技术的数据平台,为业务提供易用的数据工具和平台。- 关注开源技术动态。- 通过大数据平台和工具,支撑海量数据分析、数据挖掘、机器学习工作,提升贝壳找房平台线上产品效果与线下运营效率任职要求:- 丰富的Ja...

阜平县13619859074: 什么是大数据和大数据工程师 -
狐果济得: 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产 大数据工程师是根据大数据来的一种职业

阜平县13619859074: 大数据工程师做什么?需要具备什么能力 -
狐果济得: 一般的话大数据是负责公司互联网数据分析的一个职位,简单的说如购物网站上的根据你的浏览给你推荐一些商品,另外还有从海量的数据中分析出对公司发现有指引作用的信息等都是大数据需要做的,现在来说大数据需求非常大,很有发展前景

阜平县13619859074: 大数据工程师做什么?数据分析师需要具备什么能力 -
狐果济得: 、需要有应用数学、统计学、数量经济学专业本科或者工学硕士层次水平的数学知识背景. 2. 5、至少掌握一门数学软件:matalab,mathmatics进行新模型的构建、至少熟练SPSS、STATISTIC、Eviews; 4、SAS等数据分析软件中的一门. 3、至少能够用Acess等进行数据库开发、至少掌握一门编程语言; 6,当然还要其他应用领域方面的知识,比如市场营销

阜平县13619859074: 金融大数据工程师是做啥的?学了有什么用? -
狐果济得: 大数据工程师是利用现代分析方法,结合互联网技术手段进行大数据模型的构建和应用.学了后可以提升在职工作人员的岗位能力,从而升职加薪.同时也是企业面试时对应聘者考核、聘用、任用的标准.

阜平县13619859074: 如何成为一个大数据开发工程师 -
狐果济得: 大数据工程师有多种解释,一种是用大数据的,就是data scientist这种. 1.建立数据平台、2. 实现产品中依赖数据的部分、3.通过数据对具体问题进行调查分析、4.建立模型支持公司的决策.每一个Data Scientist都有不同的侧重点,但平均来说...

阜平县13619859074: 大数据开发工程师以后可以从事哪些岗位? -
狐果济得: 大数据开发工程师,其实包括的具体的岗位很多,包括:大数据开发工程师、大数据架构工程师、大数据运维工程师、数据可视化工程师、数据采集工程师、数据挖掘工程师、机器学习工程师、深度学习工程师、算法工程师等等,都可以算是大数据开发工程师的范畴.

阜平县13619859074: 大数据都有哪些就业方向?
狐果济得: 1、大数据系统研发工程师这一专业人才负责大数据系统研发,包括大规模非结构化数据业务模型构建、大数据存储、数据库构设、优化数据库构架、解决数据库中心设计等,同时,还要负责数据集群的日常运作和系统的监测等,这一类人才是...

阜平县13619859074: 金融大数据工程师是做什么的,求解答
狐果济得: 一句话说金融大数据工程师就是利用现代分析方法结合互联网技术手段进行数据分析和大数据模型的构建.随着互联网行业的深入发展,海量数据不断汇集,大数据时代随之到来,以互联网金融为代表的新金融业给数据深度分析带来了新的挑战.现代分析方法的出现,结合互联网技术手段的新型数据分析方式为大数据模型的构建和应用提供了新的途径.我第一次听说,有啥作用啊?

阜平县13619859074: 大数据有哪些职位和工作机会? -
狐果济得: 大数据主要有以下职位: 1)数据架构师Data architect:对Hadoop解决方案的整个生命周期进行引导,包括需求分析,平台选择,技术架构设计,应用设计和开发,测试和部署.深入掌握如何编写MapReduce的作业及作业流的管理完成对数据...

阜平县13619859074: 大数据工程师属于互联网吗?
狐果济得: 应该算是吧

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网