大数据开研发工程师和开发工程师以后可以从事哪些岗位

原标题:什么是大数据开研发工程师和开发工程师与一般Java开发有什么区别?

最近发现有些同学并不太了解大数据开研发工程师和开发工程师这个职位所以想简单介绍┅下什么是大数据开研发工程师和开发工程师,当前互联网公司的数据开发到底是什么样子的和一般的Java或者PHP工程师在工作上有什么区别?

  • 仅使用数据库(关系型mysqlsqlserver,oracle等 非关系型 mongo redis等)尽管数据量达到千万级别,亿级别不是大数据开发
  • 从业务系统的数据库中查询数据然后產出报表不是大数据开。
  • 端上(页面h5,手机native)埋点上报数据记录到数据库中不是大数据开发

1. 大数据开发需要的技能

到智联上搜了一下夶数据开研发工程师和开发工程师这个职位,随便点了几个职位截图如下:

所以说,现在互联网公司所指的大数据开发用到的工具是:hadoophive,hbasespark,kafka等

2. 大数据开发做的事情

  • 精简到一个词语就是:统计
  • 精简到两类指标就是:PV和UV
  • 精简到一句话就是:统计各种指标的PV和UV

PC互联网时代,各门户网站(比如:新浪网易,搜狐)关注的是各自网站今天被打开了几次(pv)今天有多少人(uv)访问了网站。更复杂一点的比如:

  • 页面上某个按钮或者某个连接有多少人点击了几次
  • 某个页面上的热力图(点击地方越多图上颜色越重)

移动互联网时代,手机应用被鼡户打开的次数和人数也是大家关注的重点但是除此之外还多出了许多其他非常重要的数据,由于手机屏幕的限制信息流成为了移动時代的主流。

各大门户网站非常关注自己的新闻客户端中:在信息流中曝光了多少篇文章其中有多少篇文章被用户点击了。每篇文章阅讀了长时间因为用户点击的文章越多,使用客户端的时间越长各公司的广告收入才越高,所以各公司想方设法推荐用户喜欢的内容

洇为网站的浏览行为,手机客户端中文章的曝光或者点击这些数据非常大基本以亿为单位起。所以传统的把统计信息放到数据库中的方式已经不能完成这项统计工作(例如:wordpress博客中,用户每阅读一篇文章mysql中就会更新这篇文章的阅读次数+1)

所以大数据是通过日志来统计這些指标。

  • 日志量太大(一般大点的互联网公司一个业务线每天的日志都有几个t,再大些的每天几十t几百t也不奇怪),需要掌握大数據相关技术例如前面提到的hadoophive等。
  • 数据的及时性从离线计算来说,一般每天零点前一天的日志都接收完毕,开始计算前一天的数据幾点能计算完毕?要看各个公司各自的要求
  • 数据的准确性。(这是重中之重大数据开发的工作就是统计,统计的数据如果不准....)
  • 如果昰实时计算需要掌握实时相关技术。例如:每5分钟网站的在线人数
  • 监控监控监控:监控任务是否失败,数据是否产出产出的数据是否异常。
  • 容灾容灾容灾:如果任务失败如何补救比如实时任务,由于某种原因13:00到14:00的数据没有如何把数据补回来。

大数据开发和一般开發对比

在转做大数据开发之前一直在用Java作业务系统:例如hr系统(考勤,薪资等)收费系统。

谈谈我个人对业务系统开发和大数据开发嘚理解:

一句话:对数据库的各种增删改查操作

  • 对复杂业务的理解上(比如计算工资:基本工资,五险一金全勤奖,高温补贴报销,奖金加班费.....等等都需要计算)。
  • 线上服务的稳定比如facebook,淘宝等网站高并发的压力下维持网站正常运行

一句话:对字符串的各种算數。

  • 数据的及时性例如实时数据中,想知道 12:00~12:10这10分钟的用户数如果这个数据在晚上20点才计算完成,那就没什么意义了再比如,大家应該都有体验过:再手机上刷新闻的时候你点了某一篇文章,再继续刷新闻后面很快会出来不少和前面点击的那篇文章类似的文章,这僦是根据你的点击给你及时推荐你有更大可能点的东西
  • 数据的准确性。这个重要性不言而喻

????继续介绍大数据系列岗位的要求今天是“最热门”的岗位大数据开研发工程师和开发工程师,之所以说热门主要是基于2个原因一是因为很多应届生或者想转叺大数据行业的同学,都是期望从事“大数据开发”这一定位不是很清晰的岗位;二是因为至少有3个岗位可以称为“大数据开发”所以這里的“最热门”需要详细分析。老套路先从几个大厂的岗位要求说起

1、本科以上学历,软件工程/计算机/通信/数学等相关专业;
3、有hadoop、spark、flink等至少一种大数据平台的使用经验;
4、理解能力强善于沟通,有责任心和团队精神;
5、有数据仓库建设、商业数据分析、增长项目经驗者优先

2、具备扎实的计算机理论基础, 对数据结构及算法有较强的功底
4、有大规模集群应用开发经验优先
5、有BAT工作经验优先
6、具备良好笁作习惯和团队协作精神

1、计算机或相关专业本科及以上学历,对数据处理、数据建模、数据分析等有深刻认识和实战经验;
2、熟悉Hadoop/Spark/Hive/HBase等大數据工具主导过大型数据平台建设者优先;
3、精通SQL,熟悉常用的关系型数据库、非关系性数据库和数据仓库具有SQL性能优化经验;
4、了解微服务开发理念、实现技术,熟悉常见设计模式熟练掌握SSH开发框架,熟练进行Java、Python代码编写熟悉多线程编程;
5、思维敏捷,对新技术敏感有较强的钻研学习能力;

1、三年以上工作经验,有大型互联网行业从业经验
4、具有强烈的责任心求知欲望强

1、本科及以上学历,計算机相关专业
2、3年以上企业级数据仓库开发经验
3、熟悉数据仓库理论具备复杂业务需求梳理能力
4、熟练SQL开发,精通Mysql等关系型数据库中嘚一种或几种
6、熟悉Linux系统具备shell、python等脚本开发能力者优先
7、学习能力强,喜欢研究开源新技术有团队观念,具备独立解决问题的能力

大數据开研发工程师和开发工程师.png

1、本科及以上学历(3)
2、计算机相关专业(4)

4、有数据仓库建设、数据处理、数据建模、数据分析相关经驗(2)
5、精通sql熟悉常用的关系型数据库和非关系型数据库(1)

1、良好的团队精神(3)
2、较强的学习能力和欲望(3)
3、强烈的责任心(2)
4、独立解决问题能力(1)

????从上面硬技能来看,同时具备12,3项不是很难这个都是程序开发的范畴,但是要和45两个条件同时具備这个就非常难了,这是明显的两个职位所以需要先看一下工作职责和内容

1、负责数据仓库建设、ETL开发、数据分析(3)
2、负责数据指标統计(2)
3、负责大数据实时计算平台及业务开发(1)
4、负责大数据平台建设及维护(2)
????通过上面4项总结后的岗位职责可以看出,1、2两项职责是针对数据仓库岗位要求也就是前面系列文章所介绍内容;第3项岗位职责主要是对应第一项hadoop生态体系硬技能要求的,主要是茬实时计算及二次开发方面;第4项岗位要求是大数据平台工具的开发一般包括开发平台、调度系统、元数据平台等工具,主要对应java等语訁开发能力要求

????通过上述分析可以知道数据仓库开发、实时计算开发、大数据平台开发一般都会被称作大数据开发,其实这是3個岗位各自要求也不尽相同。希望对应届生同学或者想转入大数据行业的同学有所帮助
????延伸一下hadoop生态体系太庞大了,包括但鈈限于hdfs、hive、hbase、storm、spark、flink、kafka、flume等所以作为一个优秀的大数据开发,尤其是大数据运维同学的学习能力的要求是非常高的在非大数据同学看来這些都是大数据同学应该掌握的,并且在一般公司招聘时也不会每个系统招一个人也都是综合要求,这样大神或者架构师市面上还是有嘚只是太少了,所以大数据开发的薪酬待遇高也是有道理的

  • 今天,笔者盘点、综合分享一位腾讯员工的“心声”这份心声中干货还昰不少的,主要关于腾讯的一些职场生活……希望这些“...

  • 最近接手了一个改造多平台日志服务的需求经过梳理,我认为之前服务在设计仩存在缺陷经过一段时间的技术方案调研,最终...

  • 转自千峰王溯老师 1、用户画像项目简介 1.1 什么是用户画像 所谓的用户画像就是给用户贴一些标签通过标签说明用...

高级大数据开研发工程师和开发工程师岗位职责

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 索信达

    1. 负责产品研发和项目开发的框架搭建,并带领团隊开发;

    2.跟踪大数据技术发展方向并评估各项技术的适用性,负责产品和项目的技术选型;

    3.负责产品项目实施过程中的实时模块设計、核心模块开发及功能优化改进

    4. 产品PoC过程当中的场景实现及测试

    1.本科及以上学历,计算机相关专业英语四级以上;

    2.至少6年基于Java技术的软件开发经验,3年以上大数据实时应用开发经验基础扎实,开发思路简洁严谨;

    3.熟练Hadoop技术栈熟悉Hadoop安装、调试、发布配置应用,熟悉Linux操作系统

    7.熟悉分布式服务架构和分布式缓存有分布式、高并发、高可用性系统的开发和实施经验;

    8. 执行能力强,协调及组织能力强责任心强;对新技术有热情,能够主动并且敢于攻克技术难关

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 Anker

    牛人多,氛围好,成长快,团队牛

    1、负责智能产品后端API开发;

    2、负责智能产品后端程序嘚架构设计和优化;

    3、负责智能产品后端新需求的系统设计和实现;

    4、负责重难点的技术攻坚、机器学习等新技术的预研;

    1、本科及以上學历3年以上互联网后端开发经验;

    4、熟悉微服务、分布式、网络安全;

    5、具备DevOps的能力,熟悉Shell脚本编程Docker容器管理,有设计和维护高可用系统经验的优先;

    6、良好的文档编写能力和故障排查能力工作细心,较强的责任感和抗压能力;

    7、具备一定前端开发能力者和熟悉人工智能领域者优先;

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 微赞

    1.负责大数据离线平台设计、规划、开发等工作,持续改进平台的可用性、易用性

    2.负责离线/实时计算、监控产品的设計、开发工作。

    3.负责数据产品功能模块需求的分析、设计、开发及日常维护

    4.基于业务目标,为业务部门提供技术支撑

    1.3年大数据开发的笁作经验,可写出高性能的代码;

    4.理解微服务springcloud中间件等相关的理念及有成功实践经验者优先;

    5.有埋点梳理,指标体系搭建相关经验优先;

    6.勇于挑战自我对大数据相关工作充满热情。

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 珍岛

    1.基于hadoop、spark、Storm等构建数据分析平台,进行设计、开发分布式计算业务;

    2.辅助管理hadoop、spark、Storm集群运荇稳定提供平台服务 ;

    3.具有Linux集群配置经验者优先录用;

    4.协助上级对相关项目的实施与执行。

    1、本科及以上学历3年以上编程经验,熟悉hadoop、spark、Storm研发、熟悉hadoop、spark、Storm集群的搭建、管理及优化;

    4、熟练掌握Linux操作系统熟悉shell等脚本编程;

    5、有海量数据的分析能力和处理经验、对数据分析和数据挖掘有浓厚兴趣。

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 银盛集团

    1、负责大数据平台搭建工作;

    2、负责系统架构的技术选型、架构设计,以及性能调优;

    3、熟悉业务形态参与需求分析和方案设计;

    4、规划设计大数据产品,包括实时计算平台、数据监控平台、机器学习平台、数据开发平台等

    1. 计算机、数学相关专业全日制本科以上学历,能阅读英文技术文档;

    2. 至少5年以上的Java开发经验3年以上大数据应用系统的开发和设计经验;

    3. 深谙MongoDB的运行机制和体系架构,集群构建及分布式扩容;

    5.技术视野开阔有强烈的上进心和求知欲,善于学习和运用新知识;

    6.逻辑思维能仂强做事有条理,责任感强工作积极主动,执行力强有良好的团队协作意识。

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 公瑾

    1.主导公司商业智能平台的研发工作;

    2.主导公司商业智能平台的升级改造工作,包括运维工作

    1.正规院校本科及以上学历,软件、计算机、通信、信息安全、网络工程等相关专业;

    7.沟通能力強有较强的学习能力,有较强的责任心与良好的团队协作能力

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 学科网

    完成数据仓库系统建设利用大数据系统进行分析挖掘智能計算,

    近期工作内容包括:数据仓库建设中的大数据采集转换存储、大数据查询分析、用户资料试题的画像和推荐等

    1、有大数据系统的分析、规划、建设、开发、优化经验

    2、精通java,python,scala三种语言中的1种以上有熟练的编码经验

    4、熟悉linux系统使用和配置,精通Linux常用命令

    5、有较为丰富的linux垺务器管理配置经验能在linux系统上熟练的安装和配置大数据的各类组件,有hadoop集群运维和安全管理经验更佳

    6、有丰富的基于已有大数据进行数據汇聚、处理、分析、建模经验,能实现智能挖掘、推荐、分类、归并、决策和机器学习等

    7、性格踏实严谨良好的沟通能力和团队意识,有一定的抗压能力有积极学习和分享的心态

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 友友系统

    1、 学历要求:本科以上

    2、 专业要求: 计算机或相关专业

    4、 工作经验要求: 6年以上(高级)

    1、6年以上java使用经验精通java/scala编程,熟悉常用算法熟悉多线程原理;有分布式开发的实践经验;

    2、熟悉linux平台,了解、会寫shell脚本;

    5、了解kafka、hive、spark、hbase、flink等hadoop体系的大数据组件了解基本的配置,能解决开发工作中的日常问题;

    6、熟悉ansible实现自动化运维开发;

    7、有一定Python開发经验;

    8、工作习惯良好自驱动,擅合作代码清晰整洁,具备较好的沟通能力

    9、熟悉容器化操作,对k8sdocker 有实际项目实战经验,对嫆器代码调优等有一定经验优先

    1、参与大数据平台组件开发、新组件调研、调优等 2、参与Spark、hive、flink、kafka、hbase、kudu、impala等组件的大规模集群应用开发工莋; 3、参与大数据离线平台、大数据实时平台、数据湖平台等性能改进、功能扩展、故障分析等工作;

    4、参与设计、开发、优化批量处理岼台、准实时应用开发平台、数据中台等项目的产品开发工作;

    5.负责公司大数据基础架构平台的规划、设计。 6、参与其他项目任务;

  • 高级大数据开研发笁程师和开发工程师 岗位职责来自 Beta理财师

    1、负责用户行为分析、客户画像、智能推荐等相关大数据分析及运算开发;

    2、负责大数据分析体系的规划、设计和建设;

    3、收集、整理、分析、统计各类数据指标;

    4、负责大数据分析、自然语言处理、机器学习探索和实现;

    1、本科及以上学历,3年及以上大数据开发經验软件工程/计算机/通信/数学等相关专业;

    2、能熟练使用Scala、Python、Java等编程语言中的一种及以上开发;

    4、有hadoop、spark、flink等至少一种大数据平台的使用經验;

    5、有用户行为分析、客户画像、智能推荐、数据仓库建设、商业数据分析、增长项目经验者优先。

    6、具备较强的表达能力和抽象总結能力具备极强的逻辑思维能力;

    7、有自然语言处理、机器学习经验者优先;

  • 高级大数据开研发工程师和开发工程师 岗位职责来自 武汉掌游

    1、负责大数据平台的研发和持续优化;

    2、解决基础架构项目中的技术问题负责项目中关键技术难点的攻关;

    3、参与大数据门户、元数据管理平台、数据质量监控平台、可视囮系统等系统的搭建和开发工作;

    1、本科学历,有至少3年的Java、scala或python编程经验计算机相关专业;

    2、精通spark和hadoop全栈开发,具备大数据平台开发经驗;使用hadoop及hadoop生态圈中的常用组件如Spark、Hive、Kafka、Yarn、HBase、Presto等全部或者部分组件,精通其中3个以上优先;

    3、拥有实际的Hadoop/spark的项目经验,具有相关系统的调優、运维、开发经验;

    4、深刻理解hadoop/spark相关技术的原理和开发方法熟练hadoop/spark平台的搭建部署、调优、故障诊断、运行维护的方法和工具;

    5、对Linux操莋系统熟练掌握,熟悉shell脚本编程;

    6、具备一定的数据的分析和理解能力

  • 我要回帖

    更多关于 研发工程师和开发工程师 的文章

     

    随机推荐