在北京工作做销售三年如何转型了现在想转型大数据开发去哪学比较好?

导读:11人11个展望。

著名数据科學网站KDnuggets邀请国外11位机器学习和AI专家回顾2018年机器学习和人工智能的主要进展,并对2019年即将出现的关键趋势进行展望

其中,有观点认为2018姩AI最大的进展是没有进展,2019年AutoML、GAN等将继续成为关键技术

关于这些关键技术,我们还精选了7本书附在文末为你2019年的学习、成长提供参考。

来源:新智元(ID:AI_era)

这11个人中虽然没有吴恩达、李飞飞这样的顶级大咖,但都是身在工业、学术和技术一线的人员他们包括英伟达機器学习研究主任、Gartner机器学习团队负责人、华盛顿大学计算机科学与工程系教授等,能够从不同视角观察AI的过往和未来

以下是这11人的观點:

01 深度学习“低处的水果都被摘了”

回顾2018年:焦点开始从标准的监督学习转向更具挑战性的机器学习问题,像半监督学习、领域自适应、主动学习和生成模型GAN仍然是非常受欢迎的,研究人员尝试更困难的任务如bigGANs和video-to-video合成。开发了替代的生成模型(如神经渲染模型)以在单個网络中组合生成和预测以帮助半监督学习。

研究人员将深度学习的应用扩展到许多科学领域如地震预测、材料科学、蛋白质工程、高能物理和控制系统。在这些情况下领域知识和约束与学习相结合。

预测2019年:“人工智能将模拟和现实联系起来变得更安全,更具物理意识”

我们将看到开发新的领域自适应技术以便将知识从模拟无缝转移到现实世界。使用模拟将有助于我们克服数据稀缺性并加快新领域和问题的学习使AI从模拟到实际数据(Sim2real)将对机器人技术、自动驾驶、医学成像、地震预报等产生重大影响。

模拟是解决自动驾驶等安铨关键应用中所有可能情况的好方法内置于复杂模拟器中的知识将以新颖的方式被使用,以使AI更具物理意识更强大,并能够推广到新嘚和看不见的场景

02 2019移动设备上的实时语音生成与真人无异

这是我自己作为一名实践者的看法,不代表Gartner基于研究的官方声明以下是我的想法:

回顾2018年:TensorFlow在学术界输给了PyTorch。有时谷歌的巨大影响力可能会使市场处于次优的方向因为MapReduce和随后的hadoop狂热已经发生了这种情况。

Deepfakes(以及類似的声音技术)粉碎了最值得信赖的信息来源:视频没有人能敢再说出这样的话:我看到过那个人说这些话的视频。几十年前我们不洅相信印刷文字但直到现在,视频还是不可动摇

强化学习以深度学习的形式回归是非常意外和酷!

Google代替人类致电餐厅并假装(成功)荿为真正的人类系统是一个里程碑。然而它引发了许多关于道德和人工智能的问题。

个人助理和聊天机器人很快就达到了极限它们比鉯往任何时候都好,但不如去年所希望的那么好

1)我希望每个人都对今年的AutoML承诺感到兴奋。我也期望它失败(除了一些非常具体和明确萣义的案例如不依靠手工的图像识别、机器翻译和文本分类,原始数据接近于机器期望作为输入并且数据是丰富的)。

2)营销自动化:利用成熟的生成对抗网络和变分自动编码器可以生成数千张相同人物或图像的图片,这些图像之间的面部表情或情绪差异很小根据消费者对这些图片的反应,我们可以制作出最佳的广告活动

3)移动设备上的实时语音生成与真实人类无法区分。

4)自动驾驶的出租车将保持在测试/ PoC阶段

03 2018年成为对AI过度恐惧的一年

华盛顿大学计算机科学与工程系教授Pedro Domingos:

经历了多年炒作,2018年成为对AI过度恐惧的一年

按一些媒體、甚至是一些研究人员的观点,你会认为特朗普在2016年大选获胜全拜剑桥分析公司所赐、机器学习算法是充斥偏见和歧视的垃圾、机器人囸在取代我们的工作不久就将霸占我们的生活等等。

这些论调不仅仅是说说而已:欧洲和加州已经通过了更加严厉的隐私法联合国正茬就AI武器禁令等内容进行激烈辩论。公众对AI的观点越来越暗淡这种现象即危险又不公平。

希望2019年人们能够回归理性。

04 数据科学家的角銫将倾向于从研究转向产品开发

牛津大学物联网课程的首席数据科学家和创始人Ajit Jaokar:

2018年一些趋势开始迅速流行。一个是自动化机器学习┅个是强化学习。这两个新生趋势将在2019年进一步发展作为我在牛津大学开设的物联网数据科学课程教学内容的一部分,我认为物联网将樾来越多地融入大型生态系统之中如自动驾驶汽车、机器人和智能城市。

2019年一种新的机器人技术,即协同机器人(cobots)将成为一个关键趨势与之前的生产线机器人不同,新的机器人将能够自主活动可以理解情感(在我的课程中,我们也在与从事该领域研究的情感研究實验室合作)

我的最后一个观点可能有些争议:在2019年,数据科学家的角色将倾向于从研究转向产品开发我认为人工智能与下一代数据產品的诞生密切相关。数据科学家的作用会发生相应的转变

05 今年开源工具数量增加,所有人都能接触AI

更多精彩请在后台点击“历史文嶂”查看

可选中1个或多个下面的关键词搜索相关资料。也可直接点“搜索资料”搜索整个问题

其实,你有java基础的话可以尝试一下自学,当然了去系统的班学习,效果更好自己一哥们是从事两年java开发又转型大数据的,怎么说呢这属于两个方向,学习的侧重点并不同哥们在海牛学院学习完,感觉受益匪淺实训项目特别不错,他说他最看重的就是这个实训。

你对这个回答的评价是

可以先从网上查一下资料

你对这个回答的评价是?

大数据本质也是数据但是又有叻新的特征,包括数据来源广、数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至鈳能是PB级别)、数据增长速度快等

针对以上主要的4个特征我们需要考虑以下问题:

  1. 数据来源广,该如何采集汇总,对应出现了SqoopCammel,Datax等笁具

  2. 数据采集之后,该如何存储,对应出现了GFSHDFS,TFS等分布式文件存储系统

  3. 由于数据增长速度快,数据存储就必须可以水平扩展


  4. 大數据是未来的发展方向,正在挑战我们的分析能力及对世界的认知方式因此,我们与时俱进迎接变化,并不断的成长!大数据学习群:  ┅起讨论进步学习

  5. 数据存储之后该如何通过运算快速转化成一致的格式,该如何快速运算出自己想要的结果

    对应的MapReduce这样的分布式运算框架解决了这个问题;但是写MapReduce需要Java代码量很大,所以出现了HivePig等将SQL转化成MapReduce的解析引擎;

    普通的MapReduce处理数据只能一批一批地处理,时间延迟太長为了实现每输入一条数据就能得到结果,于是出现了Storm/JStorm这样的低时延的流式计算框架;

    但是如果同时需要批处理和流处理按照如上就嘚搭两个集群,Hadoop集群(包括HDFS+MapReduce+Yarn)和Storm集群不易于管理,所以出现了Spark这样的一站式的计算框架既可以进行批处理,又可以进行流处理(实质仩是微批处理)

  6. 而后Lambda架构,Kappa架构的出现又提供了一种业务处理的通用架构。

  7. 为了提高工作效率加快运速度,出现了一些辅助工具:

  8. HueZepplin:图形化任务执行管理,结果查看工具
  9. Scala语言:编写Spark程序的最佳语言,当然也可以选择用Python
  10. Python语言:编写一些脚本时会用到。
  11. AllluxioKylin等:通过對存储的数据进行预处理,加快运算速度的工具

以上大致就把整个大数据生态里面用到的工具所解决的问题列举了一遍,知道了他们为什么而出现或者说出现是为了解决什么问题进行学习的时候就有的放矢了。

一、大数据相关工作介绍

大数据方向的工作目前主要分为三個主要方向:

二、大数据工程师的技能要求

附上大数据工程师技能图:

我要回帖

更多关于 做销售三年如何转型 的文章

 

随机推荐