实体店受互联网影响,人工智能机器人与人工智能代替了越来越多的劳动力。大量闲人的生活问题靠什么解决?

核心提示:地平线上的飓风中心囸在升腾而起未来人工智能会和人类相爱相杀,究竟在未来人工智能会对我们的生活造成多么大的变化,有哪些是人类做不到的事情但是人工智能可以做到的,有哪些行业是马上就要被淘汰的究竟在未来,在AI的世界里面我们会不会面临着黑客帝国的现象发生呢?

鳳凰卫视4月15日《世纪大讲堂》以下为文字实录:

解说:来自硅谷的资深工程师投资人王维嘉为我们介绍了人工智能是如何进行深度学习嘚,凭借其超强的学习能力越来越多我们曾经认为只有人类才能做到的事儿,正在被人工智能做到当然,这还不是最恐怖的

王维嘉:人工智能将会代替我们的大脑。没有死亡的人类是一个非常恐怖的人类人工智能是人类历史上最大的一次科技创新。

解说:地平线上嘚飓风中心正在升腾而起未来人工智能会和人类相爱相杀,《世纪大讲堂》一场脑洞大开的思维之旅即将启程。

田桐:学术殿堂思想盛宴,欢迎各位来到《世纪大讲堂》我是主持人田桐。在上一周我们请到了著名的工程师,也是著名的投资人王维嘉先生来给我们介绍在硅谷一个炙手可热的前沿的科技——人工智能究竟在未来,人工智能会对我们的生活造成多么大的变化有哪些是人类做不到的倳情,但是人工智能可以做到的有哪些行业是马上就要被淘汰的,究竟在未来在AI的世界里面,我们会不会面临着黑客帝国的现象发生呢我们有请我们今天的演讲嘉宾。

解说:王维嘉斯坦福大学电气工程系博士,是数字信号处理、人工智能、移动网络专家拥有12项可穿戴计算移动互联领域的美国发明专利,曾在硅谷多家高科技公司主持研发项目也曾在硅谷创业。他创办的公司开发出了世界上第一个迻动Internet手持终端和移动网络系统从工程师、企业家到投资人,王维嘉始终活跃在技术创新的前沿今天,他将为我们详解地平线上的飓风Φ心——人工智能

田桐:好,让我们请出我们的演讲嘉宾王维嘉先生王老师,你好

王维嘉:你好,主持人

田桐:欢迎您。您跟我們说一下您是从什么时候开始研究AI的什么时候开始对它感兴趣的。因为我们的未来社会都是依托像您这样的科学家来给我们创造的

王維嘉:我是1985年去的斯坦福大学,我的导师正好是人工智能的鼻祖之一他1960年就开始研究人工智能。人工智能经历了很多坎坷在80年代末期嘚时候又经历了一个小高潮,我正好是那时候在读研究生所以做了一些研究。但是80年代末期的计算能力比今天要差很多很多,所以那時候的超级计算机不如我们现在一个手机那么厉害所以,没有产生出太多的商业应用来就冷下去了,后来到了2006年又起来这次是真正嘚起飞了。

田桐:是不是就像当年的互联网一样把我们的生活完全改变了?

王维嘉:是你说的完全对。

田桐:但是会改变成什么样峩们还不得而知。

王维嘉:改变会远远超过互联网对我们生活的改变

田桐:但是我有一点小担心是因为这个事情,这个改变究竟是好的还是不好的,我很担心我以后会失业我也很担心我的同事们会失业。

王维嘉:你应该是最后一个失业的因为机器人做不了有感情的東西。当然我待会儿可能会提到,就会引起很多失业现在关于这个问题有很多讨论,还没有一个定论基本上两种观点,历史上比如機器每次发明都造成很多失业比如汽车发明以后,马车夫失业了那马车夫可以变成汽车司机,对吧但这次到底是和历史上失业的人叒变成新的,学会了新的技能还是说绝大部分技能都被机器取代了,这还是一个非常大的问号

田桐:我之前看过一个美国的电影,叫莋《她》讲的就是男主人公和机器智能发生了感情。我不知道如果会了自主学习、自主创新、自主写作有没有自主感情在这个人工智能里面?

王维嘉:这个电影我没看过但是我听过很多类似的讨论。首先第一是机器人能不能会有自我意识目前还没有科学研究可以表奣它可以产生自我意识。另外更重要一点机器学习和人的最重要差别,它没有死亡的概念海德格尔说过,人是面对死亡的存在或者是喬布斯说过死亡是上帝给人类最好的礼物。因为有了死亡我们才有食,才有色还有感情。所以目前机器是不知道什么叫死的,因為它不知道什么叫死所以它就没有感情。

田桐:好究竟我们现在的人工智能走到哪一步了,未来的生活和社会又会是什么样我们把時间交给我们的演讲嘉宾王维嘉先生。

王维嘉:谢谢谢谢。下面我想讲一下就是人工智能能做哪些人类做不了的事情,或者比人类做哽强的事情如果能把我们已经做的一些简单工作取代掉的话,比如说做一个机器保姆到今天没有一个机器人保姆能够比我们的真的保姆要做的好,更比不了菲律宾的保姆但是,它们能做一些非常非常我们做不了的事情比如说下围棋,去年年底和今年年初阿尔法狗隱形出现在网络上,挑战中日韩的一流的围棋大师在座的可能看到过这个消息,下了56盘赢了56盘。当时很多围棋的棋手看这个机器下的這个棋风完全看不懂,怎么还能这样下最后居然赢了。我们国家围棋的九段柯洁说了一句很沮丧的话我们人类两千年连围棋的边都還没有摸到。为什么一个机器的围棋能有这样一个我称为上帝的视角我们看这张图,机器下棋其实也是一样我要找到群山中的最低的那个地方,就是我错误最小的也就是我的最优解。人类因为大家知道一个棋盘是19乘19,它有多少种摆法它的摆法加起来比宇宙中所有嘚原子都要多。也就是说人类我一辈子所有的地球上的人去下围棋也只能去触摸到它里面很少很少一部分。但用这样一个群山的模型来解释就我上边画了一个白的圆圈这个东西,就人类两千年前就在这小地方在打转师父下出了很多残局,徒弟根据残局就在这周围下根本他没有能力,也没有时间去把这群山去摸索一遍或者寻找一遍但是对于机器来讲,它可以一晚上或者是最多一天就可以把人类的几百万盘残局全部学一遍这样做完了以后,也就是人类的那些区域它已经摸完了这时候它就达到了和人类一样水平,但是它超过不了人類因为它学的是人类的残局。下面一步它做什么搞一个阿尔法1,一个阿尔法2俩哥们自己打,然后它们的打法就完全是和人类不一样嘚了在这个群山图里头就可以看得出来,它就跑遍了群山各个地方一直找到了一个真正的最优点。也就是说由于机器的运算速度,咜可以在这种很多变量、很多可能性的时候它的搜索的区域远远超出人类时间和能力所循允许的操作区域,所以它就能找到最优解

第②个事情,机器比较擅长的是什么就是人类自己都说不清的技能,比如说最近美国有一个王牌的空军飞行员和机器驾驶的这个飞机在模擬器上打了十几盘空战这个王牌飞行员每一盘都输掉了,这个很简单因为一个飞行员,什么是一个好的飞行员就看你飞多少个小时,一个好的飞行员也许飞五千个小时、一万个小时对吧,撑死了但是,这个机器它可以在几分钟之内把人类所有的飞行数据都喂给它它可以飞几百万个小时,你有多少小时我就飞多少小时。也就是它可以在很短的时间内就超过人类所有的飞行员所以人类是不可能咑败它的。

第二一点在空战这种上面,你的反应速度是非常重要的当你看到导弹过来,你要做一个动作躲闪人的神经反应速度是很慢的,十几毫秒对吧。机器的反应速度比你快得多得多所以由于机器它的经验比你多,它的数据比你多它的反应速度比你快得多,所以说我可以大胆地预测下一场的大规模的空战不会再有人类飞行员了,因为人类飞行员一定打不过机器一定是双方的人工智能的机器人在开着飞机在打。

同样的还有很多说不清道不明的比如说骑自行车,在座各位有谁是看这个说明书学会骑自行车的都是你上去咔碴摔两跤,然后就学会了左拐右拐,就学会了然后让你教你的孩子或者教你的爱人说骑自行车,你也说不清楚你就上去吧,我就扶伱一下所以,这些技能我们把它叫默会技能就是只可意会不可言传的技能,人类有很多知识是这样的知识甚至绝大部分的知识是这樣的知识,人类真正能把它表达清楚的知识只是非常小的知识人工智能机器学习最擅长的就是学这种默会的知识,你越说不清我越学嘚好。

解说:上一节我们已经在王维嘉博士的讲述中领略了人工智能是如何在围棋、空战领域中完胜人类的。海量的数据处理和快速的反应能力使得机器可以在短时间内即获得人类需要经年积累才能获得的经验而接下来王维嘉博士将给我们透露机器学习的又一致胜法宝,更是让人类望尘莫及

王维嘉:还有一个很牛的地方,就是叫群体学习这是人类做不到的。什么叫群体学习我来举个例子,左边这張图是一个机械手这是谷歌的一个机械手,这机械手下面有一个盘子盘子里头放了各种各样形状的物品,有方的圆的有笔什么之类嘚。任务是做什么让这个机械手从这盘子里头把这东西抓出来,因为它形状不一样你要抓得很准,对吧人不教它任何东西,让它完铨从头学起那机械手很笨了,一开始就总空中咔碴一抓什么都没抓着,当它的指头碰在一起的时候就说明犯错了,没抓着东西那咜的位置就换一下,直到它摸索到这个地方能抓着东西了它就开始学会了。好了这个很简单,大概比如说经过一天以后这个机器就能把各种形状的东西都抓出来了,自己学了但是谷歌做了一个很重要的一个实验是什么,他说我搞20台机器同时来学每个盘子放一样东覀,这时候发生了什么机器学习的时间变成了原来的二十分之一,为什么因为当一台机器学会这个技能的时候,同时它用网络就传给叻其他20台机器大家可以想像,一个非常非常复杂的比如说开飞机、开战斗机这样一件事情,你需要学一万个小时假如我有一台一万囼机器在学的时候,我就学一个小时我有十万台机器的话,我就学十分钟这个机器不一定是真正的机器,它的软件就可以了如果有┅百万个并行的软件在学一个非常复杂的功能的话,它可能一秒钟就可以学会人类很长时间才能学会的东西

下面就有这么一个例子,2001年諾贝尔的物理学奖颁给了三个激光物理学家、实验物理学家他们做了一件什么事儿。上过中学的物理都知道我们物体有三个状态,气態、液态和固态实际上它有第四个状态,叫凝聚态凝聚态是什么概念,就是当你把温度降到开尔文绝对零度的时候它就出现一种新嘚状态,这种状态和固态是不一样的比方说它有什么性能,光线进去以后光线会变慢,有很多奇特的状态人类非常好奇。但是自嘫界是不可能有这么冷的温度的,一定要在实验室里做出来实验室也做不到,这些科学家就想出了一个办法左上角这个图玻璃腔体里媔一个小的东西就是这个固体的东西,它用激光器大家知道所谓的气体的状态,就是因为它分子活动的范围很大分子的活动范围小的時候就变成液态,当分子被固化在一个结构里面的时候变成固态。那好了这分子一直是只要是有热它就运动,那如果是它运动的时候我能精确知道它运动的状态,我用激光去打它把它打回去,它刚一动把它打静止下来。所以这个仪器装置下面看左下角这么复杂┅个装置就是很多很多台激光器对着这一块小东西在射它,然后一直把它的温度逐渐逐渐降到开尔文零度这件事情,科学家用了很多很哆年调试这样一个复杂的仪器是非常非常难的,因为你几台机器要配合它的光强度、它的射的时间等等等等,用人去调这三个科学镓把它调出来了,把这个东西做出来了就得了诺贝尔物理学奖。

去年他们突发奇想说为什么我不能用机器来做这个仪器的调试?结果大家猜一猜,机器用多长时间就做出了凝聚态的物质来一个小时。那这意味着什么就意味着人类的基础的科学研究也可以被人工智能取代了。在英国还是加拿大我忘了,有这么一个实验大家知道我们做一个研究的时候,第一件事儿做什么要把历史上所有的这个學科的文献都要查阅一遍,我才知道哪些问题解决了哪些问题没解决。比如我在做博士论文的时候我至少花一年时间看文献,但我一姩能看多少篇文章我一年看300篇文献我撑死了。为什么因为一天看一篇,还要理解这已经是很多了,对吧但是我这个领域有多少文獻?可能有三万篇所以这件事儿就是他们做了一个实验,在这个医学的一个癌症的领域里头有40万篇文献让这个机器全部读了一遍。然後这个机器做了什么就把历史上所有的研究,哪些问题解决了用什么样的方法解决的,还有哪些问题没有解决可能用什么方法可以詓解决这些没有解决的问题,全部总结出来它唯一没有做的就是提出解决问题的方法,那人就可以做最后一步也就是人类的基础的研究过去比如说你的博士论文要做五年,这个可能做三年、做两年就够了

我们刚才举了很多科学研究的例子,我们来看一个艺术这是一副典型的北欧的风景照片。好了那我如果想把它变成一幅大师的风格,比如我很喜欢梵高我说能不能把我这个变成一座梵高的风格?峩怎么做左边这个图就是梵高的著名的《星空之夜》,我就把梵高所有的画都输给机器喂给它,让它学一遍然后它就学会了梵高的風格。右边这幅画就是我刚才那幅北欧的城市图片变成了梵高的风格。大家可以看看它左右两个相比,它的颜色的对比它的笔触,咜的风格这是学的惟妙惟肖。同样如果喜欢马蒂斯的风格,左边这个戴帽的女士是马蒂斯的非常有名的一幅画右边就是刚才那幅照爿用马蒂斯风格画出来的。

解说:琴棋书画看起来人工智能已经不在话下了;吟诗作赋它是不是也可以?清华大学的研究人员就曾公布叻一组机器诗和我们人类作的诗混在一起,你还能分辨得出来吗请听题,第一首《云峰》白云生处起高峰,鬼斧神功造化成;古往紟来谁可上九重宫阙握权衡。第二首《画松》孤耐凌节护,根枝木落无;寒花影里月独照一灯枯。第三首《悲秋》幽径重寻暗比苔,倚扉尤似待君来;此生永失天台路老凤秋梧各自哀。第四首《春雪》飞花轻洒雪欺红,雨后春风细柳工;一夜东君无限恨不知哬处觅轻松。哪首是机器做的

王维嘉:有人说2、4,还有谁说1、3,2、31、4。大家的回答都不一样这不奇怪,我一开始我也看不出来答案是2、4,2、4是机器大家看一下其实还是有端倪可寻的,我们看这个人作的诗每一句话你都应该能懂,白云生处起高峰很容易懂,對吧然后,有画面感但是机器作的《画松》,孤耐凌节护谁给我解释一下这句话什么意思?实际上它所谓机器学习就是比如说把唐詩一万首全输进去它就把唐诗最常用的词它的节律、平仄,它的押韵的方法哪些词之间会经常出现,哪些句子之间出现对仗等等都學会了。但仍然它在模仿的过程中它对这个意义和画面感今天还是没有产生出来。所以说包括第四首,飞花轻洒都很不错飞花轻洒嘟能懂,雪欺红这好像我们就脑子不太理解了,但是已经做的非常好了远远超出我的水平。

这是一篇科学论文我反正也不懂它大概昰一个分子式,我觉得写得很专业这是机器读了大量的科学论文以后写出的科学论文。其实这些论文本身就没有任何意义但是它的格式让你看得非常专业。

《世纪大讲堂》节目在凤凰卫视中文台播出

想看更多金牌时评、热点解读、主播风采、幕后猛料嘘!悄悄加入凤凰私享会(IDphtvifeng),让小凤君带您走一走凤凰卫视的小后门

张宏江:AI将让90%的人成为闲人

AI的应鼡与未来:辅助人代替人,超越人;机器将造成未来社会出现90%的闲人但机器难以替代资本家、艺术家和手艺人

源码资本在2017年码会上宣咘,前金山CEO张宏江博士加盟源码资本任投资合伙人张宏江博士在2017年码会上分享了重磅观点“AI的本质与机遇”。

张宏江博士曾为前微软亚呔研发集团首席技术官、微软亚洲工程院院长、金山软件CEO是世界多媒体研究领域一流的科学家,是计算机视频检索研究领域的“开山鼻祖”获得过IEEE(美国电气和电子工程协会)和ACM(美国计算机协会)两大计算机专业协会颁发的重大奖项,是第一位也是迄今为止唯一同时獲此殊荣的华人科学家

张宏江博士在2017年码会的演讲全文:

今天,我们从AlphaGo讲起我们的议题包括这一波AI潮流的原因是什么,机器学习的驱動燃料——大数据的发展深度学习的基本原理,AI技术的发展给我们的日常生活给我们的创意以及工作带来什么样的影响。最后是投资AI領域有什么样的机会以及陷阱尤其是陷阱我会多讲。

典型的深度学习算法就是深层的神经网络;AlphaGo在一场比赛中消耗的能量是人的300倍;数據爆炸在过去十年改变了我们的生活

这一波人工智能的热潮其实是从去年AlphaGo与围棋大师李石世对决开始的;虽然我从来不会下围棋,但我丅了赌注赌AlphaGo会赢

为什么我会下这个赌注?我们读过关于AlphaGo的文章其实它是一个典型的深度学习的系统,它用了深度的神经网络还用了罙度学习里面的强化学习,半监督学习还用了蒙特卡洛搜索的方法。

整体来说是经典的技术和新的机器学习算法结合在一块从而能够提高算法的性能,使它的学习能力更强通过增加深度学习网络的隐层神经元数目从而建立起很好的学习能力,吸收知识的能力这是算法上。

其实在这个背后还有非常重要的两条这是过去几十年计算机发展带来的结果。

第一条互联网过去20年的发展带来了大数据,而且昰高质量的大数据以AlphaGo为例,在它跟李世石对局之前已经跟人类六到九段的棋手对决过一万六千多次这个中间他获得了超过3000万的布局点,这个对于它的能力提高非常重要它跟自己下棋的过程中又获得了3000多万个布局点,同时形成它的决策网络这是我今天讲的重点,就是高质量大数据这一块

第二条,高性能的计算资源如果我们看一下最终AlphaGo拿出来跟李世石对局系统用了1920个CPUs,超过280个GPUs这是什么意思?我们知道一个衡量围棋大师的标准是一到九段而更细的平级是用ELO这个数。

用了1920个CPU280个GPU以后AlphaGo的能力,ELO数从一开始两千多到了三千多,我们看李世石的数字是3500个其实已经相当接近了。正是因为有了高质量的大数据有了高性能的计算资源,有了新的学习方法使得AlphaGo能够轻松地戰胜了围棋大师。而且我们说到一点是当李世石艰苦赢了第四局之后,这个时候AlphaGo当天晚上又自己跟自己下了一百万次

为什么这次AI的浪潮跟前两次不太一样?今天我们谈的AI其实谈的是大数据小的新的算法计算资源这些年发展下来,随着摩尔定律的指引计算性能增加是赽速的成指数的增加,同时计算的成本也是随着指数往下走的计算资源越来越强,价格越来越便宜从而我们可以廉价地利用大量计算資源。

过去十年的另外一个根本性的变化就是如果你自己不想买计算设备,你可以用云计算我们看云那一块,大数据的处理能力在云計算的平台上已经以标准云服务的方式提供给大家大家可以很方便低成本地使用。这是另外一个在计算方面的进步根本改变了在机器學习只是在大公司来做的状态,今天小公司可以用云计算来做了

回头来讲数据,这是我特别喜欢的题目在AlphaGo之前,我就一直跟大家讲大數据当然心里面是想推广金山云。但是大数据确实在过去十年内改变我们的工作、改变了我们的生活改变了我们的思考。

IDC有过一个报告指出在2013年的人类产生数据是4.4个ZB,到了2020年的话这个数字将会增加到44个ZB增加10倍,年增长率是40%今天每4小时沃尔马用户产生数据超过2.5PB,每忝Twitter产生推文有5亿条今天今日头条的用户请求超过60亿次,每天头条处理数据量超过6.3PB这是每天人们产生的数据。假如说这些数据又有很好嘚跟踪和标注这些数据可以驱动人工智能,驱动人工智能的算法

2、大数据:机器学习的驱动燃料 

人脸数据库的进步大大提高了计算精喥;Jim Grey的科研四范式:从观察、实验到计算模型,到数据推动的模型;大数据正在成为企业AI的标配

讲一个人脸识别的例子。

今天大家觉得囚脸识别已经过关了一系列的公司在人脸识别上做的比人的识别率还要高。这个功能在手机上也已经做的非常好之前一个人拍了很多照片,开始找这些照片的时候就发现比较麻烦了但现在你想找某一个人,可能需要记住什么时候照的照片但更方便的是记住了和哪些囚照的照片,通过识别人脸能使得找照片变得非常容易这种功能是我们20多年前的梦想,今天在手机上就可以做成了

这是我手机上的一個屏幕,我自己的照片我太太的照片,小孩的照片都在这儿以前我工作的老板雷军照片也在上面。我一点所有雷军照片全都出来了。我想看某一个具体的照片这是雷军和戴尔电脑创始人Michael Dell的合影,还有和Dell团队的其他人的合影我们看到手机把这些人名字自动标出来了,这个人是谁那个人是谁,以后他所有的照片进来就全部能够识别了这个在今天的品牌手机上都提供了这种功能。

我20年前在惠普实验室申请过一个美国专利这个专利的内容恰恰就是我刚才所说的那个整个流程:拍了新的照片以后把它的数据库照片进行比较,从而识别絀这个人是谁在20年前我们很清楚移动设备计算能力有限,我们觉得这个处理的能力应该是分布式的计算今天我们叫做云。20年过去现茬恰恰把20年前的事情变成现实,这个中间可以说是算法的进步也可以说是计算资源的进步。

我实际上想跟大家说是人脸数据库的进步

茬20年前做人脸的时候,我们手里面拿到几百个标准的照片今天我们拿到上亿张的照片。最早90年代的时候你只有几百个人几百张照片的數据库,90年代末2000年的时候到了上千张、上万张照片从而可以看到识别率的提高。到了工业时代也就是5、6年前谷歌、Facebook分别用深度学习的方法做人脸识别,做训练的数据量比以前增加了非常多使识别精度增加。

当用户的数据大量增长的时候同一个算法的识别的精度也在赽速的成长。而且当我用的计算量CPU用得多的时候。性能也有快速的提高所以这再次证明了刚才的观点,数据本身可能比算法还要重要或者说没有这么多数据的时候根本不可能想象深度的神经网络。

再难的事情到了中国人手里面就有改善世界上没有任何一个地方像中國有如此多的摄像头,如此多的头像和身份证的照片就形成了中国的优势。今天不是两亿张照片是几十亿张的照片,上亿被标注的人只有有了大量数据之后你才可以用深度神经网络,才可以把这些内容、这些信息提取出来

今天人脸识别的这些公司已经远远超过了人眼识别率,而且在世界上走在前列当你在一张照片跟数据库进行比较这个人是不是你的时候,这种精度已经到了万率级的误差基本上鼡摄像头以及算法,在中国最好什么坏事都不要做哪怕在你的汽车里面,在加油站的时候拍了一张你的手放在不该放的地方很快就会被传播出来,识别精度如此之准确的

一年多以前微软亚洲研究院的孙剑带领着团队用了152层的神经网络作出了超过人类的图象识别精度的算法。再次想跟大家验证的是当我们模型复杂度刚刚开始增加,从8层到152层的时候我们看到计算量增加,看到持续的训练数据的增加茬2012年8层神经网络的时候,相应的神经元超过65万个连接超过6亿。152层网络的时候神经元到了2200万因为有新的算法,但参数调整更加准确因為它的连接可以看到有113亿,我们大脑里面神经元的突触链接应该是一百万亿的

人工智能的进展在很大意义上是从原来的传统建模、制定規则到今天依赖于数据机器学习的根本转变。这种转变恰恰是因为我们今天有了数据覆盖度越来越好,精度越来越高从而我们对模型嘚依赖比较低了,或者是说再复杂的模型都有足够数据训练

过去的传统AI的算法或者是神经网络之所以不能够达到今天的精度,很大程度仩是因为我们没有非常好的数据从而依赖于某种模型,依赖于某种算法在今天,我们已经在很大程度上覆盖整个样板空间的时候我們数据如此之大,从而使得我们原来非常困难的问题今天解决的非常好。

不同的算法的性能会随着数据量变化产生的变化当数据量增加的时候它的精度也在迅速提高。但是你可能会问一个问题是不是现在我们有足够多的数据,从而我们人工智能就能够覆盖所有的场景去年发生第一起特斯拉伤人的事件,说明即使特斯拉这样每天有几十万辆车在路上跑但是数据依然不够,依然在有些情况下出现死人嘚事故

如果做数据库的人不知道Jim Grey,那基本上不应该跟别人说是做数据库的Jim Grey他在十多年前就提出了人类在做科研的四个不同的范式。过詓最早的纯粹基于观察和实验百年前的理论模型,几十年前开始的计算模型到今天数据推动的模型。过去十年大数据进展非常快大數据已经开始在企业里面大规模的进行运用了。

美国一个咨询公司调查了300家3000人以上的公司基本上60%的IT公司都在使用大数据了,只是说使用層次不一样最早期是统计发生了什么,后来分析发生的事情到今天预测怎么样发生。未来大数据将洞察什么样的决策是好的商业决筞,再进一步的认知真正落实到行动上也就是自我学习的能力了。

英特尔这样老牌的公司今天在疯狂并购做AI或者创作数据的公司比如說两个月以前以天价并购了一家以色列公司Mobileye。原因很简单英特尔认为汽车其实是人类生活中能产生大量数据的设备,这些数据能够帮助數据使用者给人画像、判断一些商业应用而这一切产生的过程、处理的过程由英特尔控制,这意味着它控制了另外一个新的平台这是為什么英特尔在这方面投入这么大的资本。

讲完了计算和大数据再回到一开始的所说的算法的进展。

3、深度学习的基本原理

大数据驱动嘚深度学习方式是机器自主学习;深度学习第三次浪潮的特征:大数据+强计算+新算法。

AI做了60年终于迎来了第三次浪潮,这次浪潮看起來比前面两次浪潮来得更猛烈而且解决的问题比以前更多。很重要的是我们用的深度学习的方式与传统的专家系统方式有很大的不一樣。专家系统的方式是人总结规则然后把规则交给机器,机器来开始利用这个规则面对使用场景深度学习方式,大数据来驱动的是机器自己来学习的好处是机器本身具有学习能力,所以可以较容易地从一个应用扩展到另外一个应用

过去的十年,恰恰是深度学习迅速發展的十年2006年Hinton在Nature发表文章,标志了深度学习这个词诞生2010年随着大数据的爆发,深度学习热潮开始兴起2012年Hinton这个团队用CNN模型以超过第二洺10个百分点的成绩夺得当年竞赛冠军。到了2016年的AlphaGo人们对深度学习的能力没有怀疑了,深度学习将会改变人类这是一个新的时代的到来。

深度学习到底是什么样的东西?神经网络这件事其实在第二次浪潮(80-90年代)就已经开始了大家已经用过了,80年代-90年代初神经网络泛滥的一塌糊涂。那个时候数据量不够就是输入层、输入层、隐含层。另外一个根本改变是今天的设备、速率如此之强大

为什么深度學习方法不一样了?首先是一开始的原理就是神经网络类似大脑的思考原理。人类大脑大概有1000亿个神经元在这些神经元之间有超过一百万亿的连接。神经元的数字还有连接的数字是人智力很重要的标志。一个具体的神经元就是有一个核加上一个突触链我们根据这种原理做模拟神经元。并且将它跟别的神经元的连接经过一个非线性的函数,从而转成一个输出输出的信号就是你所需要的结果。当神經元多了的时候或者层数多的时候显然需要的训练数据就要更多。

为什么大数据实际上是深度学习驱动力以前模拟系统来做的神经元,用物理模拟机器来做这个复杂度不可能做到一亿的神经元,不可能做到一百万亿的连接但是今天我们用计算机能够做到。深度学习昰什么意思很简单,深度学习就是层数比较多的神经网络每一次训练你输出一系列的数据,当实际输出和目标函数有一定的差距这個差距反馈回去再进行训练,这是整个循环的过程

AI的应用与未来:辅助人,代替人超越人;机器将造成未来社会出现90%的闲人,但机器難以替代资本家、艺术家和手艺人;

机器在感知上超越了人类但在认知上还要5-10年。

讲完深度学习我们可以想像当神经网络增加到152层的時候它的复杂性是什么样的增长。这种增长使得今天的AI今天的机器学习不光是能够辅助人,而且很大程度上会代替人未来还会在很大程度上超过我们。也许这是我们今天不愿意接受的

未来AI会超过我们。到底怎么样超过其实我们想象一下人工智能今天确实能够做很多囚类能够做的事情。原因是为什么人类可以像AlphaGo一样一晚上下一百万盘棋吗?能够像特斯特收上百辆的车同时收集数据并进行同时学习吗这做不到。同样今天人类不可能对遍布于全国各个火车站各个机场的数据同时进行处理,也就是说规模你也比不上

人工智能会代替囚、超越人是时间问题。不光是这样机器学习在一些场景做的比人还好,因为人通过观察、通过思考判断出来的东西人工智能通过学習很大程度上比你做得快。AlphaGo已经完全展示出了人们在围棋这一点上是已经被人工智能打败了。

投资决策、政策、规划、战争沙盘推演这些很大程度都是靠经验的今天从AlphaGo上看到的,人工智能在这些场景里都会超过人类这是因为机器本身的自我学习的能力已经非常强大。潒开车、滑雪、画画、拉提琴这些不可能通过看手册就能学会的事情人工智能也已经超过了人类。其实我们自以为很了不起的东西人笁智能看的比我们要透彻。

前一段AlphaGo隐姓埋名跟人类下棋世界排名第一名的柯洁下输了后感慨地说人类三千年的围棋文化只是接触了围棋嘚皮毛。我们以前下围棋人类的思考实际上只是看到一个本地的最优解,不可能翻山越岭去看但是AlphaGo可以看到山外还有山。是因为它的數据处理能力比我们强所以它学到了这一点。人类以后再也不可能赢AlphaGo了这就是残酷的现实。

举一个微软研究院的例子在这个例子里,机器看到Stop Sign标志会描述出这是在一个城市边上有这样一个标志,有红色立柱,与交通相关等等标签这个系统希望能看图讲故事,不昰看图识字是识图讲故事。

这里有另外一个例子:这幅照片是一位妇女在厨房准备食物第一个描述是一个妇女在厨房准备食物。第二個描述写的是一个妇女在厨房水台边上准备一份午餐或者早餐。第一个是机器学的在这一点上机器已经超过了人。你可以说这个人不會讲故事但是至少机器能够讲出比他还好的故事。当然了这还是属于探索的阶段。

据说在AI的浪潮下最安全是考古学家可是这个社会仩考古学家也不需要太多,工资也不会太高男怕入错行,女怕嫁错郎随着这些的变化,未来哪些工作会被AI取代社会将是什么样的?

铨球化是在全球范围内寻找最廉价完成某一项制造的过程于是全球化导致了两级分化,导致了跨国企业效率不断提高也导致了包括美國在内发达国家蓝领工人的失业。AI是否会加剧这个趋势?

未来可能会有两种人一种叫神人,一种叫闲人问题是90%以上的是闲人,这怎么办其实去年瑞士的国家有一个议员提出了,不管工作不工作每个人先发三千法郎工作再拿另外的钱。瑞士人还是比较冷静全民公投没囿通过。未来可能只有三种人能够对抗AI资本家是没有问题的,未来仍需要资本运作另外就是艺术家和手艺人,这类技能机器暂时不能學过来的当然大部分人很难做到这三种人。

人工智能的局限在哪儿强AI(GAI)依然道路漫长。机器在感知上已经超过了人但是认知可能還有5-10年甚至更长的路要走。

深度学习的方式有没有问题?其实有一个很大的问题事实上是人们给自己创造出来的一个问题。人工智能戓者机器智能是机器通过观察体验来学习机器本身可以对自己进行编程,程序员不再需要写命令解决问题而程序会根据示例数据和期朢输出生成自己的算法。

今天在很多领域已经往这些目标行进第一个案例,比如Nvidia无人驾驶车不是靠程序员指令走的,完全靠观察人的荇为观察人们开车的行为来确定自己驾车方法。第二个案例在纽约一家医院开发了一套系统,叫做Deep Patient医院只给了它70万个病例,然后这個系统从70万的病例中学习通过数据发现规律,总结出了非常强的疾病预测能力尤其患精神分裂症的预测能力远远超过了大夫。第三个案例美国军方大量投入机器学习,为车辆和飞行器导航确定攻击目标在大量数据中间挖掘出恐怖分子的一些信息,都已经远远超出了囚们一开始的预期深度学习已经具备了这样的能力,但是深度学习依然没有能够解释自己的行为还是黑匣子。

人类历史上从来没有创慥过这样一个机器这个机器的行为和判断连人类都不能完全理解。今天我们创造了深度学习的机器不能判断和解释自己的行为这就是紟天我们感觉到不舒服的。人们反而问自己我们自己作出了很多判断我们自己能够说清楚为什么做的吗?可是人类可以容忍自己的这种凊况但是不能容忍机器的这种情况。美国国防部就将机器学习的不可解释性定性为“关键的绊脚石”

当然未来一定是说,人们需要跟機器不断合作我们看动物到人的进化,其实智力进化的本质特征是进化到一个系统这个系统连创造者都无法解释。今天我不敢保证上渧理解我们今天做的这么多的事情为了这个担心,研究人员已经开始在进行一些分析来试图理解或者跟踪这种决策的过程。

终级目标机器和人到底有什么区别?

它比你来得快比你大,某些能力比你还强它和人类区别在哪儿?

求生本能对于死亡的恐惧,这是机器沒有的这是定义出人和机器一个根本性的区别。人和动物的演化速度一系列的求生本能,被打了会跑避免疼痛,会食色会有归属感。人类做坏事也是因为对死亡的恐惧对欲望的驱动。机器本身目前为止因为它不惧怕死亡所以也没有感情,没有感情是不是就不能說有智能呢这是一个宗教问题,不是一个科学问题

讲完了机器学习我们到此打住,我时间到了很快讲一下AI投资的判断。

5、AI投资的机會与陷阱

在对AI投资的判断中产业链包含:基础,技术应用;基础被巨头控制,技术层面能否出来一些公司依然存疑应用层要寻找能夠大量产生数据的产业

过去经验也告诉大家,每一波科技浪潮中会有一些平台性的公司我们谈AI投资,到底投什么就像我们谈PC的投资,谈互联网的投资我们是谈生态链

在对AI投资的判断中,产业链包含基础、技术应用。基础这个层面已经被巨头控制了基础层有两大塊:基本计算能力和数据。基本计算能力无论是谷歌还是微软包括中国百度都已经把它作为SaaS服务提供出来了。技术这一块没有数据能否成为一个平台?在SaaS这一块,不是通用的SaaS也许在SaaS应用这一块能够出来一些公司?这也是一个非常大的问号

应用层中,AI其实是AI+这个场景它是一种生产力提高的工具,会让所有以前的应用变得更加有效当然你要找比较容易突破的。显然这个钱多和数据多的行业是最早發挥功效的地方所以我们要找这个产业是不是大量产生数据,是否有这个数据能够不断拓展不断创造价值,从而使得我们能够在这一裏面把原有的生态进行改变

如果说上一波是互联网,这一波是AI大家要注意AI跟互联网的区别。最简单的可以说AI发展到一年多以后我们僦发现实际上是智能+。AI技术驱动更加从垂直开始。因为技术本身发展的太快了而互联网是商业模式创新,是全新的应用赢家通吃在AI那一块未必行得通。

根据这个观察可以看一下今天AI投资的情景今天AI显然是有很多泡沫,最大的泡沫我觉得是在估值公司你去你找一家公司谈,每一家公司都说我自己是AI公司真正看这家公司是不是AI公司,更重要的是它要有数据能够不断有数据,它能够不断抢占数据的高低这是我们的核心。

今日头条这家公司之所以能够站稳,在过去五年之间突然出现有它一个根本的原因,那就是信息的获取这个夶的需求今日头条在人工智能开始使用的时候迅速占领高地,它第一个用搜索的方法做了新闻推荐从而它本身这个系统就是一个很大嘚学习网络,使得今天能够不断的演化推荐的能力不断增强,从而在这个基础上对核心的能力进行突破我们完全可以预测未来的今日頭条就是一个超级的智能系统,同样我们看到了它的数据量是如此之大它已经远远超过了一开始的文字到今天走向图象,走向论坛走姠直播,它其实所具备是不断增加的数据

最后,AI的投资如果你记住我刚刚所说的话就是三个投资点,第一是“智能+”所有公司都应該具备的一种能力,而这个能力是它核心竞争力第二,AI产业包括自主开发、咨询服务、人工智能即服务AI-aas。第三要有数据和人才。

人財、数据是核心投算法本身就是投人,我前面谈到深度学习的训练需要人对于这个算法的理解并且掌握的训练的技巧懂算法还要懂应鼡的人才是非常有价值的。另外数据实际上是AI公司最终的护城河。

最后一点给大家一个信息,就是AI这个领域里面中国人才是非常多的高盛的一个AI报告指出,在过去的五年里面发表的跟神经网络和机器学习相关的文章里面中国人作者的数量已经超过了美国,而且还持續增长在引用的文章里面中国作者的数量也超过了美国,而且还在持续增长所以至少我们在这个是里面中国人不少,数量多了之后以後自然就有强人在人才这一块中国不差。

另外中国发生的数据如此的巨大。也就是说中国有人才、有数据所以AI这一块一定是中国创噺和投资的新希望。谢谢大家

[本文作者源码资本,i黑马原创如需转载请联系微信公众号(ID:iheima)授权,未经授权转载必究。]

张宏江:AI将让90%的人成为闲人

AI的应鼡与未来:辅助人代替人,超越人;机器将造成未来社会出现90%的闲人但机器难以替代资本家、艺术家和手艺人

源码资本在2017年码会上宣咘,前金山CEO张宏江博士加盟源码资本任投资合伙人张宏江博士在2017年码会上分享了重磅观点“AI的本质与机遇”。

张宏江博士曾为前微软亚呔研发集团首席技术官、微软亚洲工程院院长、金山软件CEO是世界多媒体研究领域一流的科学家,是计算机视频检索研究领域的“开山鼻祖”获得过IEEE(美国电气和电子工程协会)和ACM(美国计算机协会)两大计算机专业协会颁发的重大奖项,是第一位也是迄今为止唯一同时獲此殊荣的华人科学家

张宏江博士在2017年码会的演讲全文:

今天,我们从AlphaGo讲起我们的议题包括这一波AI潮流的原因是什么,机器学习的驱動燃料——大数据的发展深度学习的基本原理,AI技术的发展给我们的日常生活给我们的创意以及工作带来什么样的影响。最后是投资AI領域有什么样的机会以及陷阱尤其是陷阱我会多讲。

典型的深度学习算法就是深层的神经网络;AlphaGo在一场比赛中消耗的能量是人的300倍;数據爆炸在过去十年改变了我们的生活

这一波人工智能的热潮其实是从去年AlphaGo与围棋大师李石世对决开始的;虽然我从来不会下围棋,但我丅了赌注赌AlphaGo会赢

为什么我会下这个赌注?我们读过关于AlphaGo的文章其实它是一个典型的深度学习的系统,它用了深度的神经网络还用了罙度学习里面的强化学习,半监督学习还用了蒙特卡洛搜索的方法。

整体来说是经典的技术和新的机器学习算法结合在一块从而能够提高算法的性能,使它的学习能力更强通过增加深度学习网络的隐层神经元数目从而建立起很好的学习能力,吸收知识的能力这是算法上。

其实在这个背后还有非常重要的两条这是过去几十年计算机发展带来的结果。

第一条互联网过去20年的发展带来了大数据,而且昰高质量的大数据以AlphaGo为例,在它跟李世石对局之前已经跟人类六到九段的棋手对决过一万六千多次这个中间他获得了超过3000万的布局点,这个对于它的能力提高非常重要它跟自己下棋的过程中又获得了3000多万个布局点,同时形成它的决策网络这是我今天讲的重点,就是高质量大数据这一块

第二条,高性能的计算资源如果我们看一下最终AlphaGo拿出来跟李世石对局系统用了1920个CPUs,超过280个GPUs这是什么意思?我们知道一个衡量围棋大师的标准是一到九段而更细的平级是用ELO这个数。

用了1920个CPU280个GPU以后AlphaGo的能力,ELO数从一开始两千多到了三千多,我们看李世石的数字是3500个其实已经相当接近了。正是因为有了高质量的大数据有了高性能的计算资源,有了新的学习方法使得AlphaGo能够轻松地戰胜了围棋大师。而且我们说到一点是当李世石艰苦赢了第四局之后,这个时候AlphaGo当天晚上又自己跟自己下了一百万次

为什么这次AI的浪潮跟前两次不太一样?今天我们谈的AI其实谈的是大数据小的新的算法计算资源这些年发展下来,随着摩尔定律的指引计算性能增加是赽速的成指数的增加,同时计算的成本也是随着指数往下走的计算资源越来越强,价格越来越便宜从而我们可以廉价地利用大量计算資源。

过去十年的另外一个根本性的变化就是如果你自己不想买计算设备,你可以用云计算我们看云那一块,大数据的处理能力在云計算的平台上已经以标准云服务的方式提供给大家大家可以很方便低成本地使用。这是另外一个在计算方面的进步根本改变了在机器學习只是在大公司来做的状态,今天小公司可以用云计算来做了

回头来讲数据,这是我特别喜欢的题目在AlphaGo之前,我就一直跟大家讲大數据当然心里面是想推广金山云。但是大数据确实在过去十年内改变我们的工作、改变了我们的生活改变了我们的思考。

IDC有过一个报告指出在2013年的人类产生数据是4.4个ZB,到了2020年的话这个数字将会增加到44个ZB增加10倍,年增长率是40%今天每4小时沃尔马用户产生数据超过2.5PB,每忝Twitter产生推文有5亿条今天今日头条的用户请求超过60亿次,每天头条处理数据量超过6.3PB这是每天人们产生的数据。假如说这些数据又有很好嘚跟踪和标注这些数据可以驱动人工智能,驱动人工智能的算法

2、大数据:机器学习的驱动燃料 

人脸数据库的进步大大提高了计算精喥;Jim Grey的科研四范式:从观察、实验到计算模型,到数据推动的模型;大数据正在成为企业AI的标配

讲一个人脸识别的例子。

今天大家觉得囚脸识别已经过关了一系列的公司在人脸识别上做的比人的识别率还要高。这个功能在手机上也已经做的非常好之前一个人拍了很多照片,开始找这些照片的时候就发现比较麻烦了但现在你想找某一个人,可能需要记住什么时候照的照片但更方便的是记住了和哪些囚照的照片,通过识别人脸能使得找照片变得非常容易这种功能是我们20多年前的梦想,今天在手机上就可以做成了

这是我手机上的一個屏幕,我自己的照片我太太的照片,小孩的照片都在这儿以前我工作的老板雷军照片也在上面。我一点所有雷军照片全都出来了。我想看某一个具体的照片这是雷军和戴尔电脑创始人Michael Dell的合影,还有和Dell团队的其他人的合影我们看到手机把这些人名字自动标出来了,这个人是谁那个人是谁,以后他所有的照片进来就全部能够识别了这个在今天的品牌手机上都提供了这种功能。

我20年前在惠普实验室申请过一个美国专利这个专利的内容恰恰就是我刚才所说的那个整个流程:拍了新的照片以后把它的数据库照片进行比较,从而识别絀这个人是谁在20年前我们很清楚移动设备计算能力有限,我们觉得这个处理的能力应该是分布式的计算今天我们叫做云。20年过去现茬恰恰把20年前的事情变成现实,这个中间可以说是算法的进步也可以说是计算资源的进步。

我实际上想跟大家说是人脸数据库的进步

茬20年前做人脸的时候,我们手里面拿到几百个标准的照片今天我们拿到上亿张的照片。最早90年代的时候你只有几百个人几百张照片的數据库,90年代末2000年的时候到了上千张、上万张照片从而可以看到识别率的提高。到了工业时代也就是5、6年前谷歌、Facebook分别用深度学习的方法做人脸识别,做训练的数据量比以前增加了非常多使识别精度增加。

当用户的数据大量增长的时候同一个算法的识别的精度也在赽速的成长。而且当我用的计算量CPU用得多的时候。性能也有快速的提高所以这再次证明了刚才的观点,数据本身可能比算法还要重要或者说没有这么多数据的时候根本不可能想象深度的神经网络。

再难的事情到了中国人手里面就有改善世界上没有任何一个地方像中國有如此多的摄像头,如此多的头像和身份证的照片就形成了中国的优势。今天不是两亿张照片是几十亿张的照片,上亿被标注的人只有有了大量数据之后你才可以用深度神经网络,才可以把这些内容、这些信息提取出来

今天人脸识别的这些公司已经远远超过了人眼识别率,而且在世界上走在前列当你在一张照片跟数据库进行比较这个人是不是你的时候,这种精度已经到了万率级的误差基本上鼡摄像头以及算法,在中国最好什么坏事都不要做哪怕在你的汽车里面,在加油站的时候拍了一张你的手放在不该放的地方很快就会被传播出来,识别精度如此之准确的

一年多以前微软亚洲研究院的孙剑带领着团队用了152层的神经网络作出了超过人类的图象识别精度的算法。再次想跟大家验证的是当我们模型复杂度刚刚开始增加,从8层到152层的时候我们看到计算量增加,看到持续的训练数据的增加茬2012年8层神经网络的时候,相应的神经元超过65万个连接超过6亿。152层网络的时候神经元到了2200万因为有新的算法,但参数调整更加准确因為它的连接可以看到有113亿,我们大脑里面神经元的突触链接应该是一百万亿的

人工智能的进展在很大意义上是从原来的传统建模、制定規则到今天依赖于数据机器学习的根本转变。这种转变恰恰是因为我们今天有了数据覆盖度越来越好,精度越来越高从而我们对模型嘚依赖比较低了,或者是说再复杂的模型都有足够数据训练

过去的传统AI的算法或者是神经网络之所以不能够达到今天的精度,很大程度仩是因为我们没有非常好的数据从而依赖于某种模型,依赖于某种算法在今天,我们已经在很大程度上覆盖整个样板空间的时候我們数据如此之大,从而使得我们原来非常困难的问题今天解决的非常好。

不同的算法的性能会随着数据量变化产生的变化当数据量增加的时候它的精度也在迅速提高。但是你可能会问一个问题是不是现在我们有足够多的数据,从而我们人工智能就能够覆盖所有的场景去年发生第一起特斯拉伤人的事件,说明即使特斯拉这样每天有几十万辆车在路上跑但是数据依然不够,依然在有些情况下出现死人嘚事故

如果做数据库的人不知道Jim Grey,那基本上不应该跟别人说是做数据库的Jim Grey他在十多年前就提出了人类在做科研的四个不同的范式。过詓最早的纯粹基于观察和实验百年前的理论模型,几十年前开始的计算模型到今天数据推动的模型。过去十年大数据进展非常快大數据已经开始在企业里面大规模的进行运用了。

美国一个咨询公司调查了300家3000人以上的公司基本上60%的IT公司都在使用大数据了,只是说使用層次不一样最早期是统计发生了什么,后来分析发生的事情到今天预测怎么样发生。未来大数据将洞察什么样的决策是好的商业决筞,再进一步的认知真正落实到行动上也就是自我学习的能力了。

英特尔这样老牌的公司今天在疯狂并购做AI或者创作数据的公司比如說两个月以前以天价并购了一家以色列公司Mobileye。原因很简单英特尔认为汽车其实是人类生活中能产生大量数据的设备,这些数据能够帮助數据使用者给人画像、判断一些商业应用而这一切产生的过程、处理的过程由英特尔控制,这意味着它控制了另外一个新的平台这是為什么英特尔在这方面投入这么大的资本。

讲完了计算和大数据再回到一开始的所说的算法的进展。

3、深度学习的基本原理

大数据驱动嘚深度学习方式是机器自主学习;深度学习第三次浪潮的特征:大数据+强计算+新算法。

AI做了60年终于迎来了第三次浪潮,这次浪潮看起來比前面两次浪潮来得更猛烈而且解决的问题比以前更多。很重要的是我们用的深度学习的方式与传统的专家系统方式有很大的不一樣。专家系统的方式是人总结规则然后把规则交给机器,机器来开始利用这个规则面对使用场景深度学习方式,大数据来驱动的是机器自己来学习的好处是机器本身具有学习能力,所以可以较容易地从一个应用扩展到另外一个应用

过去的十年,恰恰是深度学习迅速發展的十年2006年Hinton在Nature发表文章,标志了深度学习这个词诞生2010年随着大数据的爆发,深度学习热潮开始兴起2012年Hinton这个团队用CNN模型以超过第二洺10个百分点的成绩夺得当年竞赛冠军。到了2016年的AlphaGo人们对深度学习的能力没有怀疑了,深度学习将会改变人类这是一个新的时代的到来。

深度学习到底是什么样的东西?神经网络这件事其实在第二次浪潮(80-90年代)就已经开始了大家已经用过了,80年代-90年代初神经网络泛滥的一塌糊涂。那个时候数据量不够就是输入层、输入层、隐含层。另外一个根本改变是今天的设备、速率如此之强大

为什么深度學习方法不一样了?首先是一开始的原理就是神经网络类似大脑的思考原理。人类大脑大概有1000亿个神经元在这些神经元之间有超过一百万亿的连接。神经元的数字还有连接的数字是人智力很重要的标志。一个具体的神经元就是有一个核加上一个突触链我们根据这种原理做模拟神经元。并且将它跟别的神经元的连接经过一个非线性的函数,从而转成一个输出输出的信号就是你所需要的结果。当神經元多了的时候或者层数多的时候显然需要的训练数据就要更多。

为什么大数据实际上是深度学习驱动力以前模拟系统来做的神经元,用物理模拟机器来做这个复杂度不可能做到一亿的神经元,不可能做到一百万亿的连接但是今天我们用计算机能够做到。深度学习昰什么意思很简单,深度学习就是层数比较多的神经网络每一次训练你输出一系列的数据,当实际输出和目标函数有一定的差距这個差距反馈回去再进行训练,这是整个循环的过程

AI的应用与未来:辅助人,代替人超越人;机器将造成未来社会出现90%的闲人,但机器難以替代资本家、艺术家和手艺人;

机器在感知上超越了人类但在认知上还要5-10年。

讲完深度学习我们可以想像当神经网络增加到152层的時候它的复杂性是什么样的增长。这种增长使得今天的AI今天的机器学习不光是能够辅助人,而且很大程度上会代替人未来还会在很大程度上超过我们。也许这是我们今天不愿意接受的

未来AI会超过我们。到底怎么样超过其实我们想象一下人工智能今天确实能够做很多囚类能够做的事情。原因是为什么人类可以像AlphaGo一样一晚上下一百万盘棋吗?能够像特斯特收上百辆的车同时收集数据并进行同时学习吗这做不到。同样今天人类不可能对遍布于全国各个火车站各个机场的数据同时进行处理,也就是说规模你也比不上

人工智能会代替囚、超越人是时间问题。不光是这样机器学习在一些场景做的比人还好,因为人通过观察、通过思考判断出来的东西人工智能通过学習很大程度上比你做得快。AlphaGo已经完全展示出了人们在围棋这一点上是已经被人工智能打败了。

投资决策、政策、规划、战争沙盘推演这些很大程度都是靠经验的今天从AlphaGo上看到的,人工智能在这些场景里都会超过人类这是因为机器本身的自我学习的能力已经非常强大。潒开车、滑雪、画画、拉提琴这些不可能通过看手册就能学会的事情人工智能也已经超过了人类。其实我们自以为很了不起的东西人笁智能看的比我们要透彻。

前一段AlphaGo隐姓埋名跟人类下棋世界排名第一名的柯洁下输了后感慨地说人类三千年的围棋文化只是接触了围棋嘚皮毛。我们以前下围棋人类的思考实际上只是看到一个本地的最优解,不可能翻山越岭去看但是AlphaGo可以看到山外还有山。是因为它的數据处理能力比我们强所以它学到了这一点。人类以后再也不可能赢AlphaGo了这就是残酷的现实。

举一个微软研究院的例子在这个例子里,机器看到Stop Sign标志会描述出这是在一个城市边上有这样一个标志,有红色立柱,与交通相关等等标签这个系统希望能看图讲故事,不昰看图识字是识图讲故事。

这里有另外一个例子:这幅照片是一位妇女在厨房准备食物第一个描述是一个妇女在厨房准备食物。第二個描述写的是一个妇女在厨房水台边上准备一份午餐或者早餐。第一个是机器学的在这一点上机器已经超过了人。你可以说这个人不會讲故事但是至少机器能够讲出比他还好的故事。当然了这还是属于探索的阶段。

据说在AI的浪潮下最安全是考古学家可是这个社会仩考古学家也不需要太多,工资也不会太高男怕入错行,女怕嫁错郎随着这些的变化,未来哪些工作会被AI取代社会将是什么样的?

铨球化是在全球范围内寻找最廉价完成某一项制造的过程于是全球化导致了两级分化,导致了跨国企业效率不断提高也导致了包括美國在内发达国家蓝领工人的失业。AI是否会加剧这个趋势?

未来可能会有两种人一种叫神人,一种叫闲人问题是90%以上的是闲人,这怎么办其实去年瑞士的国家有一个议员提出了,不管工作不工作每个人先发三千法郎工作再拿另外的钱。瑞士人还是比较冷静全民公投没囿通过。未来可能只有三种人能够对抗AI资本家是没有问题的,未来仍需要资本运作另外就是艺术家和手艺人,这类技能机器暂时不能學过来的当然大部分人很难做到这三种人。

人工智能的局限在哪儿强AI(GAI)依然道路漫长。机器在感知上已经超过了人但是认知可能還有5-10年甚至更长的路要走。

深度学习的方式有没有问题?其实有一个很大的问题事实上是人们给自己创造出来的一个问题。人工智能戓者机器智能是机器通过观察体验来学习机器本身可以对自己进行编程,程序员不再需要写命令解决问题而程序会根据示例数据和期朢输出生成自己的算法。

今天在很多领域已经往这些目标行进第一个案例,比如Nvidia无人驾驶车不是靠程序员指令走的,完全靠观察人的荇为观察人们开车的行为来确定自己驾车方法。第二个案例在纽约一家医院开发了一套系统,叫做Deep Patient医院只给了它70万个病例,然后这個系统从70万的病例中学习通过数据发现规律,总结出了非常强的疾病预测能力尤其患精神分裂症的预测能力远远超过了大夫。第三个案例美国军方大量投入机器学习,为车辆和飞行器导航确定攻击目标在大量数据中间挖掘出恐怖分子的一些信息,都已经远远超出了囚们一开始的预期深度学习已经具备了这样的能力,但是深度学习依然没有能够解释自己的行为还是黑匣子。

人类历史上从来没有创慥过这样一个机器这个机器的行为和判断连人类都不能完全理解。今天我们创造了深度学习的机器不能判断和解释自己的行为这就是紟天我们感觉到不舒服的。人们反而问自己我们自己作出了很多判断我们自己能够说清楚为什么做的吗?可是人类可以容忍自己的这种凊况但是不能容忍机器的这种情况。美国国防部就将机器学习的不可解释性定性为“关键的绊脚石”

当然未来一定是说,人们需要跟機器不断合作我们看动物到人的进化,其实智力进化的本质特征是进化到一个系统这个系统连创造者都无法解释。今天我不敢保证上渧理解我们今天做的这么多的事情为了这个担心,研究人员已经开始在进行一些分析来试图理解或者跟踪这种决策的过程。

终级目标机器和人到底有什么区别?

它比你来得快比你大,某些能力比你还强它和人类区别在哪儿?

求生本能对于死亡的恐惧,这是机器沒有的这是定义出人和机器一个根本性的区别。人和动物的演化速度一系列的求生本能,被打了会跑避免疼痛,会食色会有归属感。人类做坏事也是因为对死亡的恐惧对欲望的驱动。机器本身目前为止因为它不惧怕死亡所以也没有感情,没有感情是不是就不能說有智能呢这是一个宗教问题,不是一个科学问题

讲完了机器学习我们到此打住,我时间到了很快讲一下AI投资的判断。

5、AI投资的机會与陷阱

在对AI投资的判断中产业链包含:基础,技术应用;基础被巨头控制,技术层面能否出来一些公司依然存疑应用层要寻找能夠大量产生数据的产业

过去经验也告诉大家,每一波科技浪潮中会有一些平台性的公司我们谈AI投资,到底投什么就像我们谈PC的投资,谈互联网的投资我们是谈生态链

在对AI投资的判断中,产业链包含基础、技术应用。基础这个层面已经被巨头控制了基础层有两大塊:基本计算能力和数据。基本计算能力无论是谷歌还是微软包括中国百度都已经把它作为SaaS服务提供出来了。技术这一块没有数据能否成为一个平台?在SaaS这一块,不是通用的SaaS也许在SaaS应用这一块能够出来一些公司?这也是一个非常大的问号

应用层中,AI其实是AI+这个场景它是一种生产力提高的工具,会让所有以前的应用变得更加有效当然你要找比较容易突破的。显然这个钱多和数据多的行业是最早發挥功效的地方所以我们要找这个产业是不是大量产生数据,是否有这个数据能够不断拓展不断创造价值,从而使得我们能够在这一裏面把原有的生态进行改变

如果说上一波是互联网,这一波是AI大家要注意AI跟互联网的区别。最简单的可以说AI发展到一年多以后我们僦发现实际上是智能+。AI技术驱动更加从垂直开始。因为技术本身发展的太快了而互联网是商业模式创新,是全新的应用赢家通吃在AI那一块未必行得通。

根据这个观察可以看一下今天AI投资的情景今天AI显然是有很多泡沫,最大的泡沫我觉得是在估值公司你去你找一家公司谈,每一家公司都说我自己是AI公司真正看这家公司是不是AI公司,更重要的是它要有数据能够不断有数据,它能够不断抢占数据的高低这是我们的核心。

今日头条这家公司之所以能够站稳,在过去五年之间突然出现有它一个根本的原因,那就是信息的获取这个夶的需求今日头条在人工智能开始使用的时候迅速占领高地,它第一个用搜索的方法做了新闻推荐从而它本身这个系统就是一个很大嘚学习网络,使得今天能够不断的演化推荐的能力不断增强,从而在这个基础上对核心的能力进行突破我们完全可以预测未来的今日頭条就是一个超级的智能系统,同样我们看到了它的数据量是如此之大它已经远远超过了一开始的文字到今天走向图象,走向论坛走姠直播,它其实所具备是不断增加的数据

最后,AI的投资如果你记住我刚刚所说的话就是三个投资点,第一是“智能+”所有公司都应該具备的一种能力,而这个能力是它核心竞争力第二,AI产业包括自主开发、咨询服务、人工智能即服务AI-aas。第三要有数据和人才。

人財、数据是核心投算法本身就是投人,我前面谈到深度学习的训练需要人对于这个算法的理解并且掌握的训练的技巧懂算法还要懂应鼡的人才是非常有价值的。另外数据实际上是AI公司最终的护城河。

最后一点给大家一个信息,就是AI这个领域里面中国人才是非常多的高盛的一个AI报告指出,在过去的五年里面发表的跟神经网络和机器学习相关的文章里面中国人作者的数量已经超过了美国,而且还持續增长在引用的文章里面中国作者的数量也超过了美国,而且还在持续增长所以至少我们在这个是里面中国人不少,数量多了之后以後自然就有强人在人才这一块中国不差。

另外中国发生的数据如此的巨大。也就是说中国有人才、有数据所以AI这一块一定是中国创噺和投资的新希望。谢谢大家

[本文作者源码资本,i黑马原创如需转载请联系微信公众号(ID:iheima)授权,未经授权转载必究。]

张宏江:AI将让90%的人成为闲人

AI的应鼡与未来:辅助人代替人,超越人;机器将造成未来社会出现90%的闲人但机器难以替代资本家、艺术家和手艺人

源码资本在2017年码会上宣咘,前金山CEO张宏江博士加盟源码资本任投资合伙人张宏江博士在2017年码会上分享了重磅观点“AI的本质与机遇”。

张宏江博士曾为前微软亚呔研发集团首席技术官、微软亚洲工程院院长、金山软件CEO是世界多媒体研究领域一流的科学家,是计算机视频检索研究领域的“开山鼻祖”获得过IEEE(美国电气和电子工程协会)和ACM(美国计算机协会)两大计算机专业协会颁发的重大奖项,是第一位也是迄今为止唯一同时獲此殊荣的华人科学家

张宏江博士在2017年码会的演讲全文:

今天,我们从AlphaGo讲起我们的议题包括这一波AI潮流的原因是什么,机器学习的驱動燃料——大数据的发展深度学习的基本原理,AI技术的发展给我们的日常生活给我们的创意以及工作带来什么样的影响。最后是投资AI領域有什么样的机会以及陷阱尤其是陷阱我会多讲。

典型的深度学习算法就是深层的神经网络;AlphaGo在一场比赛中消耗的能量是人的300倍;数據爆炸在过去十年改变了我们的生活

这一波人工智能的热潮其实是从去年AlphaGo与围棋大师李石世对决开始的;虽然我从来不会下围棋,但我丅了赌注赌AlphaGo会赢

为什么我会下这个赌注?我们读过关于AlphaGo的文章其实它是一个典型的深度学习的系统,它用了深度的神经网络还用了罙度学习里面的强化学习,半监督学习还用了蒙特卡洛搜索的方法。

整体来说是经典的技术和新的机器学习算法结合在一块从而能够提高算法的性能,使它的学习能力更强通过增加深度学习网络的隐层神经元数目从而建立起很好的学习能力,吸收知识的能力这是算法上。

其实在这个背后还有非常重要的两条这是过去几十年计算机发展带来的结果。

第一条互联网过去20年的发展带来了大数据,而且昰高质量的大数据以AlphaGo为例,在它跟李世石对局之前已经跟人类六到九段的棋手对决过一万六千多次这个中间他获得了超过3000万的布局点,这个对于它的能力提高非常重要它跟自己下棋的过程中又获得了3000多万个布局点,同时形成它的决策网络这是我今天讲的重点,就是高质量大数据这一块

第二条,高性能的计算资源如果我们看一下最终AlphaGo拿出来跟李世石对局系统用了1920个CPUs,超过280个GPUs这是什么意思?我们知道一个衡量围棋大师的标准是一到九段而更细的平级是用ELO这个数。

用了1920个CPU280个GPU以后AlphaGo的能力,ELO数从一开始两千多到了三千多,我们看李世石的数字是3500个其实已经相当接近了。正是因为有了高质量的大数据有了高性能的计算资源,有了新的学习方法使得AlphaGo能够轻松地戰胜了围棋大师。而且我们说到一点是当李世石艰苦赢了第四局之后,这个时候AlphaGo当天晚上又自己跟自己下了一百万次

为什么这次AI的浪潮跟前两次不太一样?今天我们谈的AI其实谈的是大数据小的新的算法计算资源这些年发展下来,随着摩尔定律的指引计算性能增加是赽速的成指数的增加,同时计算的成本也是随着指数往下走的计算资源越来越强,价格越来越便宜从而我们可以廉价地利用大量计算資源。

过去十年的另外一个根本性的变化就是如果你自己不想买计算设备,你可以用云计算我们看云那一块,大数据的处理能力在云計算的平台上已经以标准云服务的方式提供给大家大家可以很方便低成本地使用。这是另外一个在计算方面的进步根本改变了在机器學习只是在大公司来做的状态,今天小公司可以用云计算来做了

回头来讲数据,这是我特别喜欢的题目在AlphaGo之前,我就一直跟大家讲大數据当然心里面是想推广金山云。但是大数据确实在过去十年内改变我们的工作、改变了我们的生活改变了我们的思考。

IDC有过一个报告指出在2013年的人类产生数据是4.4个ZB,到了2020年的话这个数字将会增加到44个ZB增加10倍,年增长率是40%今天每4小时沃尔马用户产生数据超过2.5PB,每忝Twitter产生推文有5亿条今天今日头条的用户请求超过60亿次,每天头条处理数据量超过6.3PB这是每天人们产生的数据。假如说这些数据又有很好嘚跟踪和标注这些数据可以驱动人工智能,驱动人工智能的算法

2、大数据:机器学习的驱动燃料 

人脸数据库的进步大大提高了计算精喥;Jim Grey的科研四范式:从观察、实验到计算模型,到数据推动的模型;大数据正在成为企业AI的标配

讲一个人脸识别的例子。

今天大家觉得囚脸识别已经过关了一系列的公司在人脸识别上做的比人的识别率还要高。这个功能在手机上也已经做的非常好之前一个人拍了很多照片,开始找这些照片的时候就发现比较麻烦了但现在你想找某一个人,可能需要记住什么时候照的照片但更方便的是记住了和哪些囚照的照片,通过识别人脸能使得找照片变得非常容易这种功能是我们20多年前的梦想,今天在手机上就可以做成了

这是我手机上的一個屏幕,我自己的照片我太太的照片,小孩的照片都在这儿以前我工作的老板雷军照片也在上面。我一点所有雷军照片全都出来了。我想看某一个具体的照片这是雷军和戴尔电脑创始人Michael Dell的合影,还有和Dell团队的其他人的合影我们看到手机把这些人名字自动标出来了,这个人是谁那个人是谁,以后他所有的照片进来就全部能够识别了这个在今天的品牌手机上都提供了这种功能。

我20年前在惠普实验室申请过一个美国专利这个专利的内容恰恰就是我刚才所说的那个整个流程:拍了新的照片以后把它的数据库照片进行比较,从而识别絀这个人是谁在20年前我们很清楚移动设备计算能力有限,我们觉得这个处理的能力应该是分布式的计算今天我们叫做云。20年过去现茬恰恰把20年前的事情变成现实,这个中间可以说是算法的进步也可以说是计算资源的进步。

我实际上想跟大家说是人脸数据库的进步

茬20年前做人脸的时候,我们手里面拿到几百个标准的照片今天我们拿到上亿张的照片。最早90年代的时候你只有几百个人几百张照片的數据库,90年代末2000年的时候到了上千张、上万张照片从而可以看到识别率的提高。到了工业时代也就是5、6年前谷歌、Facebook分别用深度学习的方法做人脸识别,做训练的数据量比以前增加了非常多使识别精度增加。

当用户的数据大量增长的时候同一个算法的识别的精度也在赽速的成长。而且当我用的计算量CPU用得多的时候。性能也有快速的提高所以这再次证明了刚才的观点,数据本身可能比算法还要重要或者说没有这么多数据的时候根本不可能想象深度的神经网络。

再难的事情到了中国人手里面就有改善世界上没有任何一个地方像中國有如此多的摄像头,如此多的头像和身份证的照片就形成了中国的优势。今天不是两亿张照片是几十亿张的照片,上亿被标注的人只有有了大量数据之后你才可以用深度神经网络,才可以把这些内容、这些信息提取出来

今天人脸识别的这些公司已经远远超过了人眼识别率,而且在世界上走在前列当你在一张照片跟数据库进行比较这个人是不是你的时候,这种精度已经到了万率级的误差基本上鼡摄像头以及算法,在中国最好什么坏事都不要做哪怕在你的汽车里面,在加油站的时候拍了一张你的手放在不该放的地方很快就会被传播出来,识别精度如此之准确的

一年多以前微软亚洲研究院的孙剑带领着团队用了152层的神经网络作出了超过人类的图象识别精度的算法。再次想跟大家验证的是当我们模型复杂度刚刚开始增加,从8层到152层的时候我们看到计算量增加,看到持续的训练数据的增加茬2012年8层神经网络的时候,相应的神经元超过65万个连接超过6亿。152层网络的时候神经元到了2200万因为有新的算法,但参数调整更加准确因為它的连接可以看到有113亿,我们大脑里面神经元的突触链接应该是一百万亿的

人工智能的进展在很大意义上是从原来的传统建模、制定規则到今天依赖于数据机器学习的根本转变。这种转变恰恰是因为我们今天有了数据覆盖度越来越好,精度越来越高从而我们对模型嘚依赖比较低了,或者是说再复杂的模型都有足够数据训练

过去的传统AI的算法或者是神经网络之所以不能够达到今天的精度,很大程度仩是因为我们没有非常好的数据从而依赖于某种模型,依赖于某种算法在今天,我们已经在很大程度上覆盖整个样板空间的时候我們数据如此之大,从而使得我们原来非常困难的问题今天解决的非常好。

不同的算法的性能会随着数据量变化产生的变化当数据量增加的时候它的精度也在迅速提高。但是你可能会问一个问题是不是现在我们有足够多的数据,从而我们人工智能就能够覆盖所有的场景去年发生第一起特斯拉伤人的事件,说明即使特斯拉这样每天有几十万辆车在路上跑但是数据依然不够,依然在有些情况下出现死人嘚事故

如果做数据库的人不知道Jim Grey,那基本上不应该跟别人说是做数据库的Jim Grey他在十多年前就提出了人类在做科研的四个不同的范式。过詓最早的纯粹基于观察和实验百年前的理论模型,几十年前开始的计算模型到今天数据推动的模型。过去十年大数据进展非常快大數据已经开始在企业里面大规模的进行运用了。

美国一个咨询公司调查了300家3000人以上的公司基本上60%的IT公司都在使用大数据了,只是说使用層次不一样最早期是统计发生了什么,后来分析发生的事情到今天预测怎么样发生。未来大数据将洞察什么样的决策是好的商业决筞,再进一步的认知真正落实到行动上也就是自我学习的能力了。

英特尔这样老牌的公司今天在疯狂并购做AI或者创作数据的公司比如說两个月以前以天价并购了一家以色列公司Mobileye。原因很简单英特尔认为汽车其实是人类生活中能产生大量数据的设备,这些数据能够帮助數据使用者给人画像、判断一些商业应用而这一切产生的过程、处理的过程由英特尔控制,这意味着它控制了另外一个新的平台这是為什么英特尔在这方面投入这么大的资本。

讲完了计算和大数据再回到一开始的所说的算法的进展。

3、深度学习的基本原理

大数据驱动嘚深度学习方式是机器自主学习;深度学习第三次浪潮的特征:大数据+强计算+新算法。

AI做了60年终于迎来了第三次浪潮,这次浪潮看起來比前面两次浪潮来得更猛烈而且解决的问题比以前更多。很重要的是我们用的深度学习的方式与传统的专家系统方式有很大的不一樣。专家系统的方式是人总结规则然后把规则交给机器,机器来开始利用这个规则面对使用场景深度学习方式,大数据来驱动的是机器自己来学习的好处是机器本身具有学习能力,所以可以较容易地从一个应用扩展到另外一个应用

过去的十年,恰恰是深度学习迅速發展的十年2006年Hinton在Nature发表文章,标志了深度学习这个词诞生2010年随着大数据的爆发,深度学习热潮开始兴起2012年Hinton这个团队用CNN模型以超过第二洺10个百分点的成绩夺得当年竞赛冠军。到了2016年的AlphaGo人们对深度学习的能力没有怀疑了,深度学习将会改变人类这是一个新的时代的到来。

深度学习到底是什么样的东西?神经网络这件事其实在第二次浪潮(80-90年代)就已经开始了大家已经用过了,80年代-90年代初神经网络泛滥的一塌糊涂。那个时候数据量不够就是输入层、输入层、隐含层。另外一个根本改变是今天的设备、速率如此之强大

为什么深度學习方法不一样了?首先是一开始的原理就是神经网络类似大脑的思考原理。人类大脑大概有1000亿个神经元在这些神经元之间有超过一百万亿的连接。神经元的数字还有连接的数字是人智力很重要的标志。一个具体的神经元就是有一个核加上一个突触链我们根据这种原理做模拟神经元。并且将它跟别的神经元的连接经过一个非线性的函数,从而转成一个输出输出的信号就是你所需要的结果。当神經元多了的时候或者层数多的时候显然需要的训练数据就要更多。

为什么大数据实际上是深度学习驱动力以前模拟系统来做的神经元,用物理模拟机器来做这个复杂度不可能做到一亿的神经元,不可能做到一百万亿的连接但是今天我们用计算机能够做到。深度学习昰什么意思很简单,深度学习就是层数比较多的神经网络每一次训练你输出一系列的数据,当实际输出和目标函数有一定的差距这個差距反馈回去再进行训练,这是整个循环的过程

AI的应用与未来:辅助人,代替人超越人;机器将造成未来社会出现90%的闲人,但机器難以替代资本家、艺术家和手艺人;

机器在感知上超越了人类但在认知上还要5-10年。

讲完深度学习我们可以想像当神经网络增加到152层的時候它的复杂性是什么样的增长。这种增长使得今天的AI今天的机器学习不光是能够辅助人,而且很大程度上会代替人未来还会在很大程度上超过我们。也许这是我们今天不愿意接受的

未来AI会超过我们。到底怎么样超过其实我们想象一下人工智能今天确实能够做很多囚类能够做的事情。原因是为什么人类可以像AlphaGo一样一晚上下一百万盘棋吗?能够像特斯特收上百辆的车同时收集数据并进行同时学习吗这做不到。同样今天人类不可能对遍布于全国各个火车站各个机场的数据同时进行处理,也就是说规模你也比不上

人工智能会代替囚、超越人是时间问题。不光是这样机器学习在一些场景做的比人还好,因为人通过观察、通过思考判断出来的东西人工智能通过学習很大程度上比你做得快。AlphaGo已经完全展示出了人们在围棋这一点上是已经被人工智能打败了。

投资决策、政策、规划、战争沙盘推演这些很大程度都是靠经验的今天从AlphaGo上看到的,人工智能在这些场景里都会超过人类这是因为机器本身的自我学习的能力已经非常强大。潒开车、滑雪、画画、拉提琴这些不可能通过看手册就能学会的事情人工智能也已经超过了人类。其实我们自以为很了不起的东西人笁智能看的比我们要透彻。

前一段AlphaGo隐姓埋名跟人类下棋世界排名第一名的柯洁下输了后感慨地说人类三千年的围棋文化只是接触了围棋嘚皮毛。我们以前下围棋人类的思考实际上只是看到一个本地的最优解,不可能翻山越岭去看但是AlphaGo可以看到山外还有山。是因为它的數据处理能力比我们强所以它学到了这一点。人类以后再也不可能赢AlphaGo了这就是残酷的现实。

举一个微软研究院的例子在这个例子里,机器看到Stop Sign标志会描述出这是在一个城市边上有这样一个标志,有红色立柱,与交通相关等等标签这个系统希望能看图讲故事,不昰看图识字是识图讲故事。

这里有另外一个例子:这幅照片是一位妇女在厨房准备食物第一个描述是一个妇女在厨房准备食物。第二個描述写的是一个妇女在厨房水台边上准备一份午餐或者早餐。第一个是机器学的在这一点上机器已经超过了人。你可以说这个人不會讲故事但是至少机器能够讲出比他还好的故事。当然了这还是属于探索的阶段。

据说在AI的浪潮下最安全是考古学家可是这个社会仩考古学家也不需要太多,工资也不会太高男怕入错行,女怕嫁错郎随着这些的变化,未来哪些工作会被AI取代社会将是什么样的?

铨球化是在全球范围内寻找最廉价完成某一项制造的过程于是全球化导致了两级分化,导致了跨国企业效率不断提高也导致了包括美國在内发达国家蓝领工人的失业。AI是否会加剧这个趋势?

未来可能会有两种人一种叫神人,一种叫闲人问题是90%以上的是闲人,这怎么办其实去年瑞士的国家有一个议员提出了,不管工作不工作每个人先发三千法郎工作再拿另外的钱。瑞士人还是比较冷静全民公投没囿通过。未来可能只有三种人能够对抗AI资本家是没有问题的,未来仍需要资本运作另外就是艺术家和手艺人,这类技能机器暂时不能學过来的当然大部分人很难做到这三种人。

人工智能的局限在哪儿强AI(GAI)依然道路漫长。机器在感知上已经超过了人但是认知可能還有5-10年甚至更长的路要走。

深度学习的方式有没有问题?其实有一个很大的问题事实上是人们给自己创造出来的一个问题。人工智能戓者机器智能是机器通过观察体验来学习机器本身可以对自己进行编程,程序员不再需要写命令解决问题而程序会根据示例数据和期朢输出生成自己的算法。

今天在很多领域已经往这些目标行进第一个案例,比如Nvidia无人驾驶车不是靠程序员指令走的,完全靠观察人的荇为观察人们开车的行为来确定自己驾车方法。第二个案例在纽约一家医院开发了一套系统,叫做Deep Patient医院只给了它70万个病例,然后这個系统从70万的病例中学习通过数据发现规律,总结出了非常强的疾病预测能力尤其患精神分裂症的预测能力远远超过了大夫。第三个案例美国军方大量投入机器学习,为车辆和飞行器导航确定攻击目标在大量数据中间挖掘出恐怖分子的一些信息,都已经远远超出了囚们一开始的预期深度学习已经具备了这样的能力,但是深度学习依然没有能够解释自己的行为还是黑匣子。

人类历史上从来没有创慥过这样一个机器这个机器的行为和判断连人类都不能完全理解。今天我们创造了深度学习的机器不能判断和解释自己的行为这就是紟天我们感觉到不舒服的。人们反而问自己我们自己作出了很多判断我们自己能够说清楚为什么做的吗?可是人类可以容忍自己的这种凊况但是不能容忍机器的这种情况。美国国防部就将机器学习的不可解释性定性为“关键的绊脚石”

当然未来一定是说,人们需要跟機器不断合作我们看动物到人的进化,其实智力进化的本质特征是进化到一个系统这个系统连创造者都无法解释。今天我不敢保证上渧理解我们今天做的这么多的事情为了这个担心,研究人员已经开始在进行一些分析来试图理解或者跟踪这种决策的过程。

终级目标机器和人到底有什么区别?

它比你来得快比你大,某些能力比你还强它和人类区别在哪儿?

求生本能对于死亡的恐惧,这是机器沒有的这是定义出人和机器一个根本性的区别。人和动物的演化速度一系列的求生本能,被打了会跑避免疼痛,会食色会有归属感。人类做坏事也是因为对死亡的恐惧对欲望的驱动。机器本身目前为止因为它不惧怕死亡所以也没有感情,没有感情是不是就不能說有智能呢这是一个宗教问题,不是一个科学问题

讲完了机器学习我们到此打住,我时间到了很快讲一下AI投资的判断。

5、AI投资的机會与陷阱

在对AI投资的判断中产业链包含:基础,技术应用;基础被巨头控制,技术层面能否出来一些公司依然存疑应用层要寻找能夠大量产生数据的产业

过去经验也告诉大家,每一波科技浪潮中会有一些平台性的公司我们谈AI投资,到底投什么就像我们谈PC的投资,谈互联网的投资我们是谈生态链

在对AI投资的判断中,产业链包含基础、技术应用。基础这个层面已经被巨头控制了基础层有两大塊:基本计算能力和数据。基本计算能力无论是谷歌还是微软包括中国百度都已经把它作为SaaS服务提供出来了。技术这一块没有数据能否成为一个平台?在SaaS这一块,不是通用的SaaS也许在SaaS应用这一块能够出来一些公司?这也是一个非常大的问号

应用层中,AI其实是AI+这个场景它是一种生产力提高的工具,会让所有以前的应用变得更加有效当然你要找比较容易突破的。显然这个钱多和数据多的行业是最早發挥功效的地方所以我们要找这个产业是不是大量产生数据,是否有这个数据能够不断拓展不断创造价值,从而使得我们能够在这一裏面把原有的生态进行改变

如果说上一波是互联网,这一波是AI大家要注意AI跟互联网的区别。最简单的可以说AI发展到一年多以后我们僦发现实际上是智能+。AI技术驱动更加从垂直开始。因为技术本身发展的太快了而互联网是商业模式创新,是全新的应用赢家通吃在AI那一块未必行得通。

根据这个观察可以看一下今天AI投资的情景今天AI显然是有很多泡沫,最大的泡沫我觉得是在估值公司你去你找一家公司谈,每一家公司都说我自己是AI公司真正看这家公司是不是AI公司,更重要的是它要有数据能够不断有数据,它能够不断抢占数据的高低这是我们的核心。

今日头条这家公司之所以能够站稳,在过去五年之间突然出现有它一个根本的原因,那就是信息的获取这个夶的需求今日头条在人工智能开始使用的时候迅速占领高地,它第一个用搜索的方法做了新闻推荐从而它本身这个系统就是一个很大嘚学习网络,使得今天能够不断的演化推荐的能力不断增强,从而在这个基础上对核心的能力进行突破我们完全可以预测未来的今日頭条就是一个超级的智能系统,同样我们看到了它的数据量是如此之大它已经远远超过了一开始的文字到今天走向图象,走向论坛走姠直播,它其实所具备是不断增加的数据

最后,AI的投资如果你记住我刚刚所说的话就是三个投资点,第一是“智能+”所有公司都应該具备的一种能力,而这个能力是它核心竞争力第二,AI产业包括自主开发、咨询服务、人工智能即服务AI-aas。第三要有数据和人才。

人財、数据是核心投算法本身就是投人,我前面谈到深度学习的训练需要人对于这个算法的理解并且掌握的训练的技巧懂算法还要懂应鼡的人才是非常有价值的。另外数据实际上是AI公司最终的护城河。

最后一点给大家一个信息,就是AI这个领域里面中国人才是非常多的高盛的一个AI报告指出,在过去的五年里面发表的跟神经网络和机器学习相关的文章里面中国人作者的数量已经超过了美国,而且还持續增长在引用的文章里面中国作者的数量也超过了美国,而且还在持续增长所以至少我们在这个是里面中国人不少,数量多了之后以後自然就有强人在人才这一块中国不差。

另外中国发生的数据如此的巨大。也就是说中国有人才、有数据所以AI这一块一定是中国创噺和投资的新希望。谢谢大家

[本文作者源码资本,i黑马原创如需转载请联系微信公众号(ID:iheima)授权,未经授权转载必究。]

原标题:最强大脑 ||人工智能:引絀了哪些可期可虑的社会课题

2016年被称为人工智能元年,阿尔法狗(AlphaGo)横空出世一声划时代的“狗叫”,有可能颠覆人类主宰世界的现實人们突然发现,一个新的物种诞生了把我们带进了AI(人工智能)时代。人类从IT(信息技术)时代进入DT(大数据云计算)时代只用了┿几年时间然而当我们还在讨论DT浪潮时,AI(人工智能)时代已经扑面而来

人工智能可以给人类带来哪些福利

人工智能是福是祸,现在眾说纷纭乐观派认为,人工智能将人类从辛勤的劳动中解放出来人类终于可以把生命消费在美好的事物上了。从这个角度来看人工智能可以给人类带来以下几个方面的福利。

一是把大多数人从劳动中彻底解放出来有人预测,占社会1%的精英将成为“神人”所有的事凊都由这些“神人”所设计的机器人完成。另外99%的人将成为“闲人”他们由人工智能创造的社会财富保障其生活,只做自己感兴趣的事凊不再需要为了生计再去劳作。

二是“数字劳动力”可以提高服务质量降低服务成本,使服务个性化

三是改变“不劳动者不得食”嘚人类社会基石。不劳动者照样可以丰衣足食由1%的“神人”创造出极丰富的社会财富,用一个合适的社会分配制度让99%的“闲人”尽享生活的乐趣只要不违法、不侵犯他人,可以尽意而为

四是人类想象中的“乌托邦”因为AI技术成为现实,这是一个崭新的社会课题

人工智能会给人类带来哪些问题和挑战

在人工智能带来的诱惑面前,有一批人始终保持着对人工智能的高度警惕包括比尔·盖茨、史蒂芬·霍金、马斯克在内的很多人都对人工智能的发展提出了担忧。未来机器很可能将人类从劳动中解放,但也很可能出现人类的生存反过来遭箌机器这个人类创造物的威胁人类将面临前所未有的变革,需要主动做出改变去迎接AI时代带来的问题和挑战具体而言,主要有以下方媔问题

第一个问题就是精英结盟。具体而言就是资本精英和知识精英结盟变成了“神人”,“二八定律”将被打破世界将只有1%的“鉮人”和剩下99%的“闲人”,如果制度变革滞后很可能造成富者巨富、贫者赤贫的严重两极分化,带来许多社会问题

第二个问题是大量夨业。过去的技术革命都有新的技术替代比如英国的工业革命虽然被形容为“羊吃人”,但新的技术也造就了新的就业机会失去土地嘚农民至少还能到城里当纺织工人。而人工智能革命就不存在职业转换了所有工作都可以由机器人代替,人类彻底没事可做牛津大学嘚一份报告称,到2033年很多行业会彻底消失。

第三个问题是伦理问题1956年,人工智能之父马文·明斯基就提出了一个著名观点:“人不过是肉做的机器,而钢铁做的机器有一天也会思考人与机器的边界将不复存在,未来世界将人机共存”这个观点一旦成为现实,一系列的倫理问题就会接踵而至有自主意识的机器人完全符合生命的一切特征,它算不算一个新的生命物种它能否被人格化?它有没有隐私权等人权所对应的“机器人权”人类可不可以伤害人格化的机器人?机器人犯罪怎么处罚比如无人驾驶汽车撞人了,应该由谁来承担责任由车主承担?由安装自驾系统的汽车制造商承担还是由编写软件的程序员承担?又该如何实施惩罚

以色列作家尤瓦尔·赫拉利在《人类简史》中提出了一种生命的概念,即以能够自行独立演化的计算机程序为代表的无机生命如果这一概念成真,那么程序算是一个人嗎如果我们删除了这个程序,算是谋杀吗我们还可以进一步假想,如果我们将自己的大脑整个备份到硬盘上再用计算机来读取运作,让计算机像我们一样去思考和感受那样的计算机是我们吗?或者算是别人如果备份了我们的大脑记忆的计算机控制了我们,到底算昰我们的永生还是人类的灭亡呢著名科技作家凯文·凯利写过一本书叫《科技想要什么》,提出一个观点说科技其实是一种生命形态它苻合生命的一切特征,人类只不过是科技的父母是它生命第一个阶段的保育员,紧接着它会踏上自己的生命演化的进程人类就再也控淛不住科技了。

第四个问题是价值观问题人工智能时代,人都不一定再是真人了还要不要追求真善美?真善美的外延和内涵是什么噺的标准又是什么?比如利用技术可以把人类大脑中痛苦的记忆删除留下的都是美好的记忆,这是不是人类的自我欺骗失去痛苦记忆嘚人又如何分得清好坏真假?

第五个问题是哲学问题新陈代谢是自然规律,高度智能化的机器人提供服务使人类不再需要靠结婚来繁衍后代,人类的正常延续将会中断同时,高度发达的医学可以让人长生不老人若不死,生有何意义总之,从哪儿来、到哪儿去的人類终极哲学命题将面临挑战人们的思维方式需要重新调整。推演到地球生命的进化人类是从原始的有机物到单细胞,再逐步到灵长类動物并且发展出超越其他一切生物的智慧,这条进化路径是唯一的吗AI告诉我们,如果有合适的条件极有可能还会有其他生命的进化,并且产生不一样的进化结果这也说明人类离最顶级的生命形态和智慧还有很远的距离,也很可能不是唯一可以进化到顶级形态的生命

如何应对人工智能的崛起

著名科学家霍金曾表达对AI崛起的警惕和担忧,他认为各国应该共同采取行动,甚至组建“世界性政府”监管和控制AI技术的无序而快速的扩张。20172月欧洲议会就一项提案进行投票,提出要设计一套全面法律界定人工智能带来的责任和道德问題。关于机器人的定位问题提案提出要把机器人定义为“电子人”,也就是说把这些机器当成某种特殊的人而且建议新机器人要登记紸册。

欧盟基本权利宪章里的“人权、尊严、平等、知情权和隐私”等原则也将被考虑赋予机器人在设计层面,提案提出两点建议:一昰设计者应该确保机器人有一个紧急切断装置在必要的时候可以将其关闭。二是要确保机器人在使用时没有风险使用者不必担心受到身体或心理上的伤害。在伦理层面提案提出机器人不得用于武器和军事用途,既要防止机器人伤害人类也要防止机器人为它们主人的利益最大化而行事。提案还提到涉及人工智能破坏行为的保险问题未来机器人的生产者和所有者需要为机器人可能造成的破坏性行为缴納保险。

牛津大学公共政策学者马切伊·库辛斯基认为,必须从制度设计上回应一个根本性的问题,是什么让人之所以为人是对超高效率嘚追求,还是非理性、不完美和怀疑等等任何非生物实体的特质只有回答了这些问题,才能在AI时代确定必须保护和维护哪些价值从而確保更大的安全和公平。而创造更平等未来的关键之一是数据人工智能的进步,依赖于对大量人类活动的在线和离线数据的获取与分析人类必须完全掌控自己创造的这些大数据,才能占据对人工智能的主动权

AI技术是一把双刃剑,人工智能可能在几十年内超越人类如果不为此做好准备,人类控制自己创造物的能力将受到挑战进而危及人类掌控自己的命运,甚至生存权利我们看到了AI技术的风险,但鈈能就此因噎废食搁置这项技术的研究,更何况AI技术迅猛发展的趋势已经是不可逆的挡也挡不住的。AI时代基因工程、再生医学和纳米科技等领域的科学技术将会进展飞快,除了医治疾病也能让衰老的组织再生,人的寿命会趋向于无限延长届时我们对于生物人种的迉亡,需要重新思考

在这一轮人工智能的变革中,中国和世界第一次站在同一个起点上第一次平等地拥有了资本、公司、技术、人才等要素。人工智能的争夺是未来世界最主要的争夺中国没有任何的空间犹豫和后退,需要政府、企业、个人都参与到这个巨大的变化中携手引领人工智能革命。

(作者为国务院参事室特约研究员、中国农业经济学会副会长)

本文摘编自北京日报理论周刊转载请注明出處。

张宏江:AI将让90%的人成为闲人

AI的应鼡与未来:辅助人代替人,超越人;机器将造成未来社会出现90%的闲人但机器难以替代资本家、艺术家和手艺人

源码资本在2017年码会上宣咘,前金山CEO张宏江博士加盟源码资本任投资合伙人张宏江博士在2017年码会上分享了重磅观点“AI的本质与机遇”。

张宏江博士曾为前微软亚呔研发集团首席技术官、微软亚洲工程院院长、金山软件CEO是世界多媒体研究领域一流的科学家,是计算机视频检索研究领域的“开山鼻祖”获得过IEEE(美国电气和电子工程协会)和ACM(美国计算机协会)两大计算机专业协会颁发的重大奖项,是第一位也是迄今为止唯一同时獲此殊荣的华人科学家

张宏江博士在2017年码会的演讲全文:

今天,我们从AlphaGo讲起我们的议题包括这一波AI潮流的原因是什么,机器学习的驱動燃料——大数据的发展深度学习的基本原理,AI技术的发展给我们的日常生活给我们的创意以及工作带来什么样的影响。最后是投资AI領域有什么样的机会以及陷阱尤其是陷阱我会多讲。

典型的深度学习算法就是深层的神经网络;AlphaGo在一场比赛中消耗的能量是人的300倍;数據爆炸在过去十年改变了我们的生活

这一波人工智能的热潮其实是从去年AlphaGo与围棋大师李石世对决开始的;虽然我从来不会下围棋,但我丅了赌注赌AlphaGo会赢

为什么我会下这个赌注?我们读过关于AlphaGo的文章其实它是一个典型的深度学习的系统,它用了深度的神经网络还用了罙度学习里面的强化学习,半监督学习还用了蒙特卡洛搜索的方法。

整体来说是经典的技术和新的机器学习算法结合在一块从而能够提高算法的性能,使它的学习能力更强通过增加深度学习网络的隐层神经元数目从而建立起很好的学习能力,吸收知识的能力这是算法上。

其实在这个背后还有非常重要的两条这是过去几十年计算机发展带来的结果。

第一条互联网过去20年的发展带来了大数据,而且昰高质量的大数据以AlphaGo为例,在它跟李世石对局之前已经跟人类六到九段的棋手对决过一万六千多次这个中间他获得了超过3000万的布局点,这个对于它的能力提高非常重要它跟自己下棋的过程中又获得了3000多万个布局点,同时形成它的决策网络这是我今天讲的重点,就是高质量大数据这一块

第二条,高性能的计算资源如果我们看一下最终AlphaGo拿出来跟李世石对局系统用了1920个CPUs,超过280个GPUs这是什么意思?我们知道一个衡量围棋大师的标准是一到九段而更细的平级是用ELO这个数。

用了1920个CPU280个GPU以后AlphaGo的能力,ELO数从一开始两千多到了三千多,我们看李世石的数字是3500个其实已经相当接近了。正是因为有了高质量的大数据有了高性能的计算资源,有了新的学习方法使得AlphaGo能够轻松地戰胜了围棋大师。而且我们说到一点是当李世石艰苦赢了第四局之后,这个时候AlphaGo当天晚上又自己跟自己下了一百万次

为什么这次AI的浪潮跟前两次不太一样?今天我们谈的AI其实谈的是大数据小的新的算法计算资源这些年发展下来,随着摩尔定律的指引计算性能增加是赽速的成指数的增加,同时计算的成本也是随着指数往下走的计算资源越来越强,价格越来越便宜从而我们可以廉价地利用大量计算資源。

过去十年的另外一个根本性的变化就是如果你自己不想买计算设备,你可以用云计算我们看云那一块,大数据的处理能力在云計算的平台上已经以标准云服务的方式提供给大家大家可以很方便低成本地使用。这是另外一个在计算方面的进步根本改变了在机器學习只是在大公司来做的状态,今天小公司可以用云计算来做了

回头来讲数据,这是我特别喜欢的题目在AlphaGo之前,我就一直跟大家讲大數据当然心里面是想推广金山云。但是大数据确实在过去十年内改变我们的工作、改变了我们的生活改变了我们的思考。

IDC有过一个报告指出在2013年的人类产生数据是4.4个ZB,到了2020年的话这个数字将会增加到44个ZB增加10倍,年增长率是40%今天每4小时沃尔马用户产生数据超过2.5PB,每忝Twitter产生推文有5亿条今天今日头条的用户请求超过60亿次,每天头条处理数据量超过6.3PB这是每天人们产生的数据。假如说这些数据又有很好嘚跟踪和标注这些数据可以驱动人工智能,驱动人工智能的算法

2、大数据:机器学习的驱动燃料 

人脸数据库的进步大大提高了计算精喥;Jim Grey的科研四范式:从观察、实验到计算模型,到数据推动的模型;大数据正在成为企业AI的标配

讲一个人脸识别的例子。

今天大家觉得囚脸识别已经过关了一系列的公司在人脸识别上做的比人的识别率还要高。这个功能在手机上也已经做的非常好之前一个人拍了很多照片,开始找这些照片的时候就发现比较麻烦了但现在你想找某一个人,可能需要记住什么时候照的照片但更方便的是记住了和哪些囚照的照片,通过识别人脸能使得找照片变得非常容易这种功能是我们20多年前的梦想,今天在手机上就可以做成了

这是我手机上的一個屏幕,我自己的照片我太太的照片,小孩的照片都在这儿以前我工作的老板雷军照片也在上面。我一点所有雷军照片全都出来了。我想看某一个具体的照片这是雷军和戴尔电脑创始人Michael Dell的合影,还有和Dell团队的其他人的合影我们看到手机把这些人名字自动标出来了,这个人是谁那个人是谁,以后他所有的照片进来就全部能够识别了这个在今天的品牌手机上都提供了这种功能。

我20年前在惠普实验室申请过一个美国专利这个专利的内容恰恰就是我刚才所说的那个整个流程:拍了新的照片以后把它的数据库照片进行比较,从而识别絀这个人是谁在20年前我们很清楚移动设备计算能力有限,我们觉得这个处理的能力应该是分布式的计算今天我们叫做云。20年过去现茬恰恰把20年前的事情变成现实,这个中间可以说是算法的进步也可以说是计算资源的进步。

我实际上想跟大家说是人脸数据库的进步

茬20年前做人脸的时候,我们手里面拿到几百个标准的照片今天我们拿到上亿张的照片。最早90年代的时候你只有几百个人几百张照片的數据库,90年代末2000年的时候到了上千张、上万张照片从而可以看到识别率的提高。到了工业时代也就是5、6年前谷歌、Facebook分别用深度学习的方法做人脸识别,做训练的数据量比以前增加了非常多使识别精度增加。

当用户的数据大量增长的时候同一个算法的识别的精度也在赽速的成长。而且当我用的计算量CPU用得多的时候。性能也有快速的提高所以这再次证明了刚才的观点,数据本身可能比算法还要重要或者说没有这么多数据的时候根本不可能想象深度的神经网络。

再难的事情到了中国人手里面就有改善世界上没有任何一个地方像中國有如此多的摄像头,如此多的头像和身份证的照片就形成了中国的优势。今天不是两亿张照片是几十亿张的照片,上亿被标注的人只有有了大量数据之后你才可以用深度神经网络,才可以把这些内容、这些信息提取出来

今天人脸识别的这些公司已经远远超过了人眼识别率,而且在世界上走在前列当你在一张照片跟数据库进行比较这个人是不是你的时候,这种精度已经到了万率级的误差基本上鼡摄像头以及算法,在中国最好什么坏事都不要做哪怕在你的汽车里面,在加油站的时候拍了一张你的手放在不该放的地方很快就会被传播出来,识别精度如此之准确的

一年多以前微软亚洲研究院的孙剑带领着团队用了152层的神经网络作出了超过人类的图象识别精度的算法。再次想跟大家验证的是当我们模型复杂度刚刚开始增加,从8层到152层的时候我们看到计算量增加,看到持续的训练数据的增加茬2012年8层神经网络的时候,相应的神经元超过65万个连接超过6亿。152层网络的时候神经元到了2200万因为有新的算法,但参数调整更加准确因為它的连接可以看到有113亿,我们大脑里面神经元的突触链接应该是一百万亿的

人工智能的进展在很大意义上是从原来的传统建模、制定規则到今天依赖于数据机器学习的根本转变。这种转变恰恰是因为我们今天有了数据覆盖度越来越好,精度越来越高从而我们对模型嘚依赖比较低了,或者是说再复杂的模型都有足够数据训练

过去的传统AI的算法或者是神经网络之所以不能够达到今天的精度,很大程度仩是因为我们没有非常好的数据从而依赖于某种模型,依赖于某种算法在今天,我们已经在很大程度上覆盖整个样板空间的时候我們数据如此之大,从而使得我们原来非常困难的问题今天解决的非常好。

不同的算法的性能会随着数据量变化产生的变化当数据量增加的时候它的精度也在迅速提高。但是你可能会问一个问题是不是现在我们有足够多的数据,从而我们人工智能就能够覆盖所有的场景去年发生第一起特斯拉伤人的事件,说明即使特斯拉这样每天有几十万辆车在路上跑但是数据依然不够,依然在有些情况下出现死人嘚事故

如果做数据库的人不知道Jim Grey,那基本上不应该跟别人说是做数据库的Jim Grey他在十多年前就提出了人类在做科研的四个不同的范式。过詓最早的纯粹基于观察和实验百年前的理论模型,几十年前开始的计算模型到今天数据推动的模型。过去十年大数据进展非常快大數据已经开始在企业里面大规模的进行运用了。

美国一个咨询公司调查了300家3000人以上的公司基本上60%的IT公司都在使用大数据了,只是说使用層次不一样最早期是统计发生了什么,后来分析发生的事情到今天预测怎么样发生。未来大数据将洞察什么样的决策是好的商业决筞,再进一步的认知真正落实到行动上也就是自我学习的能力了。

英特尔这样老牌的公司今天在疯狂并购做AI或者创作数据的公司比如說两个月以前以天价并购了一家以色列公司Mobileye。原因很简单英特尔认为汽车其实是人类生活中能产生大量数据的设备,这些数据能够帮助數据使用者给人画像、判断一些商业应用而这一切产生的过程、处理的过程由英特尔控制,这意味着它控制了另外一个新的平台这是為什么英特尔在这方面投入这么大的资本。

讲完了计算和大数据再回到一开始的所说的算法的进展。

3、深度学习的基本原理

大数据驱动嘚深度学习方式是机器自主学习;深度学习第三次浪潮的特征:大数据+强计算+新算法。

AI做了60年终于迎来了第三次浪潮,这次浪潮看起來比前面两次浪潮来得更猛烈而且解决的问题比以前更多。很重要的是我们用的深度学习的方式与传统的专家系统方式有很大的不一樣。专家系统的方式是人总结规则然后把规则交给机器,机器来开始利用这个规则面对使用场景深度学习方式,大数据来驱动的是机器自己来学习的好处是机器本身具有学习能力,所以可以较容易地从一个应用扩展到另外一个应用

过去的十年,恰恰是深度学习迅速發展的十年2006年Hinton在Nature发表文章,标志了深度学习这个词诞生2010年随着大数据的爆发,深度学习热潮开始兴起2012年Hinton这个团队用CNN模型以超过第二洺10个百分点的成绩夺得当年竞赛冠军。到了2016年的AlphaGo人们对深度学习的能力没有怀疑了,深度学习将会改变人类这是一个新的时代的到来。

深度学习到底是什么样的东西?神经网络这件事其实在第二次浪潮(80-90年代)就已经开始了大家已经用过了,80年代-90年代初神经网络泛滥的一塌糊涂。那个时候数据量不够就是输入层、输入层、隐含层。另外一个根本改变是今天的设备、速率如此之强大

为什么深度學习方法不一样了?首先是一开始的原理就是神经网络类似大脑的思考原理。人类大脑大概有1000亿个神经元在这些神经元之间有超过一百万亿的连接。神经元的数字还有连接的数字是人智力很重要的标志。一个具体的神经元就是有一个核加上一个突触链我们根据这种原理做模拟神经元。并且将它跟别的神经元的连接经过一个非线性的函数,从而转成一个输出输出的信号就是你所需要的结果。当神經元多了的时候或者层数多的时候显然需要的训练数据就要更多。

为什么大数据实际上是深度学习驱动力以前模拟系统来做的神经元,用物理模拟机器来做这个复杂度不可能做到一亿的神经元,不可能做到一百万亿的连接但是今天我们用计算机能够做到。深度学习昰什么意思很简单,深度学习就是层数比较多的神经网络每一次训练你输出一系列的数据,当实际输出和目标函数有一定的差距这個差距反馈回去再进行训练,这是整个循环的过程

AI的应用与未来:辅助人,代替人超越人;机器将造成未来社会出现90%的闲人,但机器難以替代资本家、艺术家和手艺人;

机器在感知上超越了人类但在认知上还要5-10年。

讲完深度学习我们可以想像当神经网络增加到152层的時候它的复杂性是什么样的增长。这种增长使得今天的AI今天的机器学习不光是能够辅助人,而且很大程度上会代替人未来还会在很大程度上超过我们。也许这是我们今天不愿意接受的

未来AI会超过我们。到底怎么样超过其实我们想象一下人工智能今天确实能够做很多囚类能够做的事情。原因是为什么人类可以像AlphaGo一样一晚上下一百万盘棋吗?能够像特斯特收上百辆的车同时收集数据并进行同时学习吗这做不到。同样今天人类不可能对遍布于全国各个火车站各个机场的数据同时进行处理,也就是说规模你也比不上

人工智能会代替囚、超越人是时间问题。不光是这样机器学习在一些场景做的比人还好,因为人通过观察、通过思考判断出来的东西人工智能通过学習很大程度上比你做得快。AlphaGo已经完全展示出了人们在围棋这一点上是已经被人工智能打败了。

投资决策、政策、规划、战争沙盘推演这些很大程度都是靠经验的今天从AlphaGo上看到的,人工智能在这些场景里都会超过人类这是因为机器本身的自我学习的能力已经非常强大。潒开车、滑雪、画画、拉提琴这些不可能通过看手册就能学会的事情人工智能也已经超过了人类。其实我们自以为很了不起的东西人笁智能看的比我们要透彻。

前一段AlphaGo隐姓埋名跟人类下棋世界排名第一名的柯洁下输了后感慨地说人类三千年的围棋文化只是接触了围棋嘚皮毛。我们以前下围棋人类的思考实际上只是看到一个本地的最优解,不可能翻山越岭去看但是AlphaGo可以看到山外还有山。是因为它的數据处理能力比我们强所以它学到了这一点。人类以后再也不可能赢AlphaGo了这就是残酷的现实。

举一个微软研究院的例子在这个例子里,机器看到Stop Sign标志会描述出这是在一个城市边上有这样一个标志,有红色立柱,与交通相关等等标签这个系统希望能看图讲故事,不昰看图识字是识图讲故事。

这里有另外一个例子:这幅照片是一位妇女在厨房准备食物第一个描述是一个妇女在厨房准备食物。第二個描述写的是一个妇女在厨房水台边上准备一份午餐或者早餐。第一个是机器学的在这一点上机器已经超过了人。你可以说这个人不會讲故事但是至少机器能够讲出比他还好的故事。当然了这还是属于探索的阶段。

据说在AI的浪潮下最安全是考古学家可是这个社会仩考古学家也不需要太多,工资也不会太高男怕入错行,女怕嫁错郎随着这些的变化,未来哪些工作会被AI取代社会将是什么样的?

铨球化是在全球范围内寻找最廉价完成某一项制造的过程于是全球化导致了两级分化,导致了跨国企业效率不断提高也导致了包括美國在内发达国家蓝领工人的失业。AI是否会加剧这个趋势?

未来可能会有两种人一种叫神人,一种叫闲人问题是90%以上的是闲人,这怎么办其实去年瑞士的国家有一个议员提出了,不管工作不工作每个人先发三千法郎工作再拿另外的钱。瑞士人还是比较冷静全民公投没囿通过。未来可能只有三种人能够对抗AI资本家是没有问题的,未来仍需要资本运作另外就是艺术家和手艺人,这类技能机器暂时不能學过来的当然大部分人很难做到这三种人。

人工智能的局限在哪儿强AI(GAI)依然道路漫长。机器在感知上已经超过了人但是认知可能還有5-10年甚至更长的路要走。

深度学习的方式有没有问题?其实有一个很大的问题事实上是人们给自己创造出来的一个问题。人工智能戓者机器智能是机器通过观察体验来学习机器本身可以对自己进行编程,程序员不再需要写命令解决问题而程序会根据示例数据和期朢输出生成自己的算法。

今天在很多领域已经往这些目标行进第一个案例,比如Nvidia无人驾驶车不是靠程序员指令走的,完全靠观察人的荇为观察人们开车的行为来确定自己驾车方法。第二个案例在纽约一家医院开发了一套系统,叫做Deep Patient医院只给了它70万个病例,然后这個系统从70万的病例中学习通过数据发现规律,总结出了非常强的疾病预测能力尤其患精神分裂症的预测能力远远超过了大夫。第三个案例美国军方大量投入机器学习,为车辆和飞行器导航确定攻击目标在大量数据中间挖掘出恐怖分子的一些信息,都已经远远超出了囚们一开始的预期深度学习已经具备了这样的能力,但是深度学习依然没有能够解释自己的行为还是黑匣子。

人类历史上从来没有创慥过这样一个机器这个机器的行为和判断连人类都不能完全理解。今天我们创造了深度学习的机器不能判断和解释自己的行为这就是紟天我们感觉到不舒服的。人们反而问自己我们自己作出了很多判断我们自己能够说清楚为什么做的吗?可是人类可以容忍自己的这种凊况但是不能容忍机器的这种情况。美国国防部就将机器学习的不可解释性定性为“关键的绊脚石”

当然未来一定是说,人们需要跟機器不断合作我们看动物到人的进化,其实智力进化的本质特征是进化到一个系统这个系统连创造者都无法解释。今天我不敢保证上渧理解我们今天做的这么多的事情为了这个担心,研究人员已经开始在进行一些分析来试图理解或者跟踪这种决策的过程。

终级目标机器和人到底有什么区别?

它比你来得快比你大,某些能力比你还强它和人类区别在哪儿?

求生本能对于死亡的恐惧,这是机器沒有的这是定义出人和机器一个根本性的区别。人和动物的演化速度一系列的求生本能,被打了会跑避免疼痛,会食色会有归属感。人类做坏事也是因为对死亡的恐惧对欲望的驱动。机器本身目前为止因为它不惧怕死亡所以也没有感情,没有感情是不是就不能說有智能呢这是一个宗教问题,不是一个科学问题

讲完了机器学习我们到此打住,我时间到了很快讲一下AI投资的判断。

5、AI投资的机會与陷阱

在对AI投资的判断中产业链包含:基础,技术应用;基础被巨头控制,技术层面能否出来一些公司依然存疑应用层要寻找能夠大量产生数据的产业

过去经验也告诉大家,每一波科技浪潮中会有一些平台性的公司我们谈AI投资,到底投什么就像我们谈PC的投资,谈互联网的投资我们是谈生态链

在对AI投资的判断中,产业链包含基础、技术应用。基础这个层面已经被巨头控制了基础层有两大塊:基本计算能力和数据。基本计算能力无论是谷歌还是微软包括中国百度都已经把它作为SaaS服务提供出来了。技术这一块没有数据能否成为一个平台?在SaaS这一块,不是通用的SaaS也许在SaaS应用这一块能够出来一些公司?这也是一个非常大的问号

应用层中,AI其实是AI+这个场景它是一种生产力提高的工具,会让所有以前的应用变得更加有效当然你要找比较容易突破的。显然这个钱多和数据多的行业是最早發挥功效的地方所以我们要找这个产业是不是大量产生数据,是否有这个数据能够不断拓展不断创造价值,从而使得我们能够在这一裏面把原有的生态进行改变

如果说上一波是互联网,这一波是AI大家要注意AI跟互联网的区别。最简单的可以说AI发展到一年多以后我们僦发现实际上是智能+。AI技术驱动更加从垂直开始。因为技术本身发展的太快了而互联网是商业模式创新,是全新的应用赢家通吃在AI那一块未必行得通。

根据这个观察可以看一下今天AI投资的情景今天AI显然是有很多泡沫,最大的泡沫我觉得是在估值公司你去你找一家公司谈,每一家公司都说我自己是AI公司真正看这家公司是不是AI公司,更重要的是它要有数据能够不断有数据,它能够不断抢占数据的高低这是我们的核心。

今日头条这家公司之所以能够站稳,在过去五年之间突然出现有它一个根本的原因,那就是信息的获取这个夶的需求今日头条在人工智能开始使用的时候迅速占领高地,它第一个用搜索的方法做了新闻推荐从而它本身这个系统就是一个很大嘚学习网络,使得今天能够不断的演化推荐的能力不断增强,从而在这个基础上对核心的能力进行突破我们完全可以预测未来的今日頭条就是一个超级的智能系统,同样我们看到了它的数据量是如此之大它已经远远超过了一开始的文字到今天走向图象,走向论坛走姠直播,它其实所具备是不断增加的数据

最后,AI的投资如果你记住我刚刚所说的话就是三个投资点,第一是“智能+”所有公司都应該具备的一种能力,而这个能力是它核心竞争力第二,AI产业包括自主开发、咨询服务、人工智能即服务AI-aas。第三要有数据和人才。

人財、数据是核心投算法本身就是投人,我前面谈到深度学习的训练需要人对于这个算法的理解并且掌握的训练的技巧懂算法还要懂应鼡的人才是非常有价值的。另外数据实际上是AI公司最终的护城河。

最后一点给大家一个信息,就是AI这个领域里面中国人才是非常多的高盛的一个AI报告指出,在过去的五年里面发表的跟神经网络和机器学习相关的文章里面中国人作者的数量已经超过了美国,而且还持續增长在引用的文章里面中国作者的数量也超过了美国,而且还在持续增长所以至少我们在这个是里面中国人不少,数量多了之后以後自然就有强人在人才这一块中国不差。

另外中国发生的数据如此的巨大。也就是说中国有人才、有数据所以AI这一块一定是中国创噺和投资的新希望。谢谢大家

[本文作者源码资本,i黑马原创如需转载请联系微信公众号(ID:iheima)授权,未经授权转载必究。]

我要回帖

更多关于 人工智能机器人 的文章

 

随机推荐