什么是神经网络算法共识算法?

摘要: 问:人工智能的概念提出已经60多年了,许多算法和模型在几十年前就曾提出了,但在过去的发展中,碍于计算力和数据的局限,此前的发展并没有像如今这样迅速,这是不是从侧面印证人工智能也算是统计学的一种呢?

“AI首先是华丽辞藻,其实就是统计学。”

这是2011年诺贝尔经济学奖获得者托马斯·萨金特(Thomas J. Sargent)近期在中国公开演讲时对AI的结论。

AI研究者纷纷坐不住了,其中,阿里AI负责人、阿里巴巴达摩院机器智能技术实验室主任金榕,决定逐条批驳萨金特的观点。

也借机正本清源,表达了对于AI发展现状和未来的看法。

量子位将问答实录编辑如下,最后也附录了萨金特演讲实录,孰是孰非,一辩便明。

△阿里AI业务负责人金榕

问:萨金特说,“人工智能其实就是统计学,只不过用了一个很华丽的辞藻,其实就是统计学。好多的公式都非常老,但是所有的人工智能利用的都是统计学来解决问题。”

金榕:这位宏观经济学家也许是习惯了用统计去寻找经济的因果关系,因而认为AI也是这样。即使是他提到的动态规划(dynamic programming),也不属于统计学范畴。

除了统计,AI中的“学习”“推理”和“决策”中还使用了代数、逻辑、最优化等许多其他学科知识与方法。此外,有了算法后如何有效实现也非常重要。所以单纯说AI就是统计学,或者说“所有的AI都是利用统计学来解决问题的”都是片面和不准确的。

在这里我们首先需要定义什么是人工智能背后的核心技术。现在人工智能技术的成功背后,是基于对海量数据的学习,因此大量的大数据处理、优化以及分布式计算基础设施都扮演了非常重要的角色。

此外,AI还涉及到一个关键因素,就是如何实现最优的智能决策(例如AI打游戏)。一些理论和实证研究已经发现,神经网络就非常善于在复杂的条件下做出最优的决策。神经网络也不是统计学范畴。

还有,人工智能在计算机视觉、语音识别等领域取得的突破,还得益于硬件的日趋成熟。类似智能音箱天猫精灵、Echo的成功不仅来自于成熟的语音识别算法,也源于麦克风阵列等硬件设备变得越来越可靠。

那如何比较准确的表述统计学和AI的关系呢?应该说,统计学是人工智能若干重要基础之一,但远不是全部。

就像我上文提到的除了统计学,AI的核心能力还来自于数学(博弈论、数值分析、逻辑学等)、运筹学(优化)、计算机科技(分布式计算、并行计算、CPU、NPU)、神经科学,甚至心理学。

问:AlphaGo为代表的这一波AI浪潮,跟统计学之间有直接关系吗?

金榕:AlphaGo使用了蒙特卡洛树搜索、神经网络、增强学习等方法,因为算法规模大,所以采用了分布式计算来实现。棋力更强的AlphaGo Zero没有使用人类数据,而是从自我博弈中学习。

所以这更说明AI远比统计学来得广泛。所以推动这一波AI浪潮的正是神经网络的迅速发展,以及能够让大量数据发挥作用的算法和算力。

问:托马斯·萨金特也谈到了交叉学科研究推动的科技进步,您是否认同?如何评价这种观点?在这波深度学习为推动力的AI浪潮中,哪些学科的交叉起到了推动作用?

金榕:这一观点我很认同,这也是很多学者的共识。就像我上面提到的,AI不是独自成长起来的。1956年的达特茅斯会议(Dartmouth Conference)被学术界公认为是人工智能的起源。

今天有人说现在是人工智能的春天,其实这都源于我之前提到的一系列技术的发展与进步。特别是我刚刚提到的硬件,诸如麦克风阵列技术的成熟对语音识别的发展起到了重要作用。还有超强的算力,不论是GPU或者是云计算,都给我们带来了强大的计算能力和灵活度。

我们在自然语言对话机器人的开发中,还会应用到许多心理学知识。所以说人工智能的繁荣是诸多学科交叉相互影响,共同促进的结果。

问:下一波大的AI技术跃迁,您觉得会有赖于哪些领域/学科的交叉研究成果?

金榕:我认为首先可能来自于AI芯片、量子计算这些全新的计算基础设施对算力的巨大提升上。

此外还有神经科学的一些重要突破,可能将揭示大脑中神经元如何处理信息与做出决策的,这对人工智能的发展也有重要意义。

问:人工智能的概念提出已经60多年了,许多算法和模型在几十年前就曾提出了,但在过去的发展中,碍于计算力和数据的局限,此前的发展并没有像如今这样迅速,这是不是从侧面印证人工智能也算是统计学的一种呢?

金榕:计算力和数据的增长是人工智能发展的必要条件。AI的发展还要感谢Hinton,LeCun, Bengio等研究者的长期坚持。当然统计学也在发展,但由于深度学习的迅速发展,它们反而变得没有以前那么重要了。

除了统计学,对现在人工智能发展起到举足轻重作用的,神经网络的一些研究工作,也是在50年前进行的,但它被广泛应用是从2010年后开始的。

在2010年前,许多上一代机器学习成果的确是基于统计学的,他们被归类于统计机器学习。但技术是持续进步的,近几年推动人工智能进入发展快车道的深度学习技术,并不能归因于统计学。

问:在您能看来,应该如何定义人工智能,如果要跟大众普及的话,应该传递一个什么样的概念?

金榕:我认为智能化的目的,不是让机器像人一样。上一个世纪,在工业时代,我们基本上把人变得越来越像机器,而未来我们真正应该走的道路是,让机器更像机器,人更像人。我们发明了机器,不一定要机器按照人的思考。

机器要有自己的学习方式、思考的方式、解决问题的方式,所以我们提出“机器智能”。机器智能不应该是,让机器人复制人类的智能,而是发展出自己独特的智能。我们应该让机器做人类做不到的东西,让机器去发展自己智能的力量、尊重机器、敬畏机器。所以在阿里我们是以“机器智能”为目标。

举几个例子,诸如人工智能客服,它能7*24小时的工作,对海量用户的接待能力远超人类。人工智能应用于城市大脑,通过智能决策和管理能大幅缩短交通拥堵时间,甚至提高救护车到达现场的时间。

AI在工业领域的应用,诸如将计算机视觉应用于产品质检,已经为许多制造企业节省了数十亿元。这些都是AI比人类更擅长的领域。而在艺术、文学等创造性工作上,人工智能可能永远无法替代人类。

问:还有一种观点是认为算法、计算力和数据是人工智能技术能否成功的三个关键,你是否也这样认为?阿里AI在这三方面现状如何?

金榕:历史上人工智能经历了多次黄金时期。到了今天,我们迎来了新的一波热潮。

那么这次的人工智能热潮有哪些不一样的地方呢。就是由于我们在算法、计算力、数据上都有了重要突破。

首先人类首次拥有了超强的计算能力,不论是GPU还是云计算。给我们带来了强大的计算能力和灵活度。这点阿里具有很大的优势。阿里云在中国拥有最大的云计算服务,同时我们也在积极探索量子计算。

其次,也是很重要的一点,就是大量的数据的产生。海量的数据使AI模型的大规模训练成为可能。阿里巴巴积累了海量的数据与应用场景,这些数据将成为阿里在人工智能领域快速突破的基础。

最后,就是算法领域的突破。深度学习等新技术已经在各个领域得到广泛应用,比如计算机视觉、语音识别、自然语言处等,多点开花。阿里也在算法领域做了很多探索。诸如在语音识别领域,阿里推出了新一代语音识别模型——DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提升至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。

而在机器翻译领域,在此前结束的WMT2018国际机器翻译大赛上,达摩院机器智能-NLP翻译团队打败多个国外巨头与研究机构,在所有提交的5项比赛中,全数获得冠军。这5个项目包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译。短短一年时间,我们已经在20多个各领域的国际人工智能大赛上获得冠军。

附:托马斯·萨金特的演讲全文

托马斯·萨金特:1943年生,1968年获哈佛哲学博士,先后执教于明尼苏达大学、芝加哥大学和哈佛大学,2003年起任教纽约大学至今。

自70年代初以来,萨金特一直是理性预期学派的领袖人物,为新古典宏观经济学体系的建立和发展作出了杰出贡献。

2011年,萨金特与普林斯顿大学西姆斯教授一起获得诺贝尔经济学家,得奖理由是:“对宏观经济中因果的实证研究”。

以下演讲是萨金特在厚益控股&《财经》世界科技创新论坛上的演讲全文:

首先我对刚才几位嘉宾讲的话非常感兴趣,我想先谈一谈我的感受,然后再讲讲我的部分。

第一,能不能扮演上帝。作为科学家,很多领域的科学家,我们都需要用统计数据说话。其实在这个时候我们已经在扮演上帝的角色了。

什么意思?有好多应用科学像工程学、物理学、经济学都是应用科学,我们会建立一些模型模拟世界运营,我们的理论也是一样,都是由一系列的等式所构成,有一些随机组成部件。

我们的目的是希望解释我们所观察到的世界上的现象,而我们关键的工具是使用模型,然后放到电脑里模拟。把模拟后的数据拿来,利用数学方法,去微调它的参数,希望尽量接近于现实。

在这个过程中,我们扮演上帝的角色。所以写参数、模拟过程中是在假装,我们是在假装是上帝产生了这些数据。我们尽量想接近这个准确度。我们想接近或者模拟上帝的做法。

这个说起来容易做起来非常难,两百年、三百年前人们认为这是个好主意,但是当年的人不知道怎么操作。为什么?因为比如说你写下一个粒子的模型没有办法运算,算不出来。

但是到了二十世纪尤其是二战结束以后,我们出现了一些技术的巨将,包括诺尔曼,来自于奥地利的一个移民。我的岳父泰勒是研究核弹的,他们发明了蒙特卡洛模型,都是50多岁的时候发明的。

但是三、四年以后统计学家来了,搞清楚了可以做统计分析。所以这时候来了一场革命,影响了各行各业的科学家的研究工作,这就是技术创新带来的好处。其实这个过程中我们都在扮演上帝的角色。

我怎么讲到这儿来了呢?人工智能首先是一些很华丽的辞藻。人工智能其实就是统计学,只不过用了一个很华丽的辞藻,其实就是统计学。

好多的公式都非常老,但是我们说所有的人工智能利用的都是统计学来解决问题。有一些新发展,过去二三十年,今天我们统计学的完成质量更高,首先电脑运算速度更快,有新的算法,好多是源于物理学发展,还有统计力学等等,这是过去3到4年从物理学拿来,加速了我们做系列统计学方面的进步。

过去写下来公式,但是没有办法求解,过去你放计算机,但是能力太差,做不了。后来有了AlphaGo,就是一个动态编程,太大了。两三年前的解决之道就是特别大、特别快的计算机,利用一块一块的算法去运算。我觉得亚当斯密百分之百正确,多少年前说应该有专业分工,这是正确的。

今天有很多工具,如果统计学家一点也不懂物理学,很多人类科技进步就不能变成现实。所以我想作为企业家大家也应该做通才,我们应该去考虑来自不同技术的融合或者是相互促进,这就是为什么有了阿尔法GO的成功。

还有一两点,是刚才听了前面发言人的一些感受。到底什么是金融?金融的含义是什么?问一个高中生什么是金融,他觉得是太华丽的一个辞藻。

什么是金融?金融就是有人存钱有人不存钱,有人花的多挣的少,有人想投资,人是不一样的。什么是储蓄?什么是金融?有一些人就是来做中介,存钱的和需要花钱的人做中介,这个业务就是金融。

这个业务包含以下几方面。首先很容易受到欺诈侵害。第二很容易受到不信任的伤害。如果我攒了钱,把钱交给别人帮我打理,我交给的人是我信任的人,他没有不还钱的动机。他为什么还钱给我。金融体系要验证,我把钱借给你之后会不会还我,这就是金融的关键。如何让别人相信你?金融该是信任和验证相关的活动。在这些方面是有技术发展的,就是验证和信任的工具。

是谁作为主体,是国家做还是谁做?你以自己的生活为例,你和你的家人为例,家人之间也有很多的信任和验证。

比如,阿里巴巴或者亚马逊是“国中国”,因为他们的工作是创造交易平台,人们可以参与买方卖方在他们的交易平台上活动,无论是阿里巴巴还是亚马逊都是发挥警察作用,既管理买方也管理卖方,相当于电子警察,他们开发技术,改良交易平台的信任和验证。

像20到25年前你们的工作。就是前沿的工作,当时就在讲这样的问题的理论,这个理论的技术不断进步。

最后我还想一点,有新的领域的出现,我应该意识到算法机制设计。这个涉及了几个领域。

首先,它讲的是如何运转一个国家或者是运转一个公司像阿里巴巴,或者运转一个拍卖,如何保证人们付款。它结合了什么?结合了计算机科学、博弈论、计算、数学运算,也就是说,上过这门课的人了解了好多东西。他要了解各种各样的学科,所以说专家和通才一起开创新的领域,这些都是值得大家追踪的新的领域。

原文发布时间:2018年08月27日
本文来自云栖社区合作伙伴“”,了解相关信息可以关注“”。
本文经授权转载,不代表阿里云及云栖社区立场。如若转载请联系原作者。

《集异璧》作者侯世达疯狂吐槽谷歌翻译:AI让译者失业?还早着呢

机器能在完全不理解语言的情况下拿出高品质的翻译作品吗?本文来自微信公众号:,作者:侯世达(DOUGLAS HOFSTADTER,美国著名认知科学家、比较文学家、翻译家,印第安纳大学认知科学和比较文学教授、著有《哥德尔、艾舍尔、巴赫:集异璧之大成》,该书获得普利策奖和美国国家图书奖),原文发表于《 THE ATLANTIC》。

某个周日,在我们每周一次的莎莎舞会上(salsa sessions),我的朋友弗兰克带了一个丹麦朋友来。我知道弗兰克的丹麦语讲得很好,因为他的母亲是丹麦人,他小时候曾在丹麦生活过。而他带来的那个朋友,跟所有斯堪的纳维亚人一样,能讲一口流利的英语。然而,令我惊讶的是,在晚上闲聊的过程中,他们居然习惯性地用“谷歌翻译”交换信息。弗兰克用英文写下文字,然后用“谷歌翻译”转译成丹麦语;而他的朋友则用丹麦语写下文字,然后用“谷歌翻译”转译成英语。

这太奇怪了!为什么会讲对方语言的两个聪明人要用这种方式沟通呢?我对机器翻译的体验总是让我对它不够信任。但这两个朋友显然没有我的那种疑虑。实际上,很多受过良好教育的人对于机器翻译都抱有相当大的热情,很少对它产生质疑。这让我颇感困惑。

作为一个语言爱好者和翻译热爱者,作为一个认知科学家和一个人类精妙心智的终身敬畏者,几十年来我一直在关注机器翻译的进展。当我最初在1970年代对它产生兴趣时,我读过一封信,是数学家、机器翻译早期倡议者沃伦·韦弗(Warren Weaver)于1947年写给控制论专家诺伯特·维纳(Norbert Wiener)的。在信中,韦弗写了一句很有意思的话,今天仍为众人所熟知:

当我阅读用俄罗斯语写的文章时,我会对自己说,“这篇文章实际上是用英语写的,只不过被编码成了一些奇怪的符号。现在,我要把这些符号解码回来。”

几年后,他表达了不同的看法:“没有一个理性的人会认为,机器翻译能够做到‘信、雅、达’。普希金不需要为此感到担忧。” 哈!我曾用了我人生中整整一年的时间,将亚历山大·普希金的著名诗体小说《叶甫盖尼·奥涅金》翻译成我的母语(也即是,把这一伟大的俄罗斯文学作品重新翻译成英文诗体小说),这真是一段令我难忘的经历。我发现维纳的新观点揭示了语言朴素的本质,更接近于语言的真相。尽管如此,他在1947年提出的“翻译即解码”的观点还是成为了机器翻译领域的一种信仰。

从那以后,“翻译机器”逐渐有了发展。直到最近,对所谓“深度神经网络”的使用,让有些观察家(参见纪德·刘易斯-克劳斯(Gideon Lewis-Kraus)在《纽约时报杂志》上发表的《The Great AI Awakening》,以及雷恩·格林(Lane Greene)在《经济学人》上发表的《Machine Translation: Beyond Babel》)宣称,人类译者将成为濒危物种。照此发展下去,用不了几年,人类译者要做的事情就不是创造新的文本了,而是对文本进行修修补补和质量控制。

果真如此的话,这将对我的精神生活造成巨大的冲击。虽然我完全理解人们对机器翻译的痴迷,但我肯定属于最不希望人类译者被无情的机器所取代的那类人。事实上,机器翻译令我感到恐惧和厌恶。在我看来,翻译是一种难以置信的精妙艺术,它需要译者有丰富的人生阅历和创造性的想象力。如果真有那么一天,人类译者成了历史的遗迹,我对人类心智的敬畏就会受到动摇,这种动摇会让我陷入可怕的困扰和无尽的悲伤之中。

每当我读到文章宣称,人类译者作为一个群体将很快向新技术的快刀利剑俯首称臣时,我总有一种想要亲自检验这种判断的冲动,这一方面是因为,我感到技术替代的魔魇可能近在眼前;另一方面是因为,我由衷希望自己能够确证,危险并非迫在眉睫;最后,出于我一贯的信念,我想要挑战那些夸大其词的人工智能威胁论。

人工神经网络并不是一项新奇的技术。最近,在谷歌内部被称为“谷歌大脑”(Google Brain)的部门采用了这项技术,同时,又用“深度学习”增强了它的能力。我阅读了相关文献,了解了被称为革命性翻译机器的软件机理,然后,我决定亲自测试最新版本的“谷歌翻译”。它真的是一个颠覆者吗,就像“深蓝”和“AlphaGo”之于象棋和围棋那样?

我发现,虽然“谷歌翻译”的老版本可以处理多种语言,但新的深度学习版本目前只能处理9种语言。(最新情况是,它可以处理96种了。)其中,我只打算测试英语、法语、德语和中文。

在展现测试结果之前,我应当指出,“深度”这一形容词的含义是模糊不清的。当人们听说谷歌买了一家名叫DeepMind的公司,其产品使用了用“深度学习”技术增强的“深度神经网络”时,下意识中会将“深度”一词理解为“深刻”,进而理解为“强大”、“颖悟”、“聪明”。然而,这里的“深度”仅仅是指这样一个事实:新的神经网络比老的神经网络拥有更多的层次比如说,前者有12层,后者只有2、3层。那么,这种层级数量的差异是否意味着,神经网络必然会更聪明呢?并非如此,这不过是语义上的误解。

“谷歌翻译”的宣传声势浩大,但我对它却持有谨慎态度。尽管对它并无好感,但我也意识到它的确带来了一些惊喜。它对地球上的每个人都是免费的,能够将差不多100种语言转译成任何一种其他语言。这真是一件了不起的成就。如果我可以骄傲地称自己是“三种全会”(pi-lingual)的话[1](如果有人问我“你会说几种语言”,我会很愉快地回答,大概会3种语言),那么“谷歌翻译”得有多骄傲啊,毕竟,它可以把自己称为“百种全会”(bai-lingual)(“百”在中文里是指数字“100”)。对于只会3种语言的人来讲,会100种语言简直难以想象。并且,如果我将一张语言A的文字复制粘贴,放进“谷歌翻译”,不消几秒钟,它就能被翻译成语言B。在数种语言之间自由转换,这种效果在任何地方任何屏幕上都能实现。

“谷歌翻译”和相关技术的实用性是毋庸置疑的,总体而言也是很好的工具。但它在技术方法上还是极度欠缺一种东西,一言以蔽之:理解力。机器翻译绝对做不到理解语言。相反,它的方法只是试图去“解码”——而不去考虑究竟什么是理解和意义。那么,是否不需要理解就能做好翻译呢?某种事物——人类或机器——能在完全不理解语言的情况下拿出高品质的翻译作品吗?为了回答这个问题,现在我要谈及我所做过的几个实验。

我的实验最先是从小处着手的。我使用了下面这段简短的话,人类的心智能够对它产生清晰的画面感:

在他们的房间里,每样东西都是成对出现的。有他的车,就有她的车;有他的毛巾,就有她的毛巾;有他的书房,就有她的书房。

这段话翻起来似乎是很容易的,然而在法语中(以及在其他拉丁语系中),“他”和“她”这样的性别词汇不是由事物的所有者来界定的,而是由事物本身来界定的[2]。于是,“谷歌翻译”呈现给我们的结果就是:

在他们的房间里,每样东西都是成对出现的。有他的车,就有他的车;有她的毛巾,就有她的毛巾;有他的书房,就有他们。

这样的结果在我预料之中。它没能意识到,我的这段话描述的是一对夫妻,强调了丈夫(他)拥有的每一样东西,他的妻子(她)也拥有。例如,深度学习引擎用了“sa”(他的)这个词来表示“他的车”和“她的车”,因此,你无法知道车主的性别。类似地,它还用了无性别的复数词“ses”来表示“他的毛巾”和“她的毛巾”。至于最后提到的两个书房(他的和她的),它则干脆省掉了“hers”中的“s”,认为“s”在这里表示复数,意指“他们”(“les siennes”)[3]。可以说,在翻成法文的时候,“谷歌翻译”完全领会错了意思。然而,每一个人类读者都能正确理解这段话的言外之意。接下来,我自己把这段话翻成了法文,正确表达了全部意思。以下是我的法文版本:

“sa voiture à elle”表示“她的车”,而“sa voiture à lui”只能被理解为“他的车”。这时,我猜想“谷歌翻译”应该很容易把我的法文版本准确翻回到英文,但我完全想错了。下面是它呈现给我的结果:

在家里,他们的每样东西都有两个。有他自己的车和他自己的车,他自己的毛巾和他自己的毛巾,他自己的书房和他自己的书房。

这都什么鬼啊?!即便输入的语句专门强调了物主的性别,翻译机器还是忽略了这一点,把所有性别都翻成了男性。为什么它会丢掉如此重要的信息呢?

我们人类都知道,什么是夫妻、房屋、个人物品、骄傲、竞争、嫉妒、隐私,以及很多其他似乎难以理解的怪癖,比如,结了婚的夫妻,各自的毛巾也要分别刺上“他的”和“她的”字样。而“谷歌翻译”却不明就里,或者准确地说,它暂时还不明就里。它只熟悉由字母所组成的字符串,只知道以超快的速度处理一段段文字,而不知道如何思考、想象、记忆和理解这些文字。它甚至不知道文字指涉了事物。我可以毫不犹豫地说,理论上讲,计算机程序本可以理解语言的用途,可以拥有思想、记忆和经验,可以应用它们。然而,“谷歌翻译”却不是为了这些目的而设计的,设计人员甚至根本没有这样的野心。

好吧,我对它的这些糟糕表现窃喜不已,并感到一丝宽慰,毕竟,人类译者还不会很快被机器所取代。但我还是认为,我应该更深入地了解这部机器,毕竟,一口水,不解渴。(one swallow does not thirst quench.)

这是一个符合语法的法文句子,但它的意思很费解。首先,它提到了一种鸟(“une hirondelle”——一种燕子),然后,它又说这种鸟不能吸气,或者不能吮吸(n’aspire pas),最终的意思就是说,这种既不吸气又不吮吸的东西口渴了(la

现在,让我们从法语的“油锅”跳到德语的“火坑”。最近,我迷上了奥地利数学家卡尔·西格蒙德(Karl Sigmund)写的《Sie nannten sich der Wiener Kreis》(人们把他们称为“维也纳学派”)一书。它讲述了维也纳的一群理想主义知识分子在1920年代和1930年代的故事,这群人对20世纪的哲学和科学产生了巨大影响。我选择了书中的一小段文字来考验“谷歌翻译”。我将先呈现德语原文,然后给出我自己的翻译版本,最后给出“谷歌翻译”的版本。(顺便提一句,有两个母语是德语的人核对了我的翻译,包括卡尔·西格蒙德,因此,我认为你大可相信我的翻译是准确的。)

战败之后,泛德国主义在当时的教职员工中是主流倾向,很多持有这种倾向的教授认为,自己完全有责任让高等教育机构免受“政治上不受欢迎的人”的影响。最有可能被开除的是青年学者,他们还没有获得在大学授课的教职。对于女性学者而言,她们在大学里更是没有立足之地,这是再明显不过的事实了。

战败之后,很多德国籍的教授,同时也是教职员工中的多数派,认为自己有责任让大学避免“奇数”;在获得资格之前,青年科学家是最容易受到影响的。总之,科学家没有产生质疑,几乎没有了。

“谷歌翻译”呈现的都是英文词汇(然而,不清楚是什么原因,有两个大写字母没用对地方)。除此之外,似乎还过得去。然而,很快你就会发现不对劲了,越往下读,问题越大。

首先,我注意到了“odd”这个词。它对应了德文中的“die ‘ungeraden”,意思是“政治上不受欢迎的人”。然而,“谷歌翻译”有理由——出于非常简单的统计学上的理由——选择“odd”这个词。也即是说,在其上百种语言的数据库中,“ungerade”这个词总是被译作“奇数”(odd)。尽管机器本身并不知道为什么会这么翻,但我可以告诉你原因何在。

这是因为“ungerade”的意思——字面意思是“不平的”或“不均匀的”——几乎总是意指“不能被2除尽”。而我的翻译版本有意选择了“undesirables”一词,从而使得对“Ungeraden”一词的翻译与统计概率无关,而是来自于我对语境的理解——来自于我注意到文字中没有被清晰表达出来的含义,而且“ungerade”的这种含义绝不可能在我自己的德语词典中找到。

让我们再来看看“Habilitation”这个德语词汇,它意指大学的教职,相当于终身教授。英文里也有同样词根的词“habilitation”,不过它很少被使用,自然也不会让人联想到终身教授或者类似的事物。所以,我需要简单解释而不只是引用这个含义模糊的词。机器翻译不可能真正理解以英文为母语的读者,“谷歌翻译”当然也做不到这一点,因为它不能模仿读者的知识。

不过,最后两句话才真正表明了,为什么理解对于翻译而言至关重要。德语名词“Wissenschaftler”由15个字母组成,意思是“科学家”或“学者”。(我选择了后者,因为在文中的语境下,它意指一般意义上的知识分子,而“谷歌翻译”则没能理解这一细微之处。)另一个与此相关的词“Wissenschaftlerin”由17个字母组成,我们可以在最后一句话中看到其复数形式“Wissenschaftlerinnen”,它是一个指代了性别的德语名词。单数名词在语法上指代男性,意指男性学者,复数名词指代女性,只适用于女性学者。我自己的翻译版本用了“女性学者”(female scholar)来理解这层意思。而“谷歌翻译”并没有理解增加了“in”这个后缀的阴性词是最后这句话的核心意义所在。由于它没能意识到“女性”这层意思,就只能再次使用“科学家”这个词,因此没有理解整句话的意思。就像前面的法语例子一样,“谷歌翻译”完全不理解,这段德文的中心意思是要比较男性学者和女性学者的不同境况。

frage)的正确翻译吗?显然,它没能呈现出原文的意思——甚至完全挨不上边。它只是随意地将德语词汇翻成了英语词汇。这样的结果可以被贴上“翻译”的标签吗?

这个句子的后半部分同样是错译的。最后6个德语词汇的字面意思是,“没有更多的共识了”,或者更直白一点,“这就是人们达成的最大共识了”。然而,“谷歌翻译”却将这句意思很明确的话翻成了“几乎没有了”。作为人类的我们可能会问“几乎没有什么了?”但翻译机器是不会关心这个问题的。“谷歌翻译”对于语境完全不理解,因此它甚至不能回答看上去很简单的问题。翻译引擎不能想象数量的大小或者事物的数量。它只是把数字翻出来,并没有意识到这些数字象征了某些事物。

人类有着丰富的人生阅历,也能赋予语言以意义,因此很难察觉到“谷歌翻译”呈现在屏幕上的文字是漏洞百出的。人们几乎会不假思索地认为,一款能如此流畅地翻译语言的软件一定能够理解文字的含义。这种典型的幻觉与人工智能有关,被称为“伊莉莎效应”(ELIZA effect),它迷幻了人们的双眼,让人们误以为机器可以理解英语。时光回到1960年代,研究人员设计了一个被称为“伊莉莎”的虚假的语言机器人,并把它假扮成了一个精神治疗师。“伊莉莎”让每一个与它打过交道的人产生了一种奇怪的感觉:它能够深刻理解人们心灵深处的感受。

几十年来,颇有见识的人们——甚至一些人工智能的研究人员——也陷入了“伊莉莎效应”。为了确保我的读者避开这一陷阱,让我从前面的段落中引用一些词组——也即是,“‘谷歌翻译’没有理解能力”,“它不能意识到”,“‘谷歌翻译’没有最起码的想法”。然而悖论之处在于,这些词组一直在说“谷歌翻译”欠缺理解力,而这同时又意味着,它至少在有些时候应该具备理解一个单词、一个词组或一句话的含义或所指事物的能力。但事实并非如此。“谷歌翻译”绕开或回避了对语言的理解。

对我而言,“翻译”这个词散发着神秘而振奋的光芒。它代表了一种深刻的人类艺术形式,能够优雅地将用语言A表达的清晰思想转化成用语言B表达的清晰思想。而这种转化的桥梁不仅仅要确保清晰性,还要呈现出原作者的品味、癖好和写作风格。

当我在做翻译的时候,我首先会仔细阅读原文,尽可能准确理解文中的内容,让它们在我脑海中来回酝酿。这不是说让原文中的词句来回酝酿,而是让原文中的思想激荡起其他相关的思想,从而在我脑海中创造出与这些场景相关的美妙光环。

不消说,这些光环大多是无意识的。只有当这种光环在我脑海中被成功激发出来时,我才会试图去用另一种语言将它表达出来——让它“喷薄而出”。我希望能用语言B将那种光环表达出来。

简而言之,我并不是简单地将语言A中的单词和词组转化成语言B中的单词和词组,而是要在无意识中将图像、场景、思想呈现出来,发掘出我自己的人生经历(或者读过的书籍、看过的电影、朋友的教诲),只有当这些非语言的、想象的、体验的、心灵的“光环”被感受到的时候——只有当晦暗不明的意义泡沫漂浮在我脑海中时——我才会开始用另一种语言来书写词汇和语句,然后,修改,修改,再修改。这一通过理解语言来实现的过程似乎显得过于笨拙。

事实上,跟“谷歌翻译”2、3秒就能翻出一个页面的速度相比,情况的确如此——但这正是严肃的人类译者应该做的事情。每当我听到那个令人亢奋的术语“深度心智”(deep mind)时,我所想到的正是上述场景。

现在,我要转向对中文翻译的测试,这对深度学习软件的挑战比前两种欧洲语言要大得多。我的测试材料来自令人温暖的回忆录《我们仨》,作者是中国剧作家和翻译家杨绛,她刚去世没几年,享年104岁。该书讲述了她、她的丈夫钱钟书(也是一个小说家和翻译家)和她女儿跌宕起伏的人生。这本书的文字并不晦涩,但中文用语很规范。我选择了其中一小段,让“谷歌翻译”来完成。以下是翻译结果和我自己的翻译(已经过母语为中文的人的审校)

钟书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。他仍兼管研究生。

毛选翻译委员会的领导是徐永煐同志。介绍钟书做这份工作的是清华同学乔冠华同志。

事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,钟书惶恐地对我说:

他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

我将简要指出一些谬误之处。

首先,“谷歌翻译”完全没有提到“钟书”这个名字,而它在原文中出现过3次。翻译机器首先用了代词“他”,然后又用了“这本书”(the book),接着又说“惶恐的书在书中”(the book of fear in the book)。你就去猜是什么意思吧!

第二处谬误是,第一段文字说得很清楚,钟书仍然兼管研究生,而“谷歌翻译”却把钟书翻成了研究生。

第三处谬误是关于“毛选翻译委员会”,毛泽东主席的“东”字被省掉了。

第四处谬误是,“永煐”这个名字被译成了“Yongjian”。

第五处谬误是,“客去后”被翻成了“客要走”。

第六处谬误是,最后一句话完全不知所云。好吧,这六处错误已经能让“谷歌翻译”够喝一壶的了,不过我们完全可以不用在意这些错误。现在,我将集中探讨一个令人费解的词组——最后一段话中由5个单词组成的、用引号标注的词组(“南书房行走”)。如果逐字翻译,这个词组可以被译作“south book room go walk”,但这种大杂烩显然是难以理解的,尤其是考虑到文中的语境,它肯定是一个名词。“谷歌翻译”给出的结果是“South study walking”,但仍然词不达意。

我得承认,刚开始我也不知道这个中文词组是什么意思。尽管从字面上看它的意思似乎是,在某栋建筑的南边学习的时候移动自己的脚步。我知道,这种理解肯定是错的,不符合语境。为了翻译它,我不得不去了解我并不太熟悉的中国文化。我该寻求谁的帮助呢?谷歌啊!(但不是“谷歌翻译”。)我将这几个中文单词连同引号输入谷歌搜索框,然后让引擎自己去搜索。很快,一堆中文网页跳了出来,我痛苦地在前两个网页呈现的中文语句中搜寻,想要搞明白这个词组究竟是什么意思。

我发现,这个词要追溯到清朝(年),专指辅助皇帝的知识分子,他们的责任是帮助皇帝(在皇宫的南书房)起草漂亮的官方文件。“行走”这个词实际上意指“辅助”。因此,根据谷歌搜索提供的信息,我把这个词组翻译成了“South Study special aide”。显然,“谷歌翻译”没能像我一样好好利用谷歌搜索,这真是太糟糕不过了,不是吗?尽管“谷歌翻译”能在瞬间翻出这个词组,但它不能理解网页里的中文内容。我把我查看的中文网页信息输入“谷歌翻译”,它很快就呈现了如下结果:

这难道不是英文翻译吗?我们当然都知道,这段话是由英文单词组成的(至少绝大部分是如此),但这是否意味着它是一篇英语文章呢?在我看来,上面这段翻译不知所云,因此它不能算是英语文章,只是由英文单词拼凑而成的大杂烩——随机的词汇拼盘,毫无逻辑的乱炖。为了满足你的好奇心,我自己对这段文字做了翻译(花了我好几个小时)

有些读者可能会怀疑,我是为了贬损“谷歌翻译”才有意选取那些难翻的文字的,而实际上“谷歌翻译”在大多数情况下的表现要好得多。这听起来有些道理,但事实上却并非如此。我从自己最近读的任意一本书中随机选取一段文字让它翻译,都会出现各种各样的错误,包括出现前面所提到的不知所云和无法理解的词组。

当然,我承认,“谷歌翻译”有时会翻出一些看上去还不赖的句子(尽管与原文的意思仍有偏差或者完全误解了原文)。一两段翻得不错的完整语句可能会让人产生幻觉:“谷歌翻译”知道自己在做什么,能够理解它所“阅读”的文字。在这种情况下,它似乎给人留下了深刻的印象——它几乎能达到人类的水平!

这样的赞美当然要归功于它的发明者和他们艰苦的工作。但与此同时,不要忘了,“谷歌翻译”是如何翻译前面那两段中文内容的,以及更前面的法语和德语段落的。要理解它为什么是失败的项目,人们需要牢记“伊莉莎效应”。百种语言引擎并没有在阅读任何东西——至少不是人类意义上“阅读”。它只是在机械处理文字。它所处理的符号与我们对这个世界的体验无关。它没有记忆可供提取,它能够快速处理文字,但这些文字对它而言没有图像、没有理解、没有意义。

一个朋友问我,“谷歌翻译”的局限是否只是大数据资源不足造成的。他认为,如果你能大幅增加数据资源,比如,数百万或数十亿个数据库,最终它就能满足你所有的翻译需求,并且还能翻得很完美。但我不这么认为。拥有更多的“大数据”不会让你更接近于获得理解力,因为理解力涉及到拥有思想,缺乏思想是今天机器学习面临的最根本的问题。因此,我敢说,更大的数据库——甚至巨大的数据库——也不能解决这个问题。

自然,这又引出了另一个问题:“谷歌翻译”对神经网络——一种试图模拟大脑的技术——的使用能让机器对语言产生理解吗?初看起来,似乎是可行的。

但“谷歌翻译”对语言的处理仍然没能超越单词和词组这样的初级层面。在庞大数据库中,所有类型的统计数据都可以被用于神经网络,但这些统计数据只是用某些词语去联接另一些词语,而不是去联接思想。它没有试图创造一种内部结构,这种结构可以被视作思想、图像、记忆、体验。这些缥缈的心智内容仍然难以用算法来创生,因此,作为一种替代品,谷歌使用了成熟而具有效率的语词聚类统计算法。然而,这种技术的效果无法等同于思想,而思想是人们在阅读、理解、创造、修改、评判作品的过程中产生的。

尽管我的看法是偏负面的,但人们对于“谷歌翻译”提供的服务还是给予了很高评价:它虽然不能很准确地把语言A翻成语言B,但的确可以在交流过程中发挥应急作用。只要被翻成语言B的文字大体上可以被理解,很多人就会对它十分满意。如果人们能明白一段外语的“基本意思”,他们就会觉得很开心。然而,在我看来,这显然不是“翻译”这个词的本义,但对有些人来说,“谷歌翻译”无疑是一个伟大的产品,它所做的工作就是翻译。

好吧,我明白这些人的需求,也理解他们的那种开心。对他们而言,这的确是一种幸运。最近,我看到有技术狂热分子制作了柱状图,号称可以比较人工翻译和机器翻译的“质量”,这些图形表明,最新版本的翻译引擎已经很接近人工翻译水平了。但是,在我看来,这是一种对无法量化的事物进行量化的伪科学,或者,你也可以认为,是一群技术呆子试图将无形的、微妙的、艺术的事物进行量化。

在我眼里,今天的“谷歌翻译”,其水准既有优秀的一面,也有搞笑的一面,而我是无法把我对它的感受进行量化的。回想一下前面提到的第一个翻译例子吧,里面涉及到“他的”和“她的”物品,没有理解能力的翻译机器几乎把这些物品都翻对了。尽管取得了这样小小的成功,但它还是没能理解整段话的意思。在这种情况下,人们应该如何量化它的工作质量呢?用看上去很科学的图表去证明翻译质量,不过是对科学方法的滥用而已。

让我回到人类译者的悲观图景:他们很快将被机器超越和淘汰,逐渐变得无所事事,从而成为翻译质量的检验者和文字的修补者。这种看法充其量只适用于平庸的译者。一个严肃艺术家的工作绝不是从对低俗破烂作品的修修补补开始的,这些破烂不可能被打造成高雅艺术。艺术不是这个样子,而翻译无疑是一门艺术。

在我多年的写作生涯中,我一直坚持认为,人类的大脑是一部机器——非常复杂的机器——我完全反对有些人的说法,说机器天然就不可能理解意义。甚至有一派哲学家声称,计算机绝不可能“理解语义”,因为它们是由“错误的材料”(硅)组成的。在我看来,这种观点是草率的胡说八道。我不想在这里深入讨论这个问题,但我也不想让读者对我留下这样一种印象:我相信计算机永远不可能拥有智力和理解力。如果我的这篇文章传递了这样一种意思,那是因为我提到的技术没有触及到人类智力的核心之处,前面所举的那些例子很清晰地表明了机器翻译的局限性。

在我看来,没有根本的理由认为,原则上机器不会在某一天学会思考、创造、搞怪、怀旧、兴奋、恐惧、高兴、沉默、期盼。进而言之,机器可以真正学会在不同语言之间进行翻译。没有根本的理由认为,机器不会在某一天成功翻译笑话、双关语、剧本、小说、诗歌,当然,还有像本文这样的文章。但是,所有这一切只有在机器拥有了类似人类的思想、情绪和体验的基础上才能实现,而这绝非近在咫尺的事情。实际上,我相信我们还有相当长的路要走。至少,这是一个一辈子对人类心智之深邃充满敬畏的人所热切希望的。

如果有一天翻译机器能翻出用诗一般的英文写出的文艺小说,并准确呈现出其中的押韵、赋格、节律、智慧、悲伤和声韵,那么我知道,是时候摘下我的帽子,向它致敬了。

[1]  Pi在这里是π的谐音,代表略大于3的数字。

[2] 比如,汽车通常被认为是属于男性的物品,因此,法语就只会说“他的汽车”,而不会说“她的汽车”。毛巾通常被认为是属于女性的物品,因此,法语就只会说“她的毛巾”,而不会说“他的毛巾”。

[3] hers本来意指“她的书房”,但它没把这个意思翻出来,而是翻成了“他们”。

[4] 中文意思与原文翻成的中文大致相同。

[5] 这句法文是谷歌翻译的,作者认为它是词不达意的。

本文来自微信公众号:,作者:侯世达(DOUGLAS HOFSTADTER,美国著名认知科学家、比较文学家、翻译家,印第安纳大学认知科学和比较文学教授、著有《哥德尔、艾舍尔、巴赫:集异璧之大成》,该书获得普利策奖和美国国家图书奖),原文发表于《 THE ATLANTIC》。

*文章为作者独立观点,不代表虎嗅网立场


我要回帖

更多关于 神经网络算法 的文章

 

随机推荐