什么是神经网络算法共识算法？

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>网络 >>什么是神经网络算法共识算法？

什么是神经网络算法共识算法？

来源：蜘蛛抓取(WebSpider) 时间：2018-09-13 03:28 标签：神经网络算法

摘要： 问：人工智能的概念提出已经60多年了，许多算法和模型在几十年前就曾提出了，但在过去的发展中，碍于计算力和数据的局限，此前的发展并没有像如今这样迅速，这是不是从侧面印证人工智能也算是统计学的一种呢？

“AI首先是华丽辞藻，其实就是统计学。”

这是2011年诺贝尔经济学奖获得者托马斯·萨金特（Thomas J. Sargent）近期在中国公开演讲时对AI的结论。

AI研究者纷纷坐不住了，其中，阿里AI负责人、阿里巴巴达摩院机器智能技术实验室主任金榕，决定逐条批驳萨金特的观点。

也借机正本清源，表达了对于AI发展现状和未来的看法。

量子位将问答实录编辑如下，最后也附录了萨金特演讲实录，孰是孰非，一辩便明。

△阿里AI业务负责人金榕

问：萨金特说，“人工智能其实就是统计学，只不过用了一个很华丽的辞藻，其实就是统计学。好多的公式都非常老，但是所有的人工智能利用的都是统计学来解决问题。”

金榕：这位宏观经济学家也许是习惯了用统计去寻找经济的因果关系，因而认为AI也是这样。即使是他提到的动态规划（dynamic programming），也不属于统计学范畴。

除了统计，AI中的“学习”“推理”和“决策”中还使用了代数、逻辑、最优化等许多其他学科知识与方法。此外，有了算法后如何有效实现也非常重要。所以单纯说AI就是统计学，或者说“所有的AI都是利用统计学来解决问题的”都是片面和不准确的。

在这里我们首先需要定义什么是人工智能背后的核心技术。现在人工智能技术的成功背后，是基于对海量数据的学习，因此大量的大数据处理、优化以及分布式计算基础设施都扮演了非常重要的角色。

此外，AI还涉及到一个关键因素，就是如何实现最优的智能决策（例如AI打游戏）。一些理论和实证研究已经发现，神经网络就非常善于在复杂的条件下做出最优的决策。神经网络也不是统计学范畴。

还有，人工智能在计算机视觉、语音识别等领域取得的突破，还得益于硬件的日趋成熟。类似智能音箱天猫精灵、Echo的成功不仅来自于成熟的语音识别算法，也源于麦克风阵列等硬件设备变得越来越可靠。

那如何比较准确的表述统计学和AI的关系呢？应该说，统计学是人工智能若干重要基础之一，但远不是全部。

就像我上文提到的除了统计学，AI的核心能力还来自于数学（博弈论、数值分析、逻辑学等）、运筹学（优化）、计算机科技（分布式计算、并行计算、CPU、NPU）、神经科学，甚至心理学。

问：AlphaGo为代表的这一波AI浪潮，跟统计学之间有直接关系吗？

金榕：AlphaGo使用了蒙特卡洛树搜索、神经网络、增强学习等方法，因为算法规模大，所以采用了分布式计算来实现。棋力更强的AlphaGo Zero没有使用人类数据，而是从自我博弈中学习。

所以这更说明AI远比统计学来得广泛。所以推动这一波AI浪潮的正是神经网络的迅速发展，以及能够让大量数据发挥作用的算法和算力。

问：托马斯·萨金特也谈到了交叉学科研究推动的科技进步，您是否认同？如何评价这种观点？在这波深度学习为推动力的AI浪潮中，哪些学科的交叉起到了推动作用？

金榕：这一观点我很认同，这也是很多学者的共识。就像我上面提到的，AI不是独自成长起来的。1956年的达特茅斯会议(Dartmouth Conference)被学术界公认为是人工智能的起源。

今天有人说现在是人工智能的春天，其实这都源于我之前提到的一系列技术的发展与进步。特别是我刚刚提到的硬件，诸如麦克风阵列技术的成熟对语音识别的发展起到了重要作用。还有超强的算力，不论是GPU或者是云计算，都给我们带来了强大的计算能力和灵活度。

我们在自然语言对话机器人的开发中，还会应用到许多心理学知识。所以说人工智能的繁荣是诸多学科交叉相互影响，共同促进的结果。

问：下一波大的AI技术跃迁，您觉得会有赖于哪些领域/学科的交叉研究成果？

金榕：我认为首先可能来自于AI芯片、量子计算这些全新的计算基础设施对算力的巨大提升上。

此外还有神经科学的一些重要突破，可能将揭示大脑中神经元如何处理信息与做出决策的，这对人工智能的发展也有重要意义。

问：人工智能的概念提出已经60多年了，许多算法和模型在几十年前就曾提出了，但在过去的发展中，碍于计算力和数据的局限，此前的发展并没有像如今这样迅速，这是不是从侧面印证人工智能也算是统计学的一种呢？

金榕：计算力和数据的增长是人工智能发展的必要条件。AI的发展还要感谢Hinton，LeCun, Bengio等研究者的长期坚持。当然统计学也在发展，但由于深度学习的迅速发展，它们反而变得没有以前那么重要了。

除了统计学，对现在人工智能发展起到举足轻重作用的，神经网络的一些研究工作，也是在50年前进行的，但它被广泛应用是从2010年后开始的。

在2010年前，许多上一代机器学习成果的确是基于统计学的，他们被归类于统计机器学习。但技术是持续进步的，近几年推动人工智能进入发展快车道的深度学习技术，并不能归因于统计学。

问：在您能看来，应该如何定义人工智能，如果要跟大众普及的话，应该传递一个什么样的概念？

金榕：我认为智能化的目的，不是让机器像人一样。上一个世纪，在工业时代，我们基本上把人变得越来越像机器，而未来我们真正应该走的道路是，让机器更像机器，人更像人。我们发明了机器，不一定要机器按照人的思考。

机器要有自己的学习方式、思考的方式、解决问题的方式，所以我们提出“机器智能”。机器智能不应该是，让机器人复制人类的智能，而是发展出自己独特的智能。我们应该让机器做人类做不到的东西，让机器去发展自己智能的力量、尊重机器、敬畏机器。所以在阿里我们是以“机器智能”为目标。

举几个例子，诸如人工智能客服，它能7*24小时的工作，对海量用户的接待能力远超人类。人工智能应用于城市大脑，通过智能决策和管理能大幅缩短交通拥堵时间，甚至提高救护车到达现场的时间。

AI在工业领域的应用，诸如将计算机视觉应用于产品质检，已经为许多制造企业节省了数十亿元。这些都是AI比人类更擅长的领域。而在艺术、文学等创造性工作上，人工智能可能永远无法替代人类。

问：还有一种观点是认为算法、计算力和数据是人工智能技术能否成功的三个关键，你是否也这样认为？阿里AI在这三方面现状如何？

金榕：历史上人工智能经历了多次黄金时期。到了今天，我们迎来了新的一波热潮。

那么这次的人工智能热潮有哪些不一样的地方呢。就是由于我们在算法、计算力、数据上都有了重要突破。

首先人类首次拥有了超强的计算能力，不论是GPU还是云计算。给我们带来了强大的计算能力和灵活度。这点阿里具有很大的优势。阿里云在中国拥有最大的云计算服务，同时我们也在积极探索量子计算。

其次，也是很重要的一点，就是大量的数据的产生。海量的数据使AI模型的大规模训练成为可能。阿里巴巴积累了海量的数据与应用场景，这些数据将成为阿里在人工智能领域快速突破的基础。

最后，就是算法领域的突破。深度学习等新技术已经在各个领域得到广泛应用，比如计算机视觉、语音识别、自然语言处等，多点开花。阿里也在算法领域做了很多探索。诸如在语音识别领域，阿里推出了新一代语音识别模型——DFSMN，不仅被谷歌等国外巨头在论文中重点引用，更将全球语音识别准确率纪录提升至96.04%（基于世界最大的免费语音识别数据库LibriSpeech）。

而在机器翻译领域，在此前结束的WMT2018国际机器翻译大赛上，达摩院机器智能-NLP翻译团队打败多个国外巨头与研究机构，在所有提交的5项比赛中，全数获得冠军。这5个项目包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译。短短一年时间，我们已经在20多个各领域的国际人工智能大赛上获得冠军。

附：托马斯·萨金特的演讲全文

托马斯·萨金特：1943年生，1968年获哈佛哲学博士，先后执教于明尼苏达大学、芝加哥大学和哈佛大学，2003年起任教纽约大学至今。

自70年代初以来，萨金特一直是理性预期学派的领袖人物，为新古典宏观经济学体系的建立和发展作出了杰出贡献。

2011年，萨金特与普林斯顿大学西姆斯教授一起获得诺贝尔经济学家，得奖理由是：“对宏观经济中因果的实证研究”。

以下演讲是萨金特在厚益控股&《财经》世界科技创新论坛上的演讲全文：

首先我对刚才几位嘉宾讲的话非常感兴趣，我想先谈一谈我的感受，然后再讲讲我的部分。

第一，能不能扮演上帝。作为科学家，很多领域的科学家，我们都需要用统计数据说话。其实在这个时候我们已经在扮演上帝的角色了。

什么意思？有好多应用科学像工程学、物理学、经济学都是应用科学，我们会建立一些模型模拟世界运营，我们的理论也是一样，都是由一系列的等式所构成，有一些随机组成部件。

我们的目的是希望解释我们所观察到的世界上的现象，而我们关键的工具是使用模型，然后放到电脑里模拟。把模拟后的数据拿来，利用数学方法，去微调它的参数，希望尽量接近于现实。

在这个过程中，我们扮演上帝的角色。所以写参数、模拟过程中是在假装，我们是在假装是上帝产生了这些数据。我们尽量想接近这个准确度。我们想接近或者模拟上帝的做法。

这个说起来容易做起来非常难，两百年、三百年前人们认为这是个好主意，但是当年的人不知道怎么操作。为什么？因为比如说你写下一个粒子的模型没有办法运算，算不出来。

但是到了二十世纪尤其是二战结束以后，我们出现了一些技术的巨将，包括诺尔曼，来自于奥地利的一个移民。我的岳父泰勒是研究核弹的，他们发明了蒙特卡洛模型，都是50多岁的时候发明的。

但是三、四年以后统计学家来了，搞清楚了可以做统计分析。所以这时候来了一场革命，影响了各行各业的科学家的研究工作，这就是技术创新带来的好处。其实这个过程中我们都在扮演上帝的角色。

我怎么讲到这儿来了呢？人工智能首先是一些很华丽的辞藻。人工智能其实就是统计学，只不过用了一个很华丽的辞藻，其实就是统计学。

好多的公式都非常老，但是我们说所有的人工智能利用的都是统计学来解决问题。有一些新发展，过去二三十年，今天我们统计学的完成质量更高，首先电脑运算速度更快，有新的算法，好多是源于物理学发展，还有统计力学等等，这是过去3到4年从物理学拿来，加速了我们做系列统计学方面的进步。

过去写下来公式，但是没有办法求解，过去你放计算机，但是能力太差，做不了。后来有了AlphaGo，就是一个动态编程，太大了。两三年前的解决之道就是特别大、特别快的计算机，利用一块一块的算法去运算。我觉得亚当斯密百分之百正确，多少年前说应该有专业分工，这是正确的。

今天有很多工具，如果统计学家一点也不懂物理学，很多人类科技进步就不能变成现实。所以我想作为企业家大家也应该做通才，我们应该去考虑来自不同技术的融合或者是相互促进，这就是为什么有了阿尔法GO的成功。

还有一两点，是刚才听了前面发言人的一些感受。到底什么是金融？金融的含义是什么？问一个高中生什么是金融，他觉得是太华丽的一个辞藻。

什么是金融？金融就是有人存钱有人不存钱，有人花的多挣的少，有人想投资，人是不一样的。什么是储蓄？什么是金融？有一些人就是来做中介，存钱的和需要花钱的人做中介，这个业务就是金融。

这个业务包含以下几方面。首先很容易受到欺诈侵害。第二很容易受到不信任的伤害。如果我攒了钱，把钱交给别人帮我打理，我交给的人是我信任的人，他没有不还钱的动机。他为什么还钱给我。金融体系要验证，我把钱借给你之后会不会还我，这就是金融的关键。如何让别人相信你？金融该是信任和验证相关的活动。在这些方面是有技术发展的，就是验证和信任的工具。

是谁作为主体，是国家做还是谁做？你以自己的生活为例，你和你的家人为例，家人之间也有很多的信任和验证。

比如，阿里巴巴或者亚马逊是“国中国”，因为他们的工作是创造交易平台，人们可以参与买方卖方在他们的交易平台上活动，无论是阿里巴巴还是亚马逊都是发挥警察作用，既管理买方也管理卖方，相当于电子警察，他们开发技术，改良交易平台的信任和验证。

像20到25年前你们的工作。就是前沿的工作，当时就在讲这样的问题的理论，这个理论的技术不断进步。

最后我还想一点，有新的领域的出现，我应该意识到算法机制设计。这个涉及了几个领域。

首先，它讲的是如何运转一个国家或者是运转一个公司像阿里巴巴，或者运转一个拍卖，如何保证人们付款。它结合了什么？结合了计算机科学、博弈论、计算、数学运算，也就是说，上过这门课的人了解了好多东西。他要了解各种各样的学科，所以说专家和通才一起开创新的领域，这些都是值得大家追踪的新的领域。

原文发布时间：2018年08月27日
本文来自云栖社区合作伙伴“”，了解相关信息可以关注“”。
本文经授权转载，不代表阿里云及云栖社区立场。如若转载请联系原作者。

《集异璧》作者侯世达疯狂吐槽谷歌翻译：AI让译者失业？还早着呢

机器能在完全不理解语言的情况下拿出高品质的翻译作品吗？本文来自微信公众号：，作者：侯世达（DOUGLAS HOFSTADTER，美国著名认知科学家、比较文学家、翻译家，印第安纳大学认知科学和比较文学教授、著有《哥德尔、艾舍尔、巴赫：集异璧之大成》，该书获得普利策奖和美国国家图书奖），原文发表于《 THE ATLANTIC》。

某个周日，在我们每周一次的莎莎舞会上（salsa sessions），我的朋友弗兰克带了一个丹麦朋友来。我知道弗兰克的丹麦语讲得很好，因为他的母亲是丹麦人，他小时候曾在丹麦生活过。而他带来的那个朋友，跟所有斯堪的纳维亚人一样，能讲一口流利的英语。然而，令我惊讶的是，在晚上闲聊的过程中，他们居然习惯性地用“谷歌翻译”交换信息。弗兰克用英文写下文字，然后用“谷歌翻译”转译成丹麦语；而他的朋友则用丹麦语写下文字，然后用“谷歌翻译”转译成英语。

这太奇怪了！为什么会讲对方语言的两个聪明人要用这种方式沟通呢？我对机器翻译的体验总是让我对它不够信任。但这两个朋友显然没有我的那种疑虑。实际上，很多受过良好教育的人对于机器翻译都抱有相当大的热情，很少对它产生质疑。这让我颇感困惑。

作为一个语言爱好者和翻译热爱者，作为一个认知科学家和一个人类精妙心智的终身敬畏者，几十年来我一直在关注机器翻译的进展。当我最初在1970年代对它产生兴趣时，我读过一封信，是数学家、机器翻译早期倡议者沃伦·韦弗（Warren Weaver）于1947年写给控制论专家诺伯特·维纳（Norbert Wiener）的。在信中，韦弗写了一句很有意思的话，今天仍为众人所熟知：

当我阅读用俄罗斯语写的文章时，我会对自己说，“这篇文章实际上是用英语写的，只不过被编码成了一些奇怪的符号。现在，我要把这些符号解码回来。”

几年后，他表达了不同的看法：“没有一个理性的人会认为，机器翻译能够做到‘信、雅、达’。普希金不需要为此感到担忧。” 哈！我曾用了我人生中整整一年的时间，将亚历山大·普希金的著名诗体小说《叶甫盖尼·奥涅金》翻译成我的母语（也即是，把这一伟大的俄罗斯文学作品重新翻译成英文诗体小说），这真是一段令我难忘的经历。我发现维纳的新观点揭示了语言朴素的本质，更接近于语言的真相。尽管如此，他在1947年提出的“翻译即解码”的观点还是成为了机器翻译领域的一种信仰。

从那以后，“翻译机器”逐渐有了发展。直到最近，对所谓“深度神经网络”的使用，让有些观察家（参见纪德·刘易斯-克劳斯（Gideon Lewis-Kraus）在《纽约时报杂志》上发表的《The Great AI Awakening》，以及雷恩·格林（Lane Greene）在《经济学人》上发表的《Machine Translation: Beyond Babel》）宣称，人类译者将成为濒危物种。照此发展下去，用不了几年，人类译者要做的事情就不是创造新的文本了，而是对文本进行修修补补和质量控制。

果真如此的话，这将对我的精神生活造成巨大的冲击。虽然我完全理解人们对机器翻译的痴迷，但我肯定属于最不希望人类译者被无情的机器所取代的那类人。事实上，机器翻译令我感到恐惧和厌恶。在我看来，翻译是一种难以置信的精妙艺术，它需要译者有丰富的人生阅历和创造性的想象力。如果真有那么一天，人类译者成了历史的遗迹，我对人类心智的敬畏就会受到动摇，这种动摇会让我陷入可怕的困扰和无尽的悲伤之中。

每当我读到文章宣称，人类译者作为一个群体将很快向新技术的快刀利剑俯首称臣时，我总有一种想要亲自检验这种判断的冲动，这一方面是因为，我感到技术替代的魔魇可能近在眼前；另一方面是因为，我由衷希望自己能够确证，危险并非迫在眉睫；最后，出于我一贯的信念，我想要挑战那些夸大其词的人工智能威胁论。

人工神经网络并不是一项新奇的技术。最近，在谷歌内部被称为“谷歌大脑”（Google Brain）的部门采用了这项技术，同时，又用“深度学习”增强了它的能力。我阅读了相关文献，了解了被称为革命性翻译机器的软件机理，然后，我决定亲自测试最新版本的“谷歌翻译”。它真的是一个颠覆者吗，就像“深蓝”和“AlphaGo”之于象棋和围棋那样？

我发现，虽然“谷歌翻译”的老版本可以处理多种语言，但新的深度学习版本目前只能处理9种语言。（最新情况是，它可以处理96种了。）其中，我只打算测试英语、法语、德语和中文。

在展现测试结果之前，我应当指出，“深度”这一形容词的含义是模糊不清的。当人们听说谷歌买了一家名叫DeepMind的公司，其产品使用了用“深度学习”技术增强的“深度神经网络”时，下意识中会将“深度”一词理解为“深刻”，进而理解为“强大”、“颖悟”、“聪明”。然而，这里的“深度”仅仅是指这样一个事实：新的神经网络比老的神经网络拥有更多的层次，比如说，前者有12层，后者只有2、3层。那么，这种层级数量的差异是否意味着，神经网络必然会更聪明呢？并非如此，这不过是语义上的误解。

“谷歌翻译”的宣传声势浩大，但我对它却持有谨慎态度。尽管对它并无好感，但我也意识到它的确带来了一些惊喜。它对地球上的每个人都是免费的，能够将差不多100种语言转译成任何一种其他语言。这真是一件了不起的成就。如果我可以骄傲地称自己是“三种全会”（pi-lingual）的话[1]（如果有人问我“你会说几种语言”，我会很愉快地回答，大概会3种语言），那么“谷歌翻译”得有多骄傲啊，毕竟，它可以把自己称为“百种全会”（bai-lingual）（“百”在中文里是指数字“100”）。对于只会3种语言的人来讲，会100种语言简直难以想象。并且，如果我将一张语言A的文字复制粘贴，放进“谷歌翻译”，不消几秒钟，它就能被翻译成语言B。在数种语言之间自由转换，这种效果在任何地方任何屏幕上都能实现。

“谷歌翻译”和相关技术的实用性是毋庸置疑的，总体而言也是很好的工具。但它在技术方法上还是极度欠缺一种东西，一言以蔽之：理解力。机器翻译绝对做不到理解语言。相反，它的方法只是试图去“解码”——而不去考虑究竟什么是理解和意义。那么，是否不需要理解就能做好翻译呢？某种事物——人类或机器——能在完全不理解语言的情况下拿出高品质的翻译作品吗？为了回答这个问题，现在我要谈及我所做过的几个实验。

我的实验最先是从小处着手的。我使用了下面这段简短的话，人类的心智能够对它产生清晰的画面感：

在他们的房间里，每样东西都是成对出现的。有他的车，就有她的车；有他的毛巾，就有她的毛巾；有他的书房，就有她的书房。

这段话翻起来似乎是很容易的，然而在法语中（以及在其他拉丁语系中），“他”和“她”这样的性别词汇不是由事物的所有者来界定的，而是由事物本身来界定的[2]。于是，“谷歌翻译”呈现给我们的结果就是：

在他们的房间里，每样东西都是成对出现的。有他的车，就有他的车；有她的毛巾，就有她的毛巾；有他的书房，就有他们。

这样的结果在我预料之中。它没能意识到，我的这段话描述的是一对夫妻，强调了丈夫（他）拥有的每一样东西，他的妻子（她）也拥有。例如，深度学习引擎用了“sa”（他的）这个词来表示“他的车”和“她的车”，因此，你无法知道车主的性别。类似地，它还用了无性别的复数词“ses”来表示“他的毛巾”和“她的毛巾”。至于最后提到的两个书房（他的和她的），它则干脆省掉了“hers”中的“s”，认为“s”在这里表示复数，意指“他们”（“les siennes”）[3]。可以说，在翻成法文的时候，“谷歌翻译”完全领会错了意思。然而，每一个人类读者都能正确理解这段话的言外之意。接下来，我自己把这段话翻成了法文，正确表达了全部意思。以下是我的法文版本：

“sa voiture à elle”表示“她的车”，而“sa voiture à lui”只能被理解为“他的车”。这时，我猜想“谷歌翻译”应该很容易把我的法文版本准确翻回到英文，但我完全想错了。下面是它呈现给我的结果：

在家里，他们的每样东西都有两个。有他自己的车和他自己的车，他自己的毛巾和他自己的毛巾，他自己的书房和他自己的书房。

这都什么鬼啊？！即便输入的语句专门强调了物主的性别，翻译机器还是忽略了这一点，把所有性别都翻成了男性。为什么它会丢掉如此重要的信息呢？

我们人类都知道，什么是夫妻、房屋、个人物品、骄傲、竞争、嫉妒、隐私，以及很多其他似乎难以理解的怪癖，比如，结了婚的夫妻，各自的毛巾也要分别刺上“他的”和“她的”字样。而“谷歌翻译”却不明就里，或者准确地说，它暂时还不明就里。它只熟悉由字母所组成的字符串，只知道以超快的速度处理一段段文字，而不知道如何思考、想象、记忆和理解这些文字。它甚至不知道文字指涉了事物。我可以毫不犹豫地说，理论上讲，计算机程序本可以理解语言的用途，可以拥有思想、记忆和经验，可以应用它们。然而，“谷歌翻译”却不是为了这些目的而设计的，设计人员甚至根本没有这样的野心。

好吧，我对它的这些糟糕表现窃喜不已，并感到一丝宽慰，毕竟，人类译者还不会很快被机器所取代。但我还是认为，我应该更深入地了解这部机器，毕竟，一口水，不解渴。（one swallow does not thirst quench.）

这是一个符合语法的法文句子，但它的意思很费解。首先，它提到了一种鸟（“une hirondelle”——一种燕子），然后，它又说这种鸟不能吸气，或者不能吮吸（n’aspire pas），最终的意思就是说，这种既不吸气又不吮吸的东西口渴了（la

现在，让我们从法语的“油锅”跳到德语的“火坑”。最近，我迷上了奥地利数学家卡尔·西格蒙德（Karl Sigmund）写的《Sie nannten sich der Wiener Kreis》（人们把他们称为“维也纳学派”）一书。它讲述了维也纳的一群理想主义知识分子在1920年代和1930年代的故事，这群人对20世纪的哲学和科学产生了巨大影响。我选择了书中的一小段文字来考验“谷歌翻译”。我将先呈现德语原文，然后给出我自己的翻译版本，最后给出“谷歌翻译”的版本。（顺便提一句，有两个母语是德语的人核对了我的翻译，包括卡尔·西格蒙德，因此，我认为你大可相信我的翻译是准确的。）

战败之后，泛德国主义在当时的教职员工中是主流倾向，很多持有这种倾向的教授认为，自己完全有责任让高等教育机构免受“政治上不受欢迎的人”的影响。最有可能被开除的是青年学者，他们还没有获得在大学授课的教职。对于女性学者而言，她们在大学里更是没有立足之地，这是再明显不过的事实了。

战败之后，很多德国籍的教授，同时也是教职员工中的多数派，认为自己有责任让大学避免“奇数”；在获得资格之前，青年科学家是最容易受到影响的。总之，科学家没有产生质疑，几乎没有了。

“谷歌翻译”呈现的都是英文词汇（然而，不清楚是什么原因，有两个大写字母没用对地方）。除此之外，似乎还过得去。然而，很快你就会发现不对劲了，越往下读，问题越大。

首先，我注意到了“odd”这个词。它对应了德文中的“die ‘ungeraden”，意思是“政治上不受欢迎的人”。然而，“谷歌翻译”有理由——出于非常简单的统计学上的理由——选择“odd”这个词。也即是说，在其上百种语言的数据库中，“ungerade”这个词总是被译作“奇数”（odd）。尽管机器本身并不知道为什么会这么翻，但我可以告诉你原因何在。

这是因为“ungerade”的意思——字面意思是“不平的”或“不均匀的”——几乎总是意指“不能被2除尽”。而我的翻译版本有意选择了“undesirables”一词，从而使得对“Ungeraden”一词的翻译与统计概率无关，而是来自于我对语境的理解——来自于我注意到文字中没有被清晰表达出来的含义，而且“ungerade”的这种含义绝不可能在我自己的德语词典中找到。

让我们再来看看“Habilitation”这个德语词汇，它意指大学的教职，相当于终身教授。英文里也有同样词根的词“habilitation”，不过它很少被使用，自然也不会让人联想到终身教授或者类似的事物。所以，我需要简单解释而不只是引用这个含义模糊的词。机器翻译不可能真正理解以英文为母语的读者，“谷歌翻译”当然也做不到这一点，因为它不能模仿读者的知识。

不过，最后两句话才真正表明了，为什么理解对于翻译而言至关重要。德语名词“Wissenschaftler”由15个字母组成，意思是“科学家”或“学者”。（我选择了后者，因为在文中的语境下，它意指一般意义上的知识分子，而“谷歌翻译”则没能理解这一细微之处。）另一个与此相关的词“Wissenschaftlerin”由17个字母组成，我们可以在最后一句话中看到其复数形式“Wissenschaftlerinnen”，它是一个指代了性别的德语名词。单数名词在语法上指代男性，意指男性学者，复数名词指代女性，只适用于女性学者。我自己的翻译版本用了“女性学者”（female scholar）来理解这层意思。而“谷歌翻译”并没有理解增加了“in”这个后缀的阴性词是最后这句话的核心意义所在。由于它没能意识到“女性”这层意思，就只能再次使用“科学家”这个词，因此没有理解整句话的意思。就像前面的法语例子一样，“谷歌翻译”完全不理解，这段德文的中心意思是要比较男性学者和女性学者的不同境况。

frage）的正确翻译吗？显然，它没能呈现出原文的意思——甚至完全挨不上边。它只是随意地将德语词汇翻成了英语词汇。这样的结果可以被贴上“翻译”的标签吗？

这个句子的后半部分同样是错译的。最后6个德语词汇的字面意思是，“没有更多的共识了”，或者更直白一点，“这就是人们达成的最大共识了”。然而，“谷歌翻译”却将这句意思很明确的话翻成了“几乎没有了”。作为人类的我们可能会问“几乎没有什么了？”但翻译机器是不会关心这个问题的。“谷歌翻译”对于语境完全不理解，因此它甚至不能回答看上去很简单的问题。翻译引擎不能想象数量的大小或者事物的数量。它只是把数字翻出来，并没有意识到这些数字象征了某些事物。

人类有着丰富的人生阅历，也能赋予语言以意义，因此很难察觉到“谷歌翻译”呈现在屏幕上的文字是漏洞百出的。人们几乎会不假思索地认为，一款能如此流畅地翻译语言的软件一定能够理解文字的含义。这种典型的幻觉与人工智能有关，被称为“伊莉莎效应”（ELIZA effect），它迷幻了人们的双眼，让人们误以为机器可以理解英语。时光回到1960年代，研究人员设计了一个被称为“伊莉莎”的虚假的语言机器人，并把它假扮成了一个精神治疗师。“伊莉莎”让每一个与它打过交道的人产生了一种奇怪的感觉：它能够深刻理解人们心灵深处的感受。

几十年来，颇有见识的人们——甚至一些人工智能的研究人员——也陷入了“伊莉莎效应”。为了确保我的读者避开这一陷阱，让我从前面的段落中引用一些词组——也即是，“‘谷歌翻译’没有理解能力”，“它不能意识到”，“‘谷歌翻译’没有最起码的想法”。然而悖论之处在于，这些词组一直在说“谷歌翻译”欠缺理解力，而这同时又意味着，它至少在有些时候应该具备理解一个单词、一个词组或一句话的含义或所指事物的能力。但事实并非如此。“谷歌翻译”绕开或回避了对语言的理解。

对我而言，“翻译”这个词散发着神秘而振奋的光芒。它代表了一种深刻的人类艺术形式，能够优雅地将用语言A表达的清晰思想转化成用语言B表达的清晰思想。而这种转化的桥梁不仅仅要确保清晰性，还要呈现出原作者的品味、癖好和写作风格。

当我在做翻译的时候，我首先会仔细阅读原文，尽可能准确理解文中的内容，让它们在我脑海中来回酝酿。这不是说让原文中的词句来回酝酿，而是让原文中的思想激荡起其他相关的思想，从而在我脑海中创造出与这些场景相关的美妙光环。

不消说，这些光环大多是无意识的。只有当这种光环在我脑海中被成功激发出来时，我才会试图去用另一种语言将它表达出来——让它“喷薄而出”。我希望能用语言B将那种光环表达出来。

简而言之，我并不是简单地将语言A中的单词和词组转化成语言B中的单词和词组，而是要在无意识中将图像、场景、思想呈现出来，发掘出我自己的人生经历（或者读过的书籍、看过的电影、朋友的教诲），只有当这些非语言的、想象的、体验的、心灵的“光环”被感受到的时候——只有当晦暗不明的意义泡沫漂浮在我脑海中时——我才会开始用另一种语言来书写词汇和语句，然后，修改，修改，再修改。这一通过理解语言来实现的过程似乎显得过于笨拙。

事实上，跟“谷歌翻译”2、3秒就能翻出一个页面的速度相比，情况的确如此——但这正是严肃的人类译者应该做的事情。每当我听到那个令人亢奋的术语“深度心智”（deep mind）时，我所想到的正是上述场景。

现在，我要转向对中文翻译的测试，这对深度学习软件的挑战比前两种欧洲语言要大得多。我的测试材料来自令人温暖的回忆录《我们仨》，作者是中国剧作家和翻译家杨绛，她刚去世没几年，享年104岁。该书讲述了她、她的丈夫钱钟书（也是一个小说家和翻译家）和她女儿跌宕起伏的人生。这本书的文字并不晦涩，但中文用语很规范。我选择了其中一小段，让“谷歌翻译”来完成。以下是翻译结果和我自己的翻译（已经过母语为中文的人的审校）：

钟书到清华工作一年后，调任毛选翻译委员会的工作，住在城里，周末回校。他仍兼管研究生。

毛选翻译委员会的领导是徐永煐同志。介绍钟书做这份工作的是清华同学乔冠华同志。

事定之日，晚饭后，有一位旧友特雇黄包车从城里赶来祝贺。客去后，钟书惶恐地对我说：

他以为我要做“南书房行走”了。这件事不是好做的，不求有功，但求无过。

我将简要指出一些谬误之处。

首先，“谷歌翻译”完全没有提到“钟书”这个名字，而它在原文中出现过3次。翻译机器首先用了代词“他”，然后又用了“这本书”（the book），接着又说“惶恐的书在书中”（the book of fear in the book）。你就去猜是什么意思吧！

第二处谬误是，第一段文字说得很清楚，钟书仍然兼管研究生，而“谷歌翻译”却把钟书翻成了研究生。

第三处谬误是关于“毛选翻译委员会”，毛泽东主席的“东”字被省掉了。

第四处谬误是，“永煐”这个名字被译成了“Yongjian”。

第五处谬误是，“客去后”被翻成了“客要走”。

第六处谬误是，最后一句话完全不知所云。好吧，这六处错误已经能让“谷歌翻译”够喝一壶的了，不过我们完全可以不用在意这些错误。现在，我将集中探讨一个令人费解的词组——最后一段话中由5个单词组成的、用引号标注的词组（“南书房行走”）。如果逐字翻译，这个词组可以被译作“south book room go walk”，但这种大杂烩显然是难以理解的，尤其是考虑到文中的语境，它肯定是一个名词。“谷歌翻译”给出的结果是“South study walking”，但仍然词不达意。

我得承认，刚开始我也不知道这个中文词组是什么意思。尽管从字面上看它的意思似乎是，在某栋建筑的南边学习的时候移动自己的脚步。我知道，这种理解肯定是错的，不符合语境。为了翻译它，我不得不去了解我并不太熟悉的中国文化。我该寻求谁的帮助呢？谷歌啊！（但不是“谷歌翻译”。）我将这几个中文单词连同引号输入谷歌搜索框，然后让引擎自己去搜索。很快，一堆中文网页跳了出来，我痛苦地在前两个网页呈现的中文语句中搜寻，想要搞明白这个词组究竟是什么意思。

我发现，这个词要追溯到清朝（年），专指辅助皇帝的知识分子，他们的责任是帮助皇帝（在皇宫的南书房）起草漂亮的官方文件。“行走”这个词实际上意指“辅助”。因此，根据谷歌搜索提供的信息，我把这个词组翻译成了“South Study special aide”。显然，“谷歌翻译”没能像我一样好好利用谷歌搜索，这真是太糟糕不过了，不是吗？尽管“谷歌翻译”能在瞬间翻出这个词组，但它不能理解网页里的中文内容。我把我查看的中文网页信息输入“谷歌翻译”，它很快就呈现了如下结果：

这难道不是英文翻译吗？我们当然都知道，这段话是由英文单词组成的（至少绝大部分是如此），但这是否意味着它是一篇英语文章呢？在我看来，上面这段翻译不知所云，因此它不能算是英语文章，只是由英文单词拼凑而成的大杂烩——随机的词汇拼盘，毫无逻辑的乱炖。为了满足你的好奇心，我自己对这段文字做了翻译（花了我好几个小时）：

有些读者可能会怀疑，我是为了贬损“谷歌翻译”才有意选取那些难翻的文字的，而实际上“谷歌翻译”在大多数情况下的表现要好得多。这听起来有些道理，但事实上却并非如此。我从自己最近读的任意一本书中随机选取一段文字让它翻译，都会出现各种各样的错误，包括出现前面所提到的不知所云和无法理解的词组。

当然，我承认，“谷歌翻译”有时会翻出一些看上去还不赖的句子（尽管与原文的意思仍有偏差或者完全误解了原文）。一两段翻得不错的完整语句可能会让人产生幻觉：“谷歌翻译”知道自己在做什么，能够理解它所“阅读”的文字。在这种情况下，它似乎给人留下了深刻的印象——它几乎能达到人类的水平！

这样的赞美当然要归功于它的发明者和他们艰苦的工作。但与此同时，不要忘了，“谷歌翻译”是如何翻译前面那两段中文内容的，以及更前面的法语和德语段落的。要理解它为什么是失败的项目，人们需要牢记“伊莉莎效应”。百种语言引擎并没有在阅读任何东西——至少不是人类意义上“阅读”。它只是在机械处理文字。它所处理的符号与我们对这个世界的体验无关。它没有记忆可供提取，它能够快速处理文字，但这些文字对它而言没有图像、没有理解、没有意义。

一个朋友问我，“谷歌翻译”的局限是否只是大数据资源不足造成的。他认为，如果你能大幅增加数据资源，比如，数百万或数十亿个数据库，最终它就能满足你所有的翻译需求，并且还能翻得很完美。但我不这么认为。拥有更多的“大数据”不会让你更接近于获得理解力，因为理解力涉及到拥有思想，缺乏思想是今天机器学习面临的最根本的问题。因此，我敢说，更大的数据库——甚至巨大的数据库——也不能解决这个问题。

自然，这又引出了另一个问题：“谷歌翻译”对神经网络——一种试图模拟大脑的技术——的使用能让机器对语言产生理解吗？初看起来，似乎是可行的。

但“谷歌翻译”对语言的处理仍然没能超越单词和词组这样的初级层面。在庞大数据库中，所有类型的统计数据都可以被用于神经网络，但这些统计数据只是用某些词语去联接另一些词语，而不是去联接思想。它没有试图创造一种内部结构，这种结构可以被视作思想、图像、记忆、体验。这些缥缈的心智内容仍然难以用算法来创生，因此，作为一种替代品，谷歌使用了成熟而具有效率的语词聚类统计算法。然而，这种技术的效果无法等同于思想，而思想是人们在阅读、理解、创造、修改、评判作品的过程中产生的。

尽管我的看法是偏负面的，但人们对于“谷歌翻译”提供的服务还是给予了很高评价：它虽然不能很准确地把语言A翻成语言B，但的确可以在交流过程中发挥应急作用。只要被翻成语言B的文字大体上可以被理解，很多人就会对它十分满意。如果人们能明白一段外语的“基本意思”，他们就会觉得很开心。然而，在我看来，这显然不是“翻译”这个词的本义，但对有些人来说，“谷歌翻译”无疑是一个伟大的产品，它所做的工作就是翻译。

好吧，我明白这些人的需求，也理解他们的那种开心。对他们而言，这的确是一种幸运。最近，我看到有技术狂热分子制作了柱状图，号称可以比较人工翻译和机器翻译的“质量”，这些图形表明，最新版本的翻译引擎已经很接近人工翻译水平了。但是，在我看来，这是一种对无法量化的事物进行量化的伪科学，或者，你也可以认为，是一群技术呆子试图将无形的、微妙的、艺术的事物进行量化。

在我眼里，今天的“谷歌翻译”，其水准既有优秀的一面，也有搞笑的一面，而我是无法把我对它的感受进行量化的。回想一下前面提到的第一个翻译例子吧，里面涉及到“他的”和“她的”物品，没有理解能力的翻译机器几乎把这些物品都翻对了。尽管取得了这样小小的成功，但它还是没能理解整段话的意思。在这种情况下，人们应该如何量化它的工作质量呢？用看上去很科学的图表去证明翻译质量，不过是对科学方法的滥用而已。

让我回到人类译者的悲观图景：他们很快将被机器超越和淘汰，逐渐变得无所事事，从而成为翻译质量的检验者和文字的修补者。这种看法充其量只适用于平庸的译者。一个严肃艺术家的工作绝不是从对低俗破烂作品的修修补补开始的，这些破烂不可能被打造成高雅艺术。艺术不是这个样子，而翻译无疑是一门艺术。

在我多年的写作生涯中，我一直坚持认为，人类的大脑是一部机器——非常复杂的机器——我完全反对有些人的说法，说机器天然就不可能理解意义。甚至有一派哲学家声称，计算机绝不可能“理解语义”，因为它们是由“错误的材料”（硅）组成的。在我看来，这种观点是草率的胡说八道。我不想在这里深入讨论这个问题，但我也不想让读者对我留下这样一种印象：我相信计算机永远不可能拥有智力和理解力。如果我的这篇文章传递了这样一种意思，那是因为我提到的技术没有触及到人类智力的核心之处，前面所举的那些例子很清晰地表明了机器翻译的局限性。

在我看来，没有根本的理由认为，原则上机器不会在某一天学会思考、创造、搞怪、怀旧、兴奋、恐惧、高兴、沉默、期盼。进而言之，机器可以真正学会在不同语言之间进行翻译。没有根本的理由认为，机器不会在某一天成功翻译笑话、双关语、剧本、小说、诗歌，当然，还有像本文这样的文章。但是，所有这一切只有在机器拥有了类似人类的思想、情绪和体验的基础上才能实现，而这绝非近在咫尺的事情。实际上，我相信我们还有相当长的路要走。至少，这是一个一辈子对人类心智之深邃充满敬畏的人所热切希望的。

如果有一天翻译机器能翻出用诗一般的英文写出的文艺小说，并准确呈现出其中的押韵、赋格、节律、智慧、悲伤和声韵，那么我知道，是时候摘下我的帽子，向它致敬了。

[1] Pi在这里是π的谐音，代表略大于3的数字。

[2] 比如，汽车通常被认为是属于男性的物品，因此，法语就只会说“他的汽车”，而不会说“她的汽车”。毛巾通常被认为是属于女性的物品，因此，法语就只会说“她的毛巾”，而不会说“他的毛巾”。

[3] hers本来意指“她的书房”，但它没把这个意思翻出来，而是翻成了“他们”。

[4] 中文意思与原文翻成的中文大致相同。

[5] 这句法文是谷歌翻译的，作者认为它是词不达意的。

本文来自微信公众号：，作者：侯世达（DOUGLAS HOFSTADTER，美国著名认知科学家、比较文学家、翻译家，印第安纳大学认知科学和比较文学教授、著有《哥德尔、艾舍尔、巴赫：集异璧之大成》，该书获得普利策奖和美国国家图书奖），原文发表于《 THE ATLANTIC》。

*文章为作者独立观点，不代表虎嗅网立场

什么是神经网络算法共识算法？

我要回帖

更多关于神经网络算法的文章

随机推荐

什么是神经网络算法共识算法？

我要回帖

更多关于 神经网络算法 的文章

随机推荐

更多关于神经网络算法的文章