No.418 Google神经网络与统计学派的渊源

这一期还是讲人工智能中自然语言处理这一方面的内容，跟上一期差不多，上一期讲的是乔姆斯基，他对人工智能的认识是，人工智能必须要真正的懂，才能叫人工智能，否则一个黑盒子，叫啥人工智能。

但是，有人不这么认为，不一定要懂啊？按照我们的生活常识，我们不懂月食是怎么回事，就敲铁盆子，一会儿功夫，天狗就把月亮吐出来了。现在我们知道了，不敲铁盆子，月亮一会儿也能出来，但是当时不懂啊，还认为是自己敲出来的。可能有人会说，你这个例子举的不恰当，现在啥年代了，其实我倒是觉得，人类没有太大的进步，跟认为月食是天狗吞了月亮大差不差。比如，有火灾发生了，最值得尊重的人是消防员，要卖命去救火，但是大部分人认为是最后那个领导，而且我发现，几乎每个领导都是肥头大耳，跟猪八戒是兄弟，如果没有他的领导，好像消防员不会用灭火器一样。反正最后火灭了，最后功劳归领导。

乔姆斯基认为把技术搞成黑盒子，是没前途的。就算你做的软件，你自己都没法解释为什么会输出这种结果，纯粹是瞎搞。在2011年的时候，麻省理工学院要搞事，把乔姆斯基请了过去，还有一大批大佬，取了一个极具挑衅意味的标题《不会思考的电脑》（Unthinkable Machines）。如果只请他也就算了，还请了另外一些认为电脑是会思考的机器，把一大堆搞神经网络的人也请去了。这明显的是摆擂台，希望看到这些大佬火药味十足的互喷，结果大家有点失望，这些大佬有点像梅西跟C罗，下面的粉丝可能会互相骂，但是梅西跟C罗，见面还是会打招呼的。主人没什么深仇大恨，反而是左手牵的黄，右手擎的苍先打起来了。有兴趣的可以去互联网上看看大佬对谈的视频，不仅没有火药味，人家还彼此欣赏。

当然了，跟C罗跟梅西差不多，见面不吵，在网上还是可以隔空掐架的。被邀请的有个人叫皮特诺维格（Peter Norvig），我以前翻译过他写的一篇文章叫《十年学会编程》，还做了一期电台。这个人是Google公司的研发总监，这个人的观点是，不管黑猫白猫，能给出准确的答案就是好猫。而且他认为，让电脑学会语法，根本没什么大用，反而是搞神经网络，对自然语言处理有很大的好处。

这两种人的观点一直都有，包括前段时间OpenAI的争论也是如此，一派人是科学家，一派人是工程师。科学家倾向于要把原理搞明白，而工程师是把任务先完成，至于什么后果，再说。比如爱因斯坦是科学家，他能把质能方程搞出来，但是你让他去搞曼哈顿工程，那他肯定搞不定，因为老爱喜欢美女，直接被苏联的美女间谍给睡的三迷五道的。但是爱因斯坦是可以指明方向的人。有人能搞工程，他就是奥本海默，他的理论知识也许没有爱因斯坦那么丰富，但是这哥们能搞事儿。比如，这个工程需要用到一种良好的导热材料，比较好的导热材料是白银。于是这哥们跑到美国财政部要借白银一用，财政部长问，要多么？奥本海默说，不多，15000吨。财政部长使出全身的内力，几乎把面前的办公桌给拍碎，说：小伙子，我们财政部说白银的单位用的是盎司，你给我借15000吨！你就不怕说话闪了舌头？人家奥本海默，就是能搞定。所以，这是搞工程的人。以我现在的经验，真正能指明方向的人是少数，瞎指挥的人挺多。真正能实现工程的人也是少数，进去瞎写bug的人多。又能指明方向，又能做工程的人，那就更少了，只有图灵，冯诺伊曼才可以。

用在人工智能方面，一直有这两派的争论。一派是要完全搞清楚，以防人工智能把人类一波全给带走了。另一派呢，则是先搞出来，万一带不走呢？当然，也有人立场不坚定，在这两派中横跳。比如，可能是世界上最早的人工智能聊天软件之一名为ELIZA软件的作者，他的名字叫魏森鲍姆，为了叫的顺口一点以后我称呼他为老魏。老魏的父母是犹太人，在德国要屠杀犹太人之前的一年，全家搬家到美国。我说的全家是他爸爸妈妈还有他，不包括他的爷爷奶奶这些，他家里有几位亲属死在希特勒的屠刀下。他的母语是德语，在上大学期间，二战爆发，这哥们勇敢的参加了美国空军，开着波音的B29轰炸机，把一颗颗炸弹倾泻在自己祖国的土地上，如果你受到了他家所遭遇的迫害，你还会爱你的祖国，爱你的元首么？如果你还爱，那我只能说你畜生都不如。这可是血海深仇啊！老魏后来的写作也是用德语，他去麻省理工当了教授，而且是终身教授，他写了ELIZA这个人工智能对话程序，后来所有的人工智能对话，比如ChatGPT什么的，都得喊ELIZA一声师傅。

而且这个ELIZA的名字更传奇，也更有意境。这个名字来源于萧伯纳的剧本，他的代表作品之一是《卖花女》（Pygmalion），这是一部经典的戏剧作品。《卖花女》的故事围绕一个叫做爱丽莎・杜尔德尔（Eliza Doolittle）的贫穷伦敦女子展开。主人公亨利・希金斯教授下注，他能够将这位卖花女变成上流社会的淑女，仅仅通过改变她的语言和举止。这个教授是一位语言学家，他通过改变这个卖花女的发音，穿着等东西，就一下子从低层提升到上层了。我非常推荐大家去看一下这部剧，因为中国目前也是一个非常撕裂的社会，比如有的人觉得自己是上层人，比如什么鲶鱼啊，什么公子啊，什么名媛啊。他们只是跟送外卖的，卖花的一样，仅仅是因为父母有钱，留过学，外语可能说的比较6，喝过几万块一斤的茶叶。但是实质上，他们跟卖花女是一样的，只需要让一个希金斯教授，修正一下发音，再去拼多多买几件免牌衣服，马上就成了上流社会。还有一个重要的原因是，如果你喜欢奥黛丽·赫本，那也应该去看看，英文叫《My Fair Lady》，中文名更直接，叫《我也能做到》。这部剧演绎了陈胜的那句话：王侯将相，宁有种乎？希望大家自信点，即使你在卖花，你在送外卖，你在失业……你跟那些上流社会的下流人物，一模一样，只是他有家庭背景，仅此而已。

ELIZA这个名字比ChatGPT，小冰什么的，可要高级多了。随后继ALIZA之后，又出现了一个现象级的AI聊天工具，名字叫Pygmalion（皮格马利翁），就是希腊神话里的塞浦路斯国王，喜欢雕塑，结果爱上了自己做的雕像，一个完美的雕像，前突后翘，然后再跟现实中的女人一比，现实中的女人一点意思也没有。这感动了女神阿佛洛狄忒，就把这个雕像给复活了，这个雕像成了皮格马利翁的妻子。这跟聊斋里有点类似啊。但是大家不要相信，这是神话，因为我年轻时候的墙上一直挂着奥黛丽·赫本，苏菲·玛索和酒井法子的照片，也没感动上天，让她们复活成为我的妻子，别说成为妻子了，复活一天也行啊。不管怎么说了，在上古时代，这些科学家给自己的AI起名字，还是很有文学意味的，现在起名字，什么Chat啊，什么小爱啊，小冰，小度，泠鸢（líng yuān ）啊，跟女团下海起艺名一样俗气。不过，这也跟用户群体有关系，比如你叫泠鸢，两个字都不认识，可能读成了冷鸟。

最初的这两个ALIZA和皮格马利翁，跟现在的ChatGPT原理是类似的，区别当然也很大，最大的是语言库。这些AI聊天的本质是词语结龙，但是由于语言库的不同，能接龙的范围也有很大的区别。这两个人工智能聊天的语言库是心理学的，只回答心理疾病方面的内容。

然后，老魏就意识到问题的严重性了。他知道将来的算力强大了，AI就可以把所有的知识给学一遍，那就啥都懂了，而不仅仅是一个心理医生的问题。于是，他开始宣传AI是有危险的，当别人问他AI会不会超越人类的时候，他的回答是根本就不存在会不会超越的问题，而是肯定可以超越，现在他要解决的问题是能不能继续研究的问题。他后期的研究方向转变成了计算机技术会给社会带来什么样的道德问题，并且如何才能回避这个问题。

说完了老魏，还有另一个学派的，就是统计学派。统计学派的创始人已经搞不清楚是谁了，说谁的都有，从费舍尔到柯内托夫，咱们就不深究了。外国人的名字太难记了。但是只要上过大学的人，应该知道贝叶斯方法，这个后来有了很多发展，有贝叶斯网络和决策理论，有机器学习和贝叶斯方法，总之，这一学派搞的风声水起的。这时候，谁比较出名，要靠传播学了，谁能发表奇谈怪论，再加上现代传媒对这些言论的放大传播，一下子就成了名人。所以能说一些惊世骇俗的话，非常非常必要。

狗咬人不算新闻，但是人咬狗就是新闻了。统计学派跟上一期讲的语法学派有点水火不容的样子。能不停的说名人名言的维诺格拉德说了一句特别提神的话，他是这样来损语法学派的：我的团队里每开除一名语言学家，我的人工智能就提高一个档次。有好事者不明白他为什么这么痛恨语法学派，就研究他的过往，发现原来维诺格拉德上大学的时候，是个学霸，门门科都是A+水平的，但是有一门课不及格，给他不及格的这位老师就是语法学派的创始人乔姆斯基，这个家伙上一期的主人公。当年乔姆斯基是人工智能的No.1，他的一言一行都能影响到谁有肉吃，谁连汤也喝不到一口。当年维诺格拉德也是冲着乔姆斯基的名气，选了一门他的课，每次课后都去请教乔姆斯基问题，不问如果教电脑理解语法，光问能不能在不理解语法的情况下，使用统计学来做呢？

乔姆斯基充满绝望的看着这个学生，深情地说：同学，语言的可能性是无限的，用统计的方法是不可能解决问题的。你可曾听过中国的哲学家庄子说过：吾生也有涯，而知也无涯。以有涯随无涯，殆已。我到底哪里讲的不好，让你误以为不学语法也能理解语言呢？

维诺格拉德诚实的回答：老师，我就不懂英语语法，但是我能理解英语。这句话一说出来，直接让乔姆斯基崩溃了，你竟然是不懂语法的学生，你还来上我的英语语法课，还想教电脑学会语法，不给你个不及格，对得起我么？于是，维诺格拉德得了平生第一个不及格。

随后，他彻底的转向了统计学，原因就是，他自己就不懂语法，他还能学会英语，老师肯定把方向搞错了。于是一个不及格的学生，开创了统计学的春天，并且，他获得了巨大的成功，因为他也当了教授，他教出了两个学生，一个学生叫布林，一个学生叫佩奇，这两个学生后来办了一家公司叫Google。办了这个公司之后，把老师请过去，老师开始按自己的想法，用Google提供的海量资金，硬砸统计学。最终，钞能力和超能力完美的结合，一大群统计学派的人加入了Google，比如大名鼎鼎的欧赫，用Google海量的数据，做统计，在2014年开发出了Google翻译，直接让Google翻译原地起飞，大幅度超越同行。在2016年，又发布了GNMT(Google Neural Machine Translation)，也叫Google神经机器翻译，随后又发布了RNN（循环神经网络）……让翻译的质量有了巨大的提升。

而这一切，最初来源于一个学生的想法，我不懂语法，为什么就能懂语言呢？即使老师给了他不及格，他依旧坚持他的想法。希望大家也能坚持自己的想法，不要让你的老师，你的领导，给你瞎JB指明方向。

好了，这一期节目就到这里。祝大家在2024年事事顺心。

共享此文章：

相关