No.445 淘汰程序员的不是人工智能，而是使用人工智能的其他程序员

我去参加了2024年6月26日的豆包MarsCode的发布会，先来介绍一下这是什么东西？这是个大语言模型，为程序员提供的垂直模型，同类的竞品有微软家的copilot，微软家的要每个月交10美元，最初的时候是20美元，现在降价了，这个豆包MarsCode目前是免费的。我还特意问了一下工程师，以后会不会收费，他说应该一直免费下去。我还问了一嘴为什么起个名字叫豆包呢，谁起的这个名字啊？他说他不是很清楚具体谁起的，但是是团队都认可的一个名字。我觉得这也非常的正常，名字这种问题，是为了以后功成名就以后，再讲故事用的。就好像现在artificial Intelligence火了，大家去考证为什么当年在人工智能第一届大会上，起了这个名字呢？于是就去问当事人，结果问几个人就有几个答案。人老了就会变糊涂，连举办大会的麦卡锡后来接受采访的时候，也说他也是听别人说的，不知道真实的来历。但是有一个英国科学家伍德华说，人工智能这个词是他想出来的，是他1956年去美国做学术访问的时候告诉麦卡锡的。但是这也不靠谱，因为有好事者发现，麦卡锡在1955年写的文章里就已经用了人工智能这个词。

名字这东西，要靠功成名就之后再去编故事。如果以后豆包成了举足轻重的软件，那时候再做访谈，创始人就可以自由发挥了。就跟米老鼠的创作者迪斯尼一样，他给米老鼠编了各种不同版本的故事，在不同的场合讲不同的故事。中国的企业，给公司或者产品起名字就三类，食物是一类，动物是一类，数字是一类。为什么这样呢，我的解释是传播成本低，大家的脑子里都有一个形象。比如叫豆包，大家脑子里都有个印象。

我来讲一下豆包MarsCode这个东西，我相信大部分人应该不陌生了，这是一个人工智能编程助手，就是在你写代码的时候，帮助你补全代码，解释代码以及修复错误的。

有人可能会问，这玩意真能帮助写代码么？首先，要分人。为什么这么说呢？对顶级程序员，这玩意基本没什么用。比如国外的那个俄罗斯搞直播的大神Tsoding Daily，还有中国的搞游戏的云风，这些人是不用这些东西的。但是，他们不用，不代表你不用，你只有达到他们那个档次，才能有这样的体会，否则，我坚定的认为，绝大部分程序员是需要的。

在云风大佬的推下面，有个人问：GPT是不是有用处呢？他的回复是：GPT 目前对他没什么用，至少没 google 有用。如果他会的东西，他比GPT熟，犯错更少；他不会的东西，他不需要它的一两句话总结，宁愿多花点时间系统学习。

这让我想起了足球上的一个例子，巴西有个球星叫罗马里奥，外号叫独狼，是前锋。他的职业生涯总共进球是941个，世界第二。第一是球王贝利。目前C罗跟梅西还没追上他。我们不讨论足球，我只说一件他的轶事。罗马里奥一般是不进行锻炼的，他的理由是他是来射门的，他已经会射门了，为什么还要锻炼？他的日常生活就是踢比赛的那天去球场，然后比赛，结束后就去夜店。有一次记者参访他，他就说起了不锻炼的原因，他说那些辅助设备没用，比如练任意球的那些假人墙，对他来说没什么难度，假人墙又不会移动，而真实的比赛是真的人组成的人墙，难度不一样，所以他不锻炼。

我比较关注足球，所以经常举足球的例子。阿根廷有个球星叫克雷斯波，他退役了，有次参加活动，西装革履的去的，手里还拿着个小包。主持人说有个小活动，你换身衣服鞋子的，来射个门。克雷斯波一脸疑惑的说，这点难度还要换鞋子么？完全不用。主持人说那就踢三次，克雷斯波说不用，然后穿着西服皮鞋，就踢出了一个弧线球，球门小了一点，但是没有门将。对他们来说，非常简单的事情，对我们，并不简单。

这个理由对他们是合理的，毕竟，他们是GOAT。但是对普通球员，假人组成的人墙就已经是不可逾越的了，更不要说真人了。比如6月26号，我在参加完豆包MarsCode这个发布会之后，跟同学去吃饭，吃饭的时候，看北京国安vs沧州雄狮，北京国安4：0胜了。这场比赛的时候，一个球员一脚传球或者射门打在裁判身上，把裁判给打懵了。对这样的球员来说，使用假人，是非常有必要的。

一个更残酷的现实是，中超的球员可能不好，但是绝大部分程序员的水平，包括我，是比不上中超球员的。中超球员总共300多人，也是万里挑一的。但是程序员，肯定不是万里挑一的，所以，用类似MarsCode的辅助工具，我觉得非常有必要。用保罗·格雷厄姆的话来说，世界上5%的程序员，写99%的优秀软件。剩下的95%的程序员，基本上就是用来拖后腿的。这些类似MarsCode的垂直模型，最好在训练模型的时候，识别出那5%的程序员，只用他们的代码来训练，这样的话，语料应该更好一些。

这些牛人的话，是站在他们的立场上讲的。而且，他们是真的很真诚，但是对普通程序员来说，有就是比没有好。大牛无法理解。就好像辅助驾驶一样，尤其是自动泊车的功能，如果车位好停的话，我也是一把入库，但是碰到侧方位停车，我停的是满头大汗，前前后后在那里挪动吧。尤其是碰到前面一辆宝马x5，后面一辆奔驰600，我开着我的二手五菱宏光，稍微蹭一下，一年白干了。那个时候，我是多么希望我这辆二手五菱宏光有自动泊车的功能啊！如果对高手来说，开五菱宏光照样可以漂移泊车。

我是属于写代码要用智能助手来补全的普通程序员。尤其喜欢用这个来补全测试，当你把程序写完，我是不想再写测试的。以前我是主打一个“别看我程序写的不怎么样，但是我的程序不用测试”，其主要原因是不想写。现在有了类似豆包MarsCode这样的工具，你可以通过相应的提示符，让它帮你写测试，我觉得这个功能非常的好。

还有，这些补全的人工智能，最好能统一风格，比如你喜欢用匈牙利命名法，这个人工智能最好也用匈牙利命名法。如果你喜欢骆驼命名法，这个人工智能也给你整个骆驼命名法。如果你正在用中注释，人工智能写注释的时候最好也是中文……目前我觉得，这方面MarsCode做的还不错，跟Copilot不相上下。我只是个人瞎猜，不管是Copilot还是豆包MarsCode，都存在正说着中文，然后下一条突然切换英文模式开始输出了，这是什么原因呢？我猜是不是中文的语料不够，这些都是训练的英文的语料。这种突然切换中英文的模式，我把它称之为“白领模式”，现在我们人类中，不也是有一部分人，喜欢中english混杂着talk么？

这个是连钱钟书先生也解决不了的问题，他在其小说《围城》中曾对旧时上海买办点金银行的张先生说话“中英夹杂”有过一段描写（吐槽）：“跟外国人来往惯了，说话有个特征——喜欢中国话里夹无谓的英文字。他并无中文难达的新意，需要借英文来讲；所以他说话里嵌的英文字，还比不得嘴里嵌的金牙，因为金牙不仅妆点，尚可使用，只好比牙缝里嵌的肉屑，表示饭菜吃得好，此外全无用处。”

在解释代码的时候，我要隔一段时间告诉一下这些人工智能，请说Chinese，please。这是我遇见的一个通病，出现在各个大语言模型中。按道理说，你跟他用中文说，他也应该用中文回答才对。我不清楚英文的用户，有没有碰到说着英文，突然就开始讲中文的情况。

以前我用Github的Copilot的时候，是用的插件，一种是装在JetBrains的IDE里，一种是装在VSCode这个编辑器里。如果你也是这两个插件的用户你可以跟他们聊天，装在JetBrains里的会说自己是基于ChatGPT来开发的，装在VSCode里的会说自己基于GPT 4来开发的。不信你可以自己试试，微软还是动了一点小心思的，毕竟VSCode是自己家的产品，JetBrains是别人家的产品，这让我想起了早年开发Office的时候，自己家的Office调用一套私有的API，别人家的Office，比如Lotus调用另一套API，这样一弄，Lotus就是比Office慢一拍，最后Lotus就凉凉了。

也就是说，虽然你每个月都交的是10美元，提供的服务还是有区别的。于是，有人就想了，既然你是GPT 4，那能不能用来回答非编程的问题呢？于是就有人做出来了一个cocopilot的插件，这个插件的作用是，修改prompt，然后用copilot当成GPT 4来使用。做这个插件的人ID叫秦始皇，他破解过很多软件，除了这个，以前他还破解过JetBrains的授权，搞的JetBrains家发邮件给他，让他帮JetBrains来完善激活体系，并且给了他一个三年的授权。微软家是怎么做的呢？把他的账号直接物理删除了，因此他没资格拥有GitHub账户，微软有时候做事吧，太直男了。像JetBrains稍微的低姿态一下，多好。现在这个始皇的博客zhile.io上有他对微软八辈子祖宗的问候。他现在大量的精力在他的新论坛linux.do上面。

我也用了秦始皇写的cocoilot，然后，我的账户也被封了，但是被封归被封，每个月10美元还是要交的。后来我写了一封信解释了一下，又要保证这，又要保证那，才给你解封。我相信，在不远的将来，微软的copilot一定会再降价，甚至免费的。现在已经降价了，原来每个月20美元，现在每个月10美元。我觉得这是趋势，就跟奔驰宝马在电车的压力下，油车低下了高贵的头，这是一样的。你看看OpenAI刚开始的时候是多么的高不可攀，现在不用注册都可以用了。免费肯定是个趋势，就跟雅虎这个伟大的公司开创造的互联网是免费的一样，基于此再来谈商业模式。开放、免费与盈利，这是雅虎给这个互联网定下的规矩，虽然现在雅虎已经不行了，我觉得100年后，再来回顾，雅虎肯定是要排在前面的公司之一。

免费的午餐这件事可能不存在，但是有人付钱请你吃免费午餐这件事情是存在的。我就不举例子了，如果你不相信，我可以私下给你举很多例子。在互联网之前，大家也说没有免费的早餐、午餐与晚餐，比如YaHoo之前，你想访问美国在线，每个月付20美元，搞笑不？你访问他的网站，还要付钱给它，如果你访问的越多，就得买更贵的，比如每个月50美元，再送你一本卖不动的书。中国有copy美国在线的公司，叫东方网景，每个月给用户拔毛，当然失败了。也有copy雅虎的公司，叫sohu，现在还有这家公司，CEO是张朝阳。

如果你想小打小闹的，就收费。如果你想搞大事情，就免费。

就跟刘邦这种流氓，见了女人都拔不动腿的人，在攻破咸阳之后，竟然一个女的也不碰，一分钱也不抢。书里写的是“财物无所取，妇女无所幸”。同志们，碰到这种人，就是有大想法的人。像字节跳动的豆包MarsCode，一分钱也不收你的，我觉得应该是有更大的想法，至少跟刘邦一样，想法大大滴。豆包的价格是在所有的大语言模型中最便宜的，量也是最足的。用范增的话来说：“夺项王天下者，必沛公也”。为什么会是这样呢，因为刘邦搞了个“财物无所取，妇女无所幸”，不抢人家的钱，就已经很不错了。反观项羽入咸阳之后，烧杀抢掠，连阿房宫都烧了，输好像也就是必然了。

当然，有一部分用户以付钱为美德，比如觉得付了钱的会更好，实际上，这非常的不一定。以前的时候，中国的互联网公司想通过电子邮箱收费来赚钱，比如163啊，sina啊什么的，都推出过自己的收费邮箱。有人会觉得更好，这主要来源于自己付钱了，现在我不知道还有多少有钱人肯给邮箱付钱，但是应该不多了。中国的这些公司纷纷给邮箱收费的时候，Google公司出了个Gmail，不是抢你的饭碗了，是直接把锅给你端了。当时的舆论是这样，免费的肯定不长久，我这一个月收你20元，才给你100M邮箱，他一分钱不收，给你1G邮箱，肯定是为了坑你的。实际上，人家Google公司的邮箱现在容量越来越大，反正我的也经是免费额度是10G了，我存的东西太多，还付了钱买容量。

以后会怎么样呢？以后会出现越来越多的垂直应用。比如说MarsCodes是针对程序员的，还有针对律师的，针对某个你想不到但是确实存在的领域。而这些领域，不太可能让做大语言模型的公司全做了，大公司是吃肉的，不会去啃蚊子腿上的肉，奇奇怪怪的应用，比如，算命的人工智能app，会被喝汤的公司或者个人来做。

那时候，就会出现这样一个现象，这些公司不会宣传用了谁家提供的大模型，而只会宣传自己用了超牛逼的引擎。因为宣传这些东西，纯粹是卖馒头还得宣传用的谁家的面粉，自己找不痛快。那时候，就开始比较谁家的面粉便宜了。谁的成本低，就用谁家的，反正我也不告诉用户我用谁家的大模型，问就是先进的大模型。问就是用的北纬45度优秀精选小麦。便宜也是一种先进，而且是决定胜负的先进。GPT4目前每1000个token要花大概5毛钱，我买的API，如果你问的比较频繁的话，20美元用不了几天就没了，不如直接包月用。

大家也不用担心没有免费的午餐吃，商业公司之间会竞争，有些许时候，他们会形成一个收费联盟。就像邮箱收费一样，一时间，几乎所有提供邮箱服务的，都要收费，免费账户施舍给你个20M、50M的。结果就是等着Gmail把它们团灭。或者大家几乎不用电子邮件了。当然，现在也有收费的电子邮箱，比如sina，你仍旧可以每个月交50元，享受vip待遇。但是，还是我前面说的那句话，如果公司想小打小闹的，就收费，肯定也可以收入不少。如果想搞大事情，像Gmail那样，就免费。我觉得这个在大语言模型上也适用。

还有就是隐私了，这个很多人都关心。但是，公司再怎么保证，也不会相信。这不是一家公司可以解决的问题，但是你可以转换一下思维，你先衡量一下，你写的代码到底有多少可能被二次使用。前面我不是提到了一件事么，著名的投资家5%的程序员写了99%的软件，如果要训练一个出色的大模型，最好应该是找到那5%的程序员，专门用他们的代码来训练。就像训练写作的话，最好是找一些出色的作家写的东西来训练，比如，最近OpenAI跟《时代》杂志签约，来训练模型，而不是到中小学里找作文来训练，除非你是想让大模型写的文章模仿中小学生。对豆包MarsCode这种编程的大模型来说，我认为他们应该不会找初级程序员写的代码来训练。你还是要衡量一下你代码的价值，如果特别有价值，确实应该考虑隐私的问题，尤其是友商。

共享此文章：

相关