我去参加了2024年6月26日的豆包MarsCode的发布会,先来介绍一下这是什么东西?这是个大语言模型,为程序员提供的垂直模型,同类的竞品有微软家的copilot,微软家的要每个月交10美元,最初的时候是20美元,现在降价了,这个豆包MarsCode目前是免费的。我还特意问了一下工程师,以后会不会收费,他说应该一直免费下去。我还问了一嘴为什么起个名字叫豆包呢,谁起的这个名字啊?他说他不是很清楚具体谁起的,但是是团队都认可的一个名字。我觉得这也非常的正常,名字这种问题,是为了以后功成名就以后,再讲故事用的。就好像现在artificial Intelligence火了,大家去考证为什么当年在人工智能第一届大会上,起了这个名字呢?于是就去问当事人,结果问几个人就有几个答案。人老了就会变糊涂,连举办大会的麦卡锡后来接受采访的时候,也说他也是听别人说的,不知道真实的来历。但是有一个英国科学家伍德华说,人工智能这个词是他想出来的,是他1956年去美国做学术访问的时候告诉麦卡锡的。但是这也不靠谱,因为有好事者发现,麦卡锡在1955年写的文章里就已经用了人工智能这个词。
名字这东西,要靠功成名就之后再去编故事。如果以后豆包成了举足轻重的软件,那时候再做访谈,创始人就可以自由发挥了。就跟米老鼠的创作者迪斯尼一样,他给米老鼠编了各种不同版本的故事,在不同的场合讲不同的故事。中国的企业,给公司或者产品起名字就三类,食物是一类,动物是一类,数字是一类。为什么这样呢,我的解释是传播成本低,大家的脑子里都有一个形象。比如叫豆包,大家脑子里都有个印象。
我来讲一下豆包MarsCode这个东西,我相信大部分人应该不陌生了,这是一个人工智能编程助手,就是在你写代码的时候,帮助你补全代码,解释代码以及修复错误的。
有人可能会问,这玩意真能帮助写代码么?首先,要分人。为什么这么说呢?对顶级程序员,这玩意基本没什么用。比如国外的那个俄罗斯搞直播的大神Tsoding Daily,还有中国的搞游戏的云风,这些人是不用这些东西的。但是,他们不用,不代表你不用,你只有达到他们那个档次,才能有这样的体会,否则,我坚定的认为,绝大部分程序员是需要的。
在云风大佬的推下面,有个人问:GPT是不是有用处呢?他的回复是:GPT 目前对他没什么用,至少没 google 有用。如果他会的东西,他比GPT熟,犯错更少;他不会的东西,他不需要它的一两句话总结,宁愿多花点时间系统学习。
这让我想起了足球上的一个例子,巴西有个球星叫罗马里奥,外号叫独狼,是前锋。他的职业生涯总共进球是941个,世界第二。第一是球王贝利。目前C罗跟梅西还没追上他。我们不讨论足球,我只说一件他的轶事。罗马里奥一般是不进行锻炼的,他的理由是他是来射门的,他已经会射门了,为什么还要锻炼?他的日常生活就是踢比赛的那天去球场,然后比赛,结束后就去夜店。有一次记者参访他,他就说起了不锻炼的原因,他说那些辅助设备没用,比如练任意球的那些假人墙,对他来说没什么难度,假人墙又不会移动,而真实的比赛是真的人组成的人墙,难度不一样,所以他不锻炼。
我比较关注足球,所以经常举足球的例子。阿根廷有个球星叫克雷斯波,他退役了,有次参加活动,西装革履的去的,手里还拿着个小包。主持人说有个小活动,你换身衣服鞋子的,来射个门。克雷斯波一脸疑惑的说,这点难度还要换鞋子么?完全不用。主持人说那就踢三次,克雷斯波说不用,然后穿着西服皮鞋,就踢出了一个弧线球,球门小了一点,但是没有门将。对他们来说,非常简单的事情,对我们,并不简单。
这个理由对他们是合理的,毕竟,他们是GOAT。但是对普通球员,假人组成的人墙就已经是不可逾越的了,更不要说真人了。比如6月26号,我在参加完豆包MarsCode这个发布会之后,跟同学去吃饭,吃饭的时候,看北京国安vs沧州雄狮,北京国安4:0胜了。这场比赛的时候,一个球员一脚传球或者射门打在裁判身上,把裁判给打懵了。对这样的球员来说,使用假人,是非常有必要的。
一个更残酷的现实是,中超的球员可能不好,但是绝大部分程序员的水平,包括我,是比不上中超球员的。中超球员总共300多人,也是万里挑一的。但是程序员,肯定不是万里挑一的,所以,用类似MarsCode的辅助工具,我觉得非常有必要。用保罗·格雷厄姆的话来说,世界上5%的程序员,写99%的优秀软件。剩下的95%的程序员,基本上就是用来拖后腿的。这些类似MarsCode的垂直模型,最好在训练模型的时候,识别出那5%的程序员,只用他们的代码来训练,这样的话,语料应该更好一些。
这些牛人的话,是站在他们的立场上讲的。而且,他们是真的很真诚,但是对普通程序员来说,有就是比没有好。大牛无法理解。就好像辅助驾驶一样,尤其是自动泊车的功能,如果车位好停的话,我也是一把入库,但是碰到侧方位停车,我停的是满头大汗,前前后后在那里挪动吧。尤其是碰到前面一辆宝马x5,后面一辆奔驰600,我开着我的二手五菱宏光,稍微蹭一下,一年白干了。那个时候,我是多么希望我这辆二手五菱宏光有自动泊车的功能啊!如果对高手来说,开五菱宏光照样可以漂移泊车。
我是属于写代码要用智能助手来补全的普通程序员。尤其喜欢用这个来补全测试,当你把程序写完,我是不想再写测试的。以前我是主打一个“别看我程序写的不怎么样,但是我的程序不用测试”,其主要原因是不想写。现在有了类似豆包MarsCode这样的工具,你可以通过相应的提示符,让它帮你写测试,我觉得这个功能非常的好。
还有,这些补全的人工智能,最好能统一风格,比如你喜欢用匈牙利命名法,这个人工智能最好也用匈牙利命名法。如果你喜欢骆驼命名法,这个人工智能也给你整个骆驼命名法。如果你正在用中注释,人工智能写注释的时候最好也是中文……目前我觉得,这方面MarsCode做的还不错,跟Copilot不相上下。我只是个人瞎猜,不管是Copilot还是豆包MarsCode,都存在正说着中文,然后下一条突然切换英文模式开始输出了,这是什么原因呢?我猜是不是中文的语料不够,这些都是训练的英文的语料。这种突然切换中英文的模式,我把它称之为“白领模式”,现在我们人类中,不也是有一部分人,喜欢中english混杂着talk么?
这个是连钱钟书先生也解决不了的问题,他在其小说《围城》中曾对旧时上海买办点金银行的张先生说话“中英夹杂”有过一段描写(吐槽):“跟外国人来往惯了 ,说话有个特征——喜欢中国话里夹无谓的英文字。他并无中文难达的新意,需要借英文来讲;所以他说话里嵌的英文字,还比不得嘴里嵌的金牙,因为金牙不仅妆点,尚可使用,只好比牙缝里嵌的肉屑,表示饭菜吃得好,此外全无用处。”
在解释代码的时候,我要隔一段时间告诉一下这些人工智能,请说Chinese,please。这是我遇见的一个通病,出现在各个大语言模型中。按道理说,你跟他用中文说,他也应该用中文回答才对。我不清楚英文的用户,有没有碰到说着英文,突然就开始讲中文的情况。
以前我用Github的Copilot的时候,是用的插件,一种是装在JetBrains的IDE里,一种是装在VSCode这个编辑器里。如果你也是这两个插件的用户你可以跟他们聊天,装在JetBrains里的会说自己是基于ChatGPT来开发的,装在VSCode里的会说自己基于GPT 4来开发的。不信你可以自己试试,微软还是动了一点小心思的,毕竟VSCode是自己家的产品,JetBrains是别人家的产品,这让我想起了早年开发Office的时候,自己家的Office调用一套私有的API,别人家的Office,比如Lotus调用另一套API,这样一弄,Lotus就是比Office慢一拍,最后Lotus就凉凉了。
也就是说,虽然你每个月都交的是10美元,提供的服务还是有区别的。于是,有人就想了,既然你是GPT 4,那能不能用来回答非编程的问题呢?于是就有人做出来了一个cocopilot的插件,这个插件的作用是,修改prompt,然后用copilot当成GPT 4来使用。做这个插件的人ID叫秦始皇,他破解过很多软件,除了这个,以前他还破解过JetBrains的授权,搞的JetBrains家发邮件给他,让他帮JetBrains来完善激活体系,并且给了他一个三年的授权。微软家是怎么做的呢?把他的账号直接物理删除了,因此他没资格拥有GitHub账户,微软有时候做事吧,太直男了。像JetBrains稍微的低姿态一下,多好。现在这个始皇的博客zhile.io上有他对微软八辈子祖宗的问候。他现在大量的精力在他的新论坛linux.do上面。
我也用了秦始皇写的cocoilot,然后,我的账户也被封了,但是被封归被封,每个月10美元还是要交的。后来我写了一封信解释了一下,又要保证这,又要保证那,才给你解封。我相信,在不远的将来,微软的copilot一定会再降价,甚至免费的。现在已经降价了,原来每个月20美元,现在每个月10美元。我觉得这是趋势,就跟奔驰宝马在电车的压力下,油车低下了高贵的头,这是一样的。你看看OpenAI刚开始的时候是多么的高不可攀,现在不用注册都可以用了。免费肯定是个趋势,就跟雅虎这个伟大的公司开创造的互联网是免费的一样,基于此再来谈商业模式。开放、免费与盈利,这是雅虎给这个互联网定下的规矩,虽然现在雅虎已经不行了,我觉得100年后,再来回顾,雅虎肯定是要排在前面的公司之一。
免费的午餐这件事可能不存在,但是有人付钱请你吃免费午餐这件事情是存在的。我就不举例子了,如果你不相信,我可以私下给你举很多例子。在互联网之前,大家也说没有免费的早餐、午餐与晚餐,比如YaHoo之前,你想访问美国在线,每个月付20美元,搞笑不?你访问他的网站,还要付钱给它,如果你访问的越多,就得买更贵的,比如每个月50美元,再送你一本卖不动的书。中国有copy美国在线的公司,叫东方网景,每个月给用户拔毛,当然失败了。也有copy雅虎的公司,叫sohu,现在还有这家公司,CEO是张朝阳。
如果你想小打小闹的,就收费。如果你想搞大事情,就免费。
就跟刘邦这种流氓,见了女人都拔不动腿的人,在攻破咸阳之后,竟然一个女的也不碰,一分钱也不抢。书里写的是“财物无所取,妇女无所幸”。同志们,碰到这种人,就是有大想法的人。像字节跳动的豆包MarsCode,一分钱也不收你的,我觉得应该是有更大的想法,至少跟刘邦一样,想法大大滴。豆包的价格是在所有的大语言模型中最便宜的,量也是最足的。用范增的话来说:“夺项王天下者,必沛公也”。为什么会是这样呢,因为刘邦搞了个“财物无所取,妇女无所幸”,不抢人家的钱,就已经很不错了。反观项羽入咸阳之后,烧杀抢掠,连阿房宫都烧了,输好像也就是必然了。
当然,有一部分用户以付钱为美德,比如觉得付了钱的会更好,实际上,这非常的不一定。以前的时候,中国的互联网公司想通过电子邮箱收费来赚钱,比如163啊,sina啊什么的,都推出过自己的收费邮箱。有人会觉得更好,这主要来源于自己付钱了,现在我不知道还有多少有钱人肯给邮箱付钱,但是应该不多了。中国的这些公司纷纷给邮箱收费的时候,Google公司出了个Gmail,不是抢你的饭碗了,是直接把锅给你端了。当时的舆论是这样,免费的肯定不长久,我这一个月收你20元,才给你100M邮箱,他一分钱不收,给你1G邮箱,肯定是为了坑你的。实际上,人家Google公司的邮箱现在容量越来越大,反正我的也经是免费额度是10G了,我存的东西太多,还付了钱买容量。
以后会怎么样呢?以后会出现越来越多的垂直应用。比如说MarsCodes是针对程序员的,还有针对律师的,针对某个你想不到但是确实存在的领域。而这些领域,不太可能让做大语言模型的公司全做了,大公司是吃肉的,不会去啃蚊子腿上的肉,奇奇怪怪的应用,比如,算命的人工智能app,会被喝汤的公司或者个人来做。
那时候,就会出现这样一个现象,这些公司不会宣传用了谁家提供的大模型,而只会宣传自己用了超牛逼的引擎。因为宣传这些东西,纯粹是卖馒头还得宣传用的谁家的面粉,自己找不痛快。那时候,就开始比较谁家的面粉便宜了。谁的成本低,就用谁家的,反正我也不告诉用户我用谁家的大模型,问就是先进的大模型。问就是用的北纬45度优秀精选小麦。便宜也是一种先进,而且是决定胜负的先进。GPT4目前每1000个token要花大概5毛钱,我买的API,如果你问的比较频繁的话,20美元用不了几天就没了,不如直接包月用。
大家也不用担心没有免费的午餐吃,商业公司之间会竞争,有些许时候,他们会形成一个收费联盟。就像邮箱收费一样,一时间,几乎所有提供邮箱服务的,都要收费,免费账户施舍给你个20M、50M的。结果就是等着Gmail把它们团灭。或者大家几乎不用电子邮件了。当然,现在也有收费的电子邮箱,比如sina,你仍旧可以每个月交50元,享受vip待遇。但是,还是我前面说的那句话,如果公司想小打小闹的,就收费,肯定也可以收入不少。如果想搞大事情,像Gmail那样,就免费。我觉得这个在大语言模型上也适用。
还有就是隐私了,这个很多人都关心。但是,公司再怎么保证,也不会相信。这不是一家公司可以解决的问题,但是你可以转换一下思维,你先衡量一下,你写的代码到底有多少可能被二次使用。前面我不是提到了一件事么,著名的投资家5%的程序员写了99%的软件,如果要训练一个出色的大模型,最好应该是找到那5%的程序员,专门用他们的代码来训练。就像训练写作的话,最好是找一些出色的作家写的东西来训练,比如,最近OpenAI跟《时代》杂志签约,来训练模型,而不是到中小学里找作文来训练,除非你是想让大模型写的文章模仿中小学生。对豆包MarsCode这种编程的大模型来说,我认为他们应该不会找初级程序员写的代码来训练。你还是要衡量一下你代码的价值,如果特别有价值,确实应该考虑隐私的问题,尤其是友商。