No.423 人工智能会取代程序员么?

简单回答是不,在可预见的未来,人工智能不会取代软件工程团队。

为什么会这么说呢?这个道理其实也不难,你说现代医学能取代传统医学么?一个充满了专门卖假药给假医院做广告的搜索引擎可以被一个口头说不做恶,但是背地里也做恶,但是没有坏到头上长疮脚底流脓的搜索引擎取代么?我的答案是一样的,在可预见的未来,坏公司不会被好公司代替,甚至能达到劣币驱逐良币的结果,最终劣币赢了。但是最终,放在一个比较长的时空里,大家要有点想象力,乐观一点。只是,可能会毁掉几代人,这也是没有办法的事情。

同样的,A股再怎么让散户赔钱,A股也有存在的价值。A股存在,并不是因为上市的那些公司有多好,完全是因为你只能玩A股,想玩其它的没门。想用其它的搜索引擎,没门。想用其它的聊天软件,没门。同样的,想用其它的大语言模型,比如你想用排名先前的GPT 4,Claude 3,对绝大部分的人来说,太难了。于是,你就只能用这些遥遥领先于GPT 4和Claude 3的模型。到底超越到什么地步,因为你没用过,所以他说啥就是啥了。由于这些大语言模型是不开源的,而且是多模态的,不止能写一大堆垃圾话,还能画画,还能生成视频,现在又能给视频配音了。在我的信息茧房里,我目前还不清楚国内有生成1分钟视频的出来,配音的好像也没有。如果有的话,大家可以批评我,当然了,知乎上的那种不算,最后来一句且听龙吟。

国外有一家公司叫认识实验室,网址是:https://www.cognition-labs.com 。这家公司搞了一个人工智能的员工,名字叫Devin。就是如果你有钱的话,就可以买一个回去代替你的员工。这个公司里全是拿国际计算机金牌的人,所以我比较关注,就想看看他们能干出点什么事情来。

视频显示的非常的好,这个叫Devin的人工智能员工可以干的事情非常多,可以写shell,可以编程,可以使用浏览器。但是实际上呢,这些工作对一个程序员来说,用处并不大,毕竟当程序员又不是解决编程竞赛的错误。程序员的大部分工作,其实是完成老板提出的不合理的任务。如果你觉得程序员是写优秀的代码,那你可就错了。程序员最重要的工作是给老板赚钱,而赚钱大部分是靠手段下三滥。比如你开发个软件,要的不是流畅,而是多放几个广告进去。大家应该有感觉吧,如果没感觉的话,你打开你的手机,看看那些占用容量十几G的SB软件,到底干了些什么?

比如有个项目是做搜索引擎,假设人工智能超级厉害,能完成98%的编码任务。你用中文说,我要做一个搜索引擎,用科技让复杂的世界更简单。然后人工智能把这个代码很快就完成了。非常的先进,你有个感冒,把症状输入这个搜索引擎,他建议你啥也别干,多喝点水,在家呆着就好了。那老板可不自己就疯了。他所说的,跟他所想的并不是一样的。当他说他想用科技让复杂的世界更简单,是另一重意思,人工智能不会解释,但是项目经理跟程序员才能解释:用科技就是用电脑,复杂的世界就是以前赚钱太复杂了,对上送礼对下行骗,媒体上做广告,还得维护各路的神仙,现在,咱们要简单一点。当用户搜有点发烧的时候,首先要定位这个用户在哪里,看看周围最近的医院有哪些,这些医院哪家在我这里做过广告了。然后后台一看,是家男科医院,然后再根据输入法,GPS等一系列偷来的信息,发现他三天前在“夜巴黎”消费过2000元。然后发现这家男科医院单次点击的广告费是100元一次,好嘞,第一条就是这个医院的推广,第二条是95元一次的,第三条是90元一次的。这个搜索引擎直接说,这不是感冒,这是性病初期啊。

于是,这哥们被吓的一激灵,连续点击那些推广链接,第一条是性病,第二条是病,第三条还是性病,一上午,光点广告了,满满的27寸屏幕,人给吓个半死,这公司已经赚了2000块广告费。终于决定去医院了,这哥们用的浏览器也是偷隐私的,现在叫什么用户画像,人刚出门,那家医院就已经准备好刀了。这一通操作下来,夜巴黎2000,外加感冒被治成了性病又8000,还买了一堆中成药,内服的,外敷的,搞的浑身上一身油,又花费1500。我就问你,人工智能能干出这么黑心的事情出来么?他们会写这种黑心的代码出来么?目前来看,是不太可能的。

再来说那个Devin人工智能员工,在Hackernews上,评价就是几乎没什么用处,因为现实中的编程跟演示中的编程,差距实在是太大。而且现实中往往要面对很久远的代码,例如要修复一个20年陈酿的bug,Devin根本无所适从。

但是,我们也要知道Devin已经可以解决13.86%的任务,就是你告诉他一个问题,在不经过任何提示的情况下,就完成了13.86%,这非常非常高了,因为GPT 4只能完成4.80%。而那些靠开源搭建起来的大模型,只能完成1%到2%,平均是1.96%。

我看过那些测试,测试编程的能力。一个例子是 OpenAI 的 HumanEval,它通过 164 个 Python 问题来测试基本的编程技能,每个问题都有一个要编写的函数和要通过的测试,例如对字符串中的大写字符求和。虽然很有趣,但这些任务比日常软件工程工作简单得多,通常更类似于面试问题而不是现实世界的问题。

相比之下,SWE-bench 提供了更真实的LLMs 功能衡量标准。它包含从实际 GitHub 问题和拉取请求中提取的 2,294 个任务,需要 LLMs 修改代码库以解决实际问题。该基准测试需要对代码有更深入的理解和交互,比 HumanEval 等更简单的基准测试更准确地反映软件工程的复杂性。

SWE-Bench 训练数据可在 Huggingface 上访问,以“.parquet”文件格式存储,这不像 HumanEval 数据那样易于检查。可以pandas 库创建了一个 Python 脚本来加载和显示此数据,允许您查看其中包含的问题,例如 850 个 Django 相关问题之一:我要发送彩色的日志,为什么使用某个github库不管用呢?答案是:Django禁止在通过管道传输时使用颜色。

相比于HumanEval那些测试,这些测试更像是现实中程序员会碰到的琐碎问题。由于Devin机器人,对这个测试能完成度接近15%。Claude只能完成4%左右。我觉得还是非常厉害的。这是在没有任何指导的情况下完成的。

我觉得随着人工智能使日常任务变得自动化,工程师将把注意力转向更复杂和更具创造性的挑战,从而产生新的创新机会。最近这几年,科技就业市场举步维艰,好像不止科技市场,所有市场都不太好,这也引发广泛的就业保障担忧。然而,我相信人工智能并不是这些问题的原因,比如你告诉我房地产行业不行,出口不行,教育培训不行,是人工智能导致的,我觉得实在是把人工智能夸大了。我觉得恰恰相反,如果没有当前人工智能的发展,情况可能会更加严峻。人工智能的繁荣正在推动初创企业的投资和招聘,防止就业市场可能出现更严重的低迷。

程序员会被替代么?我觉得短期不会,长期怎么样,参考自动驾驶。我觉得人工智能也可以成为驾驶员的自动驾驶,把生命交给自动驾驶我觉得目前是不靠谱的,但是如果人工智能跟程序员合作,这事,相对来说更靠谱。

每当出现这种事情,包括外国哪个公司又搞了点什么东西,比如Sora啊,比如什么芯片啊,总是会有人这样感慨,中国是不是又错失了什么东西?包括芯片要自主,操作系统要自主,大模型也要自主,聊天软件要自主,编程语言也要自主。我不知道其它国家有没有这种情况,比如尼日利亚,西班牙,哥伦比亚,法国,会不会有这种图景。

我觉得是这样,地球其实很小,不像几百年前,现在24小时48小时可以到地球大部分有人的地方,原因就是高科技放大了人的能力。像飞机,汽车放大了人走路的能力,手机,网络放大了人感观的能力。很难想象,在轮船、飞机、集装箱、铅笔、电影等领域,会长期存在两套完全不兼容的东西。不可能你照明用蜡烛,他照明用LED,因为全球一体化是不可避免的趋势。就算现在很多地方,尤其是美国,保守主义抬头,不搞全球化了。这能阻止么?绝不可能。因为人类是差不多的,都知道什么是好东西,什么是坏东西。就算美国目前阻止中国留学生去美国,但是,美国的中国留学生仍旧是第一的。

我这里有一张图,是画人才走向的(可以到我的网站上,或者公众号里看)。本科阶段,哪个国家的学生最多呢?这个肯定不用说了,中国。中国人多啊,大约是美国的3倍。然后到了研究生博士生阶段,哪里的学生最多呢?美国,成了中国的3倍。这张图显示了美国对全球人才的吸引效应。从本科之后,美国的从中国,从印度,从加拿大,从澳大利亚,从欧洲,从俄罗斯净流入人才。所以,美国根本就没有老龄化问题,也不用鼓励生育,反正全球生完了小孩,养大了,自然就送来美国,建设美国了。包括中国的许多爱国大V,也是去美国生活,赚钱在中国。

在这种情况下,全球一体化几乎肯定要延续下去的,即使有波折,也不影响大趋势。因为人才是科技交流的媒介,他们在美国学会了大模型等技术,回国创业,你说他会做个跟美国差不多的技术呢?还是另起炉灶,做一个有中国自主知识产权又兼容欧美的产品呢?后者的可能性要远远大于前者。

现在是有对峙,但是从人才的交流上来看,是没文化的人来对峙,其实这些人选择对峙不对峙,影响不大。比如你在一个公司里,你老板的家人都去竞争对手家里生活了,你个员工喊的再起劲,也没什么用啊。我觉得这些能去美国花一年30-40万人民币去留学的人,家里是非官即富,或者又官又富。所以叫,我觉得这种对峙不可能是长期的,而且也是荒谬的。这种技术美国想封锁,也封锁不住,就跟美国想守住原子弹的秘密,都守不住,更不要提这些AI了。

全世界的球鞋都差不多,裤子也差不多,衣服也差不多,写字的纸也差不多,西服差不多,领带也差不多。当然,有个别美女穿古代的衣服,我一点也不反对,但是绝大部分人穿的衣服确实差不多,手机差不多,电脑差不多,农民种地的化肥差不多,饮料差不多,咖啡差不多,自行车差不多,汽车差不多,飞机还是差不多,从这个角度上,那些非要强行跟别人不一样的,比如搞个系统,除了自家,其它人不能用,这肯定是要死的。从这个角度来看,我还是比较看好全球一体化的。不要听那些取代取代的,都说电池车能取代油车,现在风向又变了,苹果不造车了,丰田又继续搞氢能源了,特斯拉的股票也不太好看了,奔驰也说缓一缓。总之,很多的话听一听就好。

记得在X上面,有人在特斯拉搞自动驾驶的,他转了一个推,推的内容就是人工智能会取代程序员。他回复道,5年前我也这么说过,自动驾驶可以取代司机,你们也看到了。

5 4 投票数
文章评分
订阅评论
提醒

0 评论
最旧
最新 最多投票
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x
滚动至顶部