李彦宏拯救了打工人？

酷玩实验室
酷玩实验室官方账号

2023-03-18 08:41

昨天下午我跨越半个北京，去后厂村围观了百度文心一言的发布会，李彦宏和他们那个CTO王博士巴拉巴拉讲了一个多小时，我中间不小心睡着了。

主要是我这段时间经常玩ChatGPT，前一天还熬夜看了OpenAI的GPT-4发布会，体验了一点小小的美国震撼。相比之下，百度这个文心一言在功能和技术上实在是乏善可陈，Robin和王博士讲话的语气都明显缺乏信心，甚至现场功能演示居然都不是实时AI问答，而是提前录好的，那还玩什么？

在回来的路上，我打开手机，果不其然，百度的股价盘中一度暴跌10%，最终跌幅6.36%，收于125.1港元。

昨天晚上，我终于收到了文心一言的内测码，试玩之后我又被震撼到了，因为这孩子真的很笨。

算个自然数加法居然得出了X，题目还抄错了。

500

让它用李白的风格写一首诗赞美江南美景，它给了首诗倒还不错，就是看着有点眼熟。

500

一查发现，是白居易的《忆江南》。。。

跟ChatGPT做个镜像问题PK，更是高下立判，不忍直视。

500

涉及到中文“一语双关”的问题，还不如ChatGPT这个“老外”。

500

晚上我跟几个妹子讨论半天，看来李彦宏搞AI属于选错了赛道，他保养得那么好，干脆转型直播卖护肤品，肯定能赚更多，岂不美哉？

500

（纯属废话文学）

然而一觉醒来，百度美股大涨3.8%，今天百度港股更是暴涨13.67%，来到了142.2港元。

我想这足以说明，在昨晚内测码少量发布之后，投资人确认到，百度确实自主研发出了还算能用的AI大语言模型，而仅仅确认到这一点，就足以让百度转危为安，市值狂飙400多亿港币。

恐怖如斯啊。

ChatGPT爆火之后，我经常看到我们群里有朋友说这玩意儿没啥用，赚不了钱，这就是一阵风过段时间就凉了。他们或是因为对于AI技术缺乏了解，或是怕被AI抢了工作，或是因为对中国AI缺乏信心，又朴素地希望中国能赢，导致他们主观希望一项来自美国的科技创新没有改变竞争格局的能力。

然而遗憾的是，这并不是事实，类似ChatGPT、文心一言、Stable Diffusion这样的AI大模型必然会改变世界影响到我们每个人，只存在时间早晚的问题，这是我们必须抓住的时代变革。

服务的大机器生产

18世纪后半叶，发生了人类迄今为止影响最大的事件，工业革命。

基于大航海时代掠夺到的财富和长期征战促进的技术积累，在英国出现了几项重要的发明，改良蒸汽机、珍妮纺纱机，进而从纺织业开始，制造业逐步迈入了大机器生产时代。

大机器生产这种模式从西欧开始扩展到北美、东欧、东亚，再因为集装箱互联网数控设备的发明，全球供应链被连为一体，于是从布匹成衣到锅碗瓢盆，从汽车飞机到电脑手机，在手工业时代只有少数王公贵族有钱人才能用得起的工业品，变得廉价，变得不再稀缺，走进了寻常百姓家。

在如今的工业化国家比如中国，除非一样商品需要稀缺的原材料才能生产（黄金首饰），或者它被赋予了特殊的意义（豪车，房子），不然整体都是很便宜的。80年代家里到结婚的时候才会备齐三大件电器（电冰箱，电视机，洗衣机），现在随便一个城市家庭的电器大大小小都有几十件，甚至商家需要进行广告轰炸，不停地消费主义洗脑才能促进大家买东西，实在是有刚需的东西该买的都买了，需求不足了。

然而大家的需求都被满足了吗？大家都很枯燥了吗？并没有。

因为服务依旧昂贵，依旧稀缺。人类的需求本质上是服务，而不是产品。

我买电动牙刷不是为了拥有它，而是为了刷牙，保持口腔健康。这是我对自己的服务。

我买锅碗瓢盆空气炸锅不是为了拥有它们，而是为了做饭家里人一起吃饭看电视，这是我对家人的服务。

我买车不是为了开车，而是为了通勤，有钱人开车一般是开着玩，他们通勤是有司机的，这是人对人的服务。

顺丰买波音777不是为了拥有它，而是为了帮客户送货，这是公司对公司服务。

对自己对家人的服务是靠我投入昂贵的时间精力才能完成的，而人对人、公司对公司的服务就更是稀缺而昂贵，需要投入大量的教育培训，组织管理，才能实现。

服务的大机器生产没有被完成！

我今年30多岁，我有生以来出现的最大的生产力革命是移动互联网革命，大约2007年开始，2018年结束。智能手机和3G、4G网络的普及使得互联网从只能覆盖部分时间，部分地点，部分人，扩展到覆盖任何人任何地点所有睁眼的时间，于是我们所有人的需求和所有能提供服务的人就被网络连接了起来，产生了聊天、上网课、外卖、打车、上门钟点工、餐馆评分、代做设计、代做ppt、代写文章等等在线服务形式，在互联网巨头的操持之下，服务的大机器生产在部分领域得以实现。

现在我们不再需要站在路边等出租车了，而是可以叫一辆车在我家楼下等我，这在以前是只有大老板、大领导才能拥有的待遇。

但是我大望京晚上11点还是打不到车。

这就涉及到一个根本的问题了。移动互联网只能连接服务提供方和需要服务的人，确实可以解决司机闲着找不到乘客的问题，但如果司机不够了呢？

如果帮你画画的画师不够了呢？如果写文章的写手不够了呢？如果好的老师不够了呢？

如果找不到小哥哥/小姐姐陪你聊天呢？如果你的级别不够配秘书，所有文件都要自己写呢？如果公司没钱请客服呢？

虽然AI大模型还没有进化到完美的程度，特别是它还没有找到匹配的机器人身体，但在一些体量颇大的赛道上，它已经能提供不错的服务：

比如广泛意义上的内容服务：做网站、写代码、画图、写诗、水文章、写ppt，特别是如果这个内容服务不涉及原创而只是对现有内容的处理的话，类似翻译、归纳文章要点、把提纲扩写成文章，改文章风格等等，AI已经能比人类做得更好。

再比如很多商业上的流程服务，我有个朋友是做客服软件的，就是那种你上一个比如汽车网站，蹦出来一个对话框，客服问你想买什么价位什么用途的汽车那种。接下来客服会把你的需求总结成清单，给到销售，然后销售会打电话联系你。这个总结客户需求的工作，AI做得比人快得多而且更准确。

还有比如我有很多二次元的朋友，他们对虚拟人物的代入感很强，但虚拟动画人物背后必然是有编剧和中之人（虚拟直播演员）的，他们的服务产能有限，这导致必然出现很多人粉一个二次元老婆/老公的情况，这很不理想。ChatGPT和数字虚拟人的结合，可以让每个人拥有独属于自己的二次元恋人，想想就有点激动。

很多公司大了之后，老板就不知道底下人在干什么了，国家的领导人也是如此，你再怎么深入基层你一天也只有24个小时，能逛几个菜市场？因此大组织的治理必然会出现层层传递信息的情况，而由于中间每一层的人都有自己的利益，这一传信息肯定会失真。而AI的数据处理能力要比人类大得多，我想以后所有大组织的领导人都应该用到一个功能，“把今天14亿人对政府工作报告的反馈（1万个T文件）总结成800字报告发我”，以后所有组织信息传递再也不应该有中间层。

AI将完成服务的大机器生产。

超越人类

更进一步来说，现在的AI大模型不仅能批量复制人类的工作，它已经能完成很多人类无法完成的工作。

要理解这一点，我们必须要了解AI的工作方式。

比如说这是一张末代皇后婉容的照片。

500

用AI模型上色之后，就成了这样。

500

其实它还可以有很多别的配色。

500

那它是怎么完成黑白照片上色的呢？如果让我这个人类去给这张照片上色的话，我能想到两种方法：

方法1：我先去调查婉容这件衣服的材质，甚至尝试去找到这件衣服本体，再结合史料上拍这张照片的时间地点，当天的天气，再找到拍照片用的相机和交卷都是什么型号，有什么曝光特点，确定一种最有可能的颜色给它涂上去。

这种方法叫做分析推理。

方法2：我随便找个看着不突兀的颜色就给它涂上，然后所有的背景事物照此操作，最后出来照片像那么回事儿就行。因为我看过很多女人穿着衣服的彩色照片，也看过很多清宫剧，那个味儿我还是很熟悉的。

这种方法我们姑且称之为套模板，或者说内味儿法。

AI并不擅长分析推理，但它非常擅长找出内味儿然后总结成模板到处套，非常、非常地擅长。

这就是为什么AI画出的人像味儿很对，但是手指头老是出错。

500

这也是为什么AI写的论文经常一本正经地胡说八道。

500

（翟老师是人大的）

不能准确呈现要点和细节当然是AI相对聪明人的缺陷，但它寻找内味儿的能力或者说总结模板的能力实在太强了，远超人类。

比如说ChatGPT可以把你的同一篇文章改成李白风格，李清照风格，小学生作文，申论风格。

比如说Midjourney可以把你的文字生成为毕加索风格，梵高风格，张大千风格，克苏鲁风格。

再比如前两天我读到一篇日本大阪大学两位学者的论文，他们字面意义上发明了读心术。

有一种医疗诊断技术叫做fMRI（功能性磁共振成像），可以观测记录到大脑血流的微小变化。

我们认为大脑在工作的时候，比如说看一张图片，必然会导致各部分的神经元产生不同的能量氧气的需求，进而导致血流量的微小变化，而这个数据可以通过fMRI记录下来。

那有没有可能这种血流的微小变化数据，跟我们现在看到的图像存在对应的关系呢？当然是有可能的。但是这里这个对应的模板，这个味儿太复杂了，完全超出了人脑的理解能力。

而这个日本团队用一个叫做Stable Diffusion的AI模型，利用fMRI数据，画出了这样的图像。

500

患者看到的原图是这样的。

500

再看一些别的。

500

（图中出现真人的部分为了保护隐私挡了一下）

难道我18岁了脸上还没有长摄像头的症状可以治好了吗？？

同样的操作当然可以用来推测蛋白质构型，天气预报，也可以基于你手环的数据推测你的身体状况，有没有什么疾病。

任何你知道两件事情有关系但不知道有什么关系的问题，都可以用AI解决。

我们不知道它还能干什么

语言交互AI已经出现很多年了，但一直被称为人工智障，直到ChatGPT的出现。

我车上有个语音AI叫Nomi，可以用它来导航、点歌，有时候它在随机放歌的时候突然放到一首朴树的NewBoy，我意识到已经好久没听朴树的歌了，于是我对Nomi说：

“请帮我播放朴树的歌。”

Nomi回答：

“我现在就是在放朴树的歌啊。”

我吐血。

这就是ChatGPT跟之前的智障型AI最大的区别，ChatGPT显然有一定的情商，能读得懂我们的潜台词，而之前的AI不行。那这种情商是怎么来的呢？是因为OpenAI团队发明了什么新的AI算法吗？

ChatGPT的核心算法叫做Transformer，来自谷歌2017年的一篇论文《Attention is All You Need》。

然而谷歌并没有第一个做出ChatGPT，2018，2019，2020，2021年，都没有人做出ChatGPT，直到2022年11月30日OpenAI团队才发布了ChatGPT。

OpenAI做了什么特别的操作从而完成了这项壮举呢？

当然不排除有一些调参细节也很重要，但真正显著的不同来自于它用了所谓大模型，它把深度神经网络的参数堆到了1750亿这个惊人的数量，类比到人脑的话相当于有1750亿个神经元。

这点实际上令AI学术圈非常不满，因为做学术的人总是想我能怎么样发明个新东西新结构，巧妙地解决看似困难的问题，如此一来自然显得我很吊，但是OpenAI完全就是暴力美学，把整个AI学术圈的逼格破坏得一干二净。

这同时它也向我们展示一种令人不寒而栗的可能性，如果说情商、棋力、艺术风格甚至分寸感，这种原本我们认为独属于人类，玄之又玄的智能，仅仅是神经连接多到一定程度的自然涌现的话，

那情绪呢？欲望呢？爱情呢？自我意识呢？

现在AI模型的算力需求每隔三到四个月就会翻一番，比当年摩尔定律还要夸张。

如果模型参数再扩大一百倍，一万倍，一亿倍呢？

你现在去问ChatGPT会不会产生自我意识，他的回答是这样的。