Sora这浪,中国跟不跟

人工智能是定义未来世界的关键技术之一,AlphaGo、ChatGPT和Sora或许可看作人工智能的三次浪潮,中国一次也没有赶上。这自然成为人们众多焦虑点中新增的一个,也成为美国将永远领先中国的新证据。

人工智能从理论到实践都在取得飞速发展,但一些基本问题并没有解决,比如:人工智能干什么用?人工智能与人类智能到底是什么关系?

人工智能干什么用似乎是一个不言自明的问题:什么都能干,从生产到生活,从聊天到思考,只有想不到的,没有干不了的。

这说起来不错,也是美国着力于研发自上而下的通用AI的理由,但实际上问题多多。人类有脑容量和学习时间的问题,再聪明的人也不可能样样精通。通用AI没有输入和算力瓶颈,还真是可以什么都学,但实际上学什么还是要看研发者“喂”什么数据。通用AI只能接触到“公共领域”的一般性知识和数据,专业领域的知识和数据研发者自己也不懂,“喂”什么都不知道,AI就无从训练了。

然而,通用知识的量其实有限,把中小学加大学主要系科的教科书统统灌进去,通用知识就八九不离十了。但专用的领域知识就要复杂、广泛得多。所谓行行出状元,状元脑瓜里肯定货多,否则状元也太容易了。这样三教九流加起来,数据的收集、标识就是巨大的工作量,难怪奥尔特曼说要7万亿美元才能使得通用AI真正能干活。

中国AI走专业化路线,自下而上,物流、生产线管理和质检、自主驾驶等AI没有ChatGPT、Sora等那么高调,但也都在悄悄发力。更重要的是,接地气,天然建造于专业数据之上,用于专业环境,能很快形成生产力和产生经济效益的实用功能,进而反馈和资助进一步的AI研发。

相比之下,Chat GPT、Sora还只是“玩意儿”。在现阶段,有人戏称:人类幻想AI包下洗衣做饭打螺丝,人类好吟诗作画玩音乐;结果AI直奔吟诗作画玩音乐,洗衣做法打螺丝的活儿留给人类了。

前沿科技成为玩意儿,其实可以发现历史上有意思的对比。

在维多利亚时代后期,英国依然是世界上科技和国力最领先的国家,德国和美国还在发力中。

富强的英国不仅有雄厚的科技技术和最高的教育水平,还有很多有钱有闲的人。这也是个科技属于时髦玩意儿的时代,富二代有很多人会捣鼓点炫但是无用的东西。

英国妇科医生Joseph Mortimer Granville在1880年代(具体年份不明,应该是前期)发明了振动棒,成为妥妥的妇女之友。他是在治疗女性歇斯底里症(现代医学不再认为这是一种病症,只是性生活失调引起的一些症状)中,累到肌肉劳损。受到朋友发明的启示,最后发明了振动棒。朋友是个富二代,闲来无事,自己发明一个手持电风扇一类的玩意儿,用转动的羽毛扇风,在夏天给自己消暑,都没有想到过要产品化,只是在朋友圈里炫耀炫耀。Granville医生稍做改进,发明了振动棒,据说人老心不老的维多利亚女王也爱不释手。

振动棒倒不是吟诗作画,但与那个“火热的年代”的其他发明相比,和吟诗作画也差不多了:

- 亚历山大·贝尔发明电话(1876年,苏格兰人,但在美国、加拿大完成的发明)

- 尼古拉斯·奥托发明四冲程发动机(1876年,德国)

- 托马斯·爱迪生发明灯泡(1879年,美国)

- 卡尔·奔驰发明汽车(1885年,德国)

- 尼古拉·特斯拉发明电动机和变压器(1888年,塞尔维亚人,在美国完成的发明)

- 鲁道夫·迪塞尔发明柴油机(1892年,德国)

也就是说,英国尽管领先,真正领导潮流的发明创造常常产生与国外,尤其是德国和美国。

英国工业在关键领域依然领先,尤其在造船方面。19世纪末到二战前,造船工业就是高科技,地位至少与今日航空航天再捆绑上计算机软硬件。与通常的认知不同,那个时代凝聚造船工业最高水平的不是战舰,而是邮轮。1912年下水首航的“泰坦尼克”号的吨位达到46000多吨,同时代的“铁公爵”号战列舰“只有”3万吨,两者的速度一样,都是21节。

500

英国工业的余晖还在,尤其体现在邮轮的建造上,这是“泰坦尼克”号的姐妹船“奥林匹克”号

500

“奥林匹克”号(左)和“泰坦尼克”号唯一的合影,几天后后者首次出航就撞上冰山,沉没了

500

“毛里塔尼亚”号的螺旋桨这样复杂形状、整体打造的超重型金属制件是洋火、洋钉时代的中国彻底想象不能的科技和工业实力,其震撼大大超过今日2nm芯片和通用AI

英国科技也还领先,剑桥的卡文迪许实验室在科学界的地位依然不可撼动,但英国的去工业化已经悄悄开始了,科技成就的产品化常常“墙内开花墙外香”,以至于后人称此为英国病。相比之下,振动棒毕竟还是产品化了。

在某种程度上,今日美国和维多利亚时代到一战前夜的英国有点相像,一方面依然是世界霸主,在高端工业和科技方面依然领先,实际上依靠惯性。英国的领先实际上一直持续到二战时代。另一方面,去工业化已经很深,经济基础开始悬浮,造成科技成果也悬浮,或者墙内开花墙外香。

回到AI,AlphaGo、ChatGPT、Sora都基于深度学习,深度学习“只是”对给定数据建立条件反射的关系,只是关系高度复杂。换句话说,再通用的AI,依然只是对数据建立关联性,“A和B总是/很可能一起发生”;但不是因果性,“因为A发生,所以B发生”。

关联性和因果性的区分非常重要。

A和B一起发生,只说明两者是关联的,但不说明A导致B或者B导致A,有可能两者都是因为C才发生的。A导致B,或者B导致A,这才是因果性。

关联性是通过观察就可以得到的,并不需要多少智能。动物惧怕火,人类也怕火,这是条件反射,并不是智能。人类比动物强的地方,是还有经验,可以根据相似经历推断。暗红的铁板和火不像,但空气在扭动,凭经验就知道,这东西很烫。更进一步,古人每一次造桥的材料和环境都会有所不同,但桥造多了,有经验了,会根据相似情况综合推断出符合当前要求的造桥材质要求和施工方法。

通用AI厉害是因为能以比人类高得多的速度和大得多的数量“喂入”数据,建立海量因子之间的复杂关联性,“ABCDEFG……和1234567……总是一起发生”而不只是“A和B总是一起发生”。而且能在现有数据之间“内插”,在邻近的数据点之间推测并无直接现有数据的中间值,或者有限外推,这就有点经验的意思了。

但这不是因果性。回到造桥,根据经验造桥可以大体保证不会塌下来,但不是根据力学原理,换一个全新材料,比如从石料换成钢铁;或者换一个桥梁构型,比如从桁架桥换成拱桥,就要从头摸索了。

从数据分析因果性,这或许是人工智能与人类智能依然存在的最根本差别。牛顿看到苹果落地,最终研究出古典力学,建立了因果关系。有了力学工具,人们不仅会造桥,还可以举一反三,造大跨度建筑、飞机机体,同样的力学原理甚至用于地球轨道上的空间站结构。关联性只能停留在现象的表面,因果性才揭示现象的本质,这才是智能。

换句话说,在人类也弄不明白因果性的地方,给人工智能“喂”再多的数据,依然得不出有用的结论。比如说,把世界股票市场上所有历史数据统统“喂进”ChatGPT(可能已经有人做过了),再问ChatGPT买什么股票能赚大钱,即使ChatGPT给出答案,估计也没人敢据此砸大钱;把历史上所有战争史数据“喂进”ChatGPT,问ChatGPT如何才能在乌克兰发动成功的大反攻,更是没有人会据此下达作战命令。当前美国最关心的问题是如何打败中国,问问ChatGPT吧。

Sora比ChatGPT动用更多的算力,但在本质上还是把AI作画变成AI动画,增加了时间维,还是命题作文,并非原创创作。命题的质量直接决定作品的质量。

在本质上,人类对自己的智能的理解依然很肤浅,对于智能的刻画和表述依然很肤浅。一个简单的“睿智”,到底该怎样用数据或者语言来描述?嗯,说不清楚。那就连“喂数据”都难,喂什么?问AI“如何使得我睿智”,AI也答不上来。

AlphaGo、ChatGPT、Sora依然是了不起的成就,值得中国跟。但是眼下否跟上,并不需要太过焦虑。就像德国和美国在专注发明汽车、内燃机、电灯、变压器的时候,不必为英国首先发明振动棒而太过焦虑一样。

倒是物流AI、自主驾驶AI、生产线管理和质检AI以及其他面向具体应用的AI,要抓紧做起来。在做的过程中,对AI的一般原理和算法、概念形成更加深刻的理解,在这个基础上再总攻通用AI不迟。

站务

全部专栏