A次元时代来临了
AI大模型及Sora的推出意味着什么,可能没有你想象的那么简单
在中国人还在欢度春节之时,一则来自大洋彼岸的消息,却让很多人感到了一丝振奋和不安。北京时间2月16日凌晨,全球人工智能模型的领跑者、AI时代的开创者OpenAI推出了一款能根据文字指令即时生成短视频的模型,并将之命名为Sora。
示例视频的生成提示词为:一位时尚的女人走在东京的街道上,街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红。她自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果。许多行人四处走动。
早在2022年11月30日,OpenAI发布名为ChatGPT的全新聊天机器人模型时,AI将引发一场新技术革命就已经成为大多数人的共识。Sora的推出意味着什么,可能没有你想象的那么简单
1
大脑革命的“魄时代”与“魂时代”
我曾经在《地图里的人类史》一书中做过几个论断:“工具之于人类来说就是外挂,外挂越多越复杂,人类的能力就越强大”“如果说人类最初想到拿石头、木棍做工具,是在为手找一个外挂,那计算机这种能部分充当大脑角色的新型机器,就是在为大脑找一个外挂”“与其说互联网是在把一台台计算机连接起来,倒不如说是在把一个个带了外挂大脑的人类连接起来”
从为人类打造大脑外挂的角度看计算机的出现,相当于人类通过一场“大脑革命”将自己拉入了信息时代;如今的AI大模型的出现,则相当于将这场大脑革命推进到了2.0时代。
在可以预见的将来,两个阶段大脑外挂的差距将会像计算机和计算器、智能手机和功能手机的差距那么大。这是因为AI大模型与传统计算机在底层运行逻辑上有本质不同,是一种基于深度学习的自然语言处理技术,可以让人和机器像人与人那样对话。相比之下,计算机的定位则是一个能快速运算的机器。需要程序员们先用它能够看懂的计算机语言来进行编程,再对其发布指令。
说到这里,突然想起前些日子和一个朋友探讨“魂魄”的问题。道家认为人的精气有魂魄之分,即所谓“三魂七魄”。至于这三魂七魄到底指的是什么,不同的玄学研究者有不同的解读。今天提到这个概念,是因为魂魄之分倒是正好可以用来对应大脑外挂的两个时代。
所谓魂,代表的是人的思考力 ;魂则控制的是人的躯体行动力。于是你会看到一个人若是没有精神,会被人形容为“失了魂”,要是没有精神还导致行动都出现异常,那就成了“失魂落魄”。
无论是香港电脑中臆想的,穿着清朝官服的“僵尸”,还是西方电影热衷的“丧尸”题材,主角都可以理解为失了“魂”的人;反过来聊斋等文学作品中描述的野鬼们,则可以被定义为还有一缕离了身体的孤魂还飘荡在人间。
借用魂魄的概念,由传统计算机语言开启的大脑外挂时代属于“魄时代”;AI大模型则用更接近人类思维的逻辑,将这场革命推进到“魂时代”。
2
A次元世界
自从人类开始创造出具有工业属性的机器以后,有关人类会不会有一天被机器取代的担忧就一直没有停止过,科幻小说作者们对这个切入点亦是乐此不疲。著名科幻作者阿西莫夫还在1950年出版的《我,机器人》一书中提出了著名的“机器人三定律”,以作为人类最终规避机器智能化风险的底层逻辑。
三定律包括:
第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管。
第二定律:机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外。
第三定律:机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存。
计算机的出现,无疑加深了一部分人的恐惧。不过要是用刚才的魂魄理论来解读,“魄时代”的机器们就算有计算机语言,也没有机会替代人类独特的思维。相比之下“魂时代”的机器们看起来要更为可怕些。形象的说,人类若真有三魂的话,那以后估计会有一魂交给机器了。
至于这把一魂交出去有多大影响,还是说魂时代的机器们终有一天也有了自己完整的三魂,抑或更会有更先进的AI模型将这场大脑革命推进到3.0阶段,那还真不是今天可以预言的。
只能说对于必须活在当下的人来说,无论前景如何都必须把它视为一个单纯的工具。毕竟人类在历史上一直在重复验证一个逻辑:工具从来不会淘汰人,被淘汰的只是不会使用工具的人。以我最近看到的一个案例来说,我那本《大明生死线》的新书正在出版准备中,收到的封面样稿已经是由ChatGPT帮着设计的了。
真要说AI时代的来临对这个世界最大的影响,那应该是可以再造一个世界,一个由AI技术主导,充沛各种作品的世界。就像以动漫、游戏、漫画、小说为载体的“二次元世界”;以计算机语言和互联网技术为核心的“网络世界”。
我们可以把由AI主导的世界称之为“A次元世界”
这次Sora的突破,就是搭建A次元世界进程中的一大突破。一项技术的普及,一个新世界的搭建,标志在于可以让所有普通人直接使用和受益。比如计算机在刚被发明出来时,因为学习计算机语言需要很可的专业知识,所以一开始并没有如此深刻的影响人类社会,只能充当少部分人的工具。
直到微软研发了Microsoft Windows操作系统,促成了个人电脑(PC)的普及,人类才算整体开启了新时代。日后的手机时代也是一样,乔布斯让手机从一个单纯的通话工具,真正变成了一个能够随时让人获取和发送海量信息的智能终端,将信息时代推进到2.0阶段。
AI大模型技术,一年多来创业者们虽然都意识到了AI大模型的价值,但都在等待一个让普通人都有兴趣且容易上手的傻瓜应用市场化。Sora的出现看起来颇有象征性,这个应用探索的是将人类创作的文字视频化。今天发布的60秒一镜到底视频,已经给观者以足够的震憾。
从我自身的角度来说,一直希望自己写的那些文字能够用视频的方式呈现在大家面前。如果Sora或类似的应用能够做到这点,我肯定是非常有兴趣成为它的忠实用户的。
具体到创造一个世界的愿景来说,可以用当下风头最劲的抖音(TikTok)为便。抖音在内容创作上的逻辑,是激发用户自身的创作欲望,同时配合算法的精准推送,让用户们疯狂用短视频来记录自己并上传。如果有一个APP能够把自己想象出来的文字,变成电影般的场景,那再造一个类似的互联网大厂是极有可能的。
一切皆有可能,可以在一生中经历几次技术革命,是我喜欢人类这个阶段的原因。至于未来会发生什么,还是让我们拭目以待吧。
3
中美在AI领域的竞争
又到了很多读者期待的中美博弈环节。坦率说把这个世界分割为两部分,并且凡事都与中美博弈挂钩是我最不愿意做的。相比之下,我个人更喜欢享受技术革命带来的惊喜。
不过作为一个地缘研究者,一个中国人,还是不免要时不时结合时政发表点意见。就拿AI大模型这件事来说,不光中国方面极为关注技术的发展,美国方面更是将AI视为再次与中国拉开技术代差的救命稻草。
2023年11月21日,美国《财富》杂志首次发布“人工智能创新者50强”榜单。榜单中绝大多数都是美国企业,中国企业仅有百度上榜。要是光看这份榜单,美国在AI时代对世界的统治力似乎比过往更强。只不过从历史经验来说,这种短暂的先发优势只是暂时的。即便美国日后依然能长期保持优势,也不可能领先如此高的比例。
AI大模型虽然是新东西,但遵循的发展逻辑并不会与之前信息时代产品有本质区别。一定要说区别那就是之前的竞争中,美国是在华为在5G技术上开始领先时才意识到问题的严重性,并开始有组织的围堵中国供应链。这次已经开打高技术战争的美国,则寄希望于在AI革命开启时就全方位压制中国,比如禁止英伟达将高性能芯片卖给所有中国企业。如果参照之前的手机芯片之争,则只是禁止华为等有战略威胁的企业购买,诸如小米一类的企业,能可以购买高通的高性能芯片。
另一个与美国封堵无关的短板在于数据。训练AI模型需要喂数据,要是单以网站来说,全球56%的网站是英文内容,而只有1.5%的网站是中文,显然会更有利于美国的模型搭建者。不过这个数据的差距主要是因为,中国人的移动互联网更加成熟。中文世界所提供的数据,主要是通过手机APP产生的,大部分内容没有办法通过搜索引擎抓取。好在这个差距并非没有办法从技术和立法角度缩小。
回归技术竞争的本质。构筑A次元世界者仍会分成软、硬件两派,想成为领先者同样需要在这两个方向上发力。OpenAI算是美国在软件方向的代表,生产AI芯片的英伟达则专心打造硬件基石,负责提供算力支持。
于是世人会看到,芯片制造工艺依然成为所有问题中最关键的节点。所幸经由之前这几年的战争,中国方面同样没有存有幻想。之前在芯片产业的破局努力,同样会在AI时代延伸。一旦突破将引发连锁反应,就像在华为mate60手机横空出世所引发的效应一样;另一个可以预期的前景,那就是Sora一类的应用市场化后,中国方面同样会有类似的产口迅速抢占自己的市场,包括凭借最大单一市场的优势再创新。
不管怎么说一个现实都是存在的,世界已经分割成了中美两部分,无论是在现实世界还是信息技术打造的世界。比较冷战时代最大的幸运,在于当下中美这两个世界,都将竞争的注意力放在了面向市场的高科技领域,并且都遵循同一逻辑。这使得双方的产品不会像美苏争霸时那样无法互联互通,最终造成人类整体资源的浪费。
从企业竞争的角度来说,在这个新技术革命端口我最看好的中国企业仍然是华为。无他,因为这个企业已经找到了一个即能快速应对市场变化的研发体系(并且是从底层架构入手),又符合中国叙事的生存模式。
一如我在之前视频课提到的那样,美国对这个世界的统治力体现在三方面:金融统治力、高科技统治力、军事统治力。这三个方面的代表则分别是:华尔街、硅谷以及可以在全球任何一片海域显示存在的美国海军。
是不是看好中国的未来,每个人都有自己的想法。文章最后倒是可以针对美国的三大优势提供三个崛起标志,以供大家参考,分别是:人民币的国际化、华为的技术创新力,以及航母的数量。