大模型只是超级刷题大师

本文由拜读xiejin77兄大作有感而发。

个人认为,大模型没有奥秘,还是靠模型参数之多来更好地“捕捉”现有知识。极端简单化地说,这还是数据拟合问题。也就是说,用方程式去“凑”数据点。对于三个数据点,用一元二次方程就能拟合;4个数据点,用三次方程;……。大模型是对多少万亿甚至更多的数据点的拟合。这在技术上当然具有不可思议的挑战,但还是量变,而不是产生智慧的质变。知识依然来自海量的数据,也就是人类对世界的现有认知。

大模型“有创造力”的印象来自吟诗作画,但不是还有“熟读唐诗三百首,不会写诗也会诌”吗?画画也是一个意思,只是从文字介质换成图像介质。

AI总结现有数据能力超过人类是自然的,就像雷达、光电红外的“视觉态势感知”好于人类一样。AI的输入通道数量和输入速度比人类高太多了,运算速度也爆棚,要刷题,人类是不能拼得过AI的,就像再厉害的心算手也难和计算机比拼。要是不服,来个30x40的有限元问题算算,这只是数值分析课堂作业的水平。谁要是无聊到开动AI狂写诗,乾隆都要羞愧。但事实还是一样的:乾隆不是真诗人,AI也不是真诗人。

大模型加海量数据依然在本质上是超级刷题大师。比“查表”式的直接找答案要高级,能填补现有数据之间的空隙,但不能跳出现有数据所代表的知识框架。在本质上,刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终也解决不了。刷题也不是直接照搬例题,还是要判别题型和抓取数据不是嘛。

世界上的“题解”已经够多,所以海量刷题是能刷到很恐怖的“智能水平”的。但依然只是超级刷题大师。沿着这条路走下去,不可能走出创造智慧、具有独立判断的“强人工智能”。

用围棋规则自我训练是另一个问题。那是有限空间里确定解的问题,是极大规模的最优化问题。在本质上,这与“深蓝”早年打败卡斯帕罗夫相似,只是算力极大提高了,算法极大改进了。

这对中美的AI大赛意味着什么呢?

AI的最终用武之地是在应用,应用型的AI的厉害来自数据,实践才出数据。大模型只是把筐做大,需要更强的算力和收敛性更好的算法才能求解罢了。

在军事、艺术这些方面,美国有足够的实践,数据比谁都多,美国AI会很厉害,可能超过中国。必须说,中国军队打仗没有美国多,中国影视没有好莱坞能折腾,音乐、美术等也是一样。

但中国人在制造、建设、物流这些实体方面的实践更多,数据丰富得多。社交媒体和大众通信方面,抖音、微信、小红书出现在中国也不是偶然的。个人认为,这些与经济和社会相关的AI应用可能中国会领先,如果不是已经领先的话。

美国式AI训练凭借算力和算法优势,把天下所有圣贤书、垃圾书统统海灌进去,希望“良币最终压倒劣币”,也因为缺乏“领域专家”(domain experts),搞AI建模的人没有能力筛选圣贤书、垃圾书。他们需要的是“通用人工智能”,而没人是能在所有方面都成为专家的。

中国式AI训练在算力方面吃亏,算法再厉害也输在起跑线上。但中国人有有用的专业知识积累,中国AI也聚焦专业AI,专家参加训练,所以大模型训练时只灌圣贤书,不灌垃圾书,最后在形成有用但专业AI应用方面成绩斐然,图像识别就是例子。据说图像识别白菜化到有的车型看到家人坐上车来,会主动叫名字问侯。

最终,算法、芯片这些都不足以决定性地改变中美AI的走势,应用才是决定因素。只有AI应用开始产生效益,才能回馈进一步的AI发展。这可能是中美AI最大的差别。

xiejin77兄的原作获得特许转载如下。x兄在人工智能方面很有建树,是专业大拿。原标题是《所谓三联与赫拉利的技术迷航》。

================================

有非技术背景的前辈发了这个链接的三联文章给我看,问我关于大模型,甚至是AI的危机是否存在。我努力的把三联这篇文章看完,忍不住写了一段话。也希望看到的朋友不要再被这样的文章所困扰。

说句老实话,所谓三联与赫拉利的技术迷航,就是打着人文解读的旗号而为了攫取流量,而甘愿将自己沦为算法焦虑的放大器而已。

读罢这篇赫拉利的新书推介,一股浓郁的“技术恐慌”味扑面而来。三联一如既往地用充满人文关怀的笔触,描绘了一幅人工智能即将奴役人类的末日景象。然而,在看似深刻的论述背后,却充斥着对技术缺乏基本理解而导致的逻辑硬伤,以及对算法能力的过度夸大。

文章将人工智能比作脱缰的野马,认为其“独立决策”的能力将导致人类失去控制。然而,任何对人工智能技术稍有了解的人都知道,所谓“独立决策”不过是基于海量数据训练得到的统计模型,其行为仍然受制于算法的设计和训练数据的选择。将算法比作拥有自主意识的“独立行为者”,无异于将算盘说成是数学天才。

更令人啼笑皆非的是,文章将缅甸种族暴力事件归咎于脸书算法,认为算法为了“提升用户参与度”而主动传播仇恨内容。这种说法完全忽略了现实世界中复杂的社会、政治和历史因素,将一起惨剧简单粗暴地归咎于技术,仿佛算法是独立于人类社会之外的邪恶力量。

诚然,算法推荐机制存在着放大偏见和制造信息茧房的风险,但这并不意味着算法本身具有主观恶意。将算法拟人化,赋予其“愤怒”“仇恨”等情感,不过是将人类自身的责任推卸给技术的表现。

更具讽刺意味的是,文章一边渲染着人工智能的强大,一边又建议人们通过“信息节食”来抵抗算法的控制。这种自相矛盾的论调,暴露了作者在技术理解上的混乱和无力。

赫拉利作为一位历史学家,或许能够洞察人类历史的兴衰更替,但对于技术领域的理解,显然还停留在科幻小说的水平。而三联作为一家以人文社科内容为主的媒体,在面对新兴技术时,也暴露出其知识结构的短板和思维方式的局限。

与其沉迷于算法焦虑,不如脚踏实地地去了解技术,用理性和批判性的思维去审视技术的社会影响。毕竟,技术本身并无善恶,关键在于人类如何去使用它。将算法比作独立行为者,就好比将算盘说成是数学天才。就算是GPT这样的大语言模型,他的算法依然没有情感,只有代码。

而且信息茧房的制造者不是算法,而是人类自身的偏见。与其被这种口水垃圾文章蛊惑,沉迷于算法焦虑,不如用知识武装自己。好好去了解一下AI,至少在目前的技术线上,技术仍然只是工具,关键在于使用者是谁,以及使用目的何在。

​总而言之,这篇文章与其说是对人工智能的深刻反思,不如说是对技术无知的放大。在信息爆炸的时代,保持独立思考的能力比以往任何时候都更加重要。不要让算法焦虑蒙蔽了双眼,更不要让技术恐慌成为逃避现实的借口。

三联的原文链接(https://mp.weixin.qq.com/s/wGmTS_59mQjKM9WvHoth9w)

全部专栏