ChatGPT不是一个聊天机器人,是以自然语言为界面的机器人,这是两件事

来源:微博@木遥

虽然这个话题已经有点过热了,但我觉得还是值得写一下为什么 ChatGPT (确切说是以它为代表的大语言模型的进展)是重要的。(顺便说一句,几个小时前 Google 宣布即将推出自家竞品 Bard,白热化的竞争指日可待)。

ChatGPT 不是一个聊天机器人。ChatGPT 是一个以自然语言为界面的机器人。这是不同的两件事。

「作为一种服务的自然语言界面」并不是一个常见的概念,虽然这件事每天都在发生。一个人从最早接受教育的时刻就在训练自己把书本上的内容翻译成自己心里可以理解的自然语言,并且也许你脑海中想象过这样的场景:在看书的时候有一个精灵浮现在书本上对你说:「我了解这本书的全部内容,你有什么问题可以问我。我是这本书里的结构化知识的对话界面。」这是件很诱人的事,但你极少听到人们谈论这个需求,因为就像大多数新事物一样,在它诞生之前人们甚至没有意识到这是可以被需求的。这怎么可能呢?

作为一种服务的自然语言界面是极为昂贵的,为了给教材一个这样的界面,人们发明了教师。为了给财报一个这样的界面,人们发明了基金经理。为了给法律文书一个这样的界面,人们发明了律师。事实上,几乎所有现代经济中的「professionals」本质上都是这样的一种服务。它把结构化的信息转译成自然语言,可以被讨论、被诘问、被辩难,然后再被对手方转译回结构化的信息。

以 ChatGPT 为代表的语言模型宣告说:这件事是可以被机器做到的。不是无中生有的创造信息,而是对它的归纳、总结、举例、在不同结构之间切换。——这就是为什么上个月微软董事长 Nadella 说这是新的工业革命(我倾向于同意他),因为信息流通转译的服务(不是信息本身,但这种服务是现代经济的血脉)的价格在一夜之间被彻底改变了。

有许多人不认为大语言模型有智能。最有代表性的可能是图灵奖得主 Yann Lecun,每天咆哮痛斥 ChatGPT 已经成了他最近的每日功课。就在昨天他发推说「任何一只猫所掌握的常识都比任何今天的大语言模型更多。」有人在评论里弱弱地问:「你家的猫也能写 Python 吗?」他回复说:「写 Python 算个狗屁智能。」

我不会说猫的任何坏话(也不会说 Python 的任何好话),所以我只能说他说得对,但这是没什么意义的正确。半拉子智能也可以有实际的用处。语言模型并不需要「在本质上了解世界」,只要装做了解并且能够侃侃而谈就可以了。毕竟很多大V(以及麦肯锡和德勤的咨询师们)能做的也不过如此。

下面是我这两个月来看到的比较有趣的语言模型应用(不一定是 ChatGPT,有些和它是竞争关系),在这些例子里,你可以明显看到它们是怎样搭建在两种信息结构之间形成桥梁的:

网页链接 训练在生物医学文献上,和你讨论文献内容。

网页链接 训练在美国哲学家 Daniel Dennett 的著作上,可以伪装成这个哲学家本人和你讨论哲学问题。

网页链接 一个建立在 Wolfram Alpha 上的接口,让你可以用自然语言(甚至使用话筒)问数学问题(它背后是 Wolfram Alpha,不是 ChatGPT 那种二把刀数学)。

当你急于指出 ChatGPT 的弱点(太多了,我自己在过去两个月里写过不少)的时候,有必要想到的是:首先,这里有些是 ChatGPT 这个特定产品的问题而未必是大语言模型的问题(比如很多人不喜欢 ChatGPT 不给出参考文献,但它的一个竞品 网页链接 就会给)。

其次,也是更重要的是,这个领域在接下来的几个月和几年里会因为大量资金的投入突飞猛进。AlphaGo 刚推出的时候也有人嘲笑说它连欧洲围棋冠军都下不赢,但重点在于「它竟然有资格跟欧洲围棋冠军下棋了」。同样的,当你抱怨 ChatGPT 鬼话连篇满嘴跑火车的时候,这可能有点像你看到一只猴子在沙滩上用石头写下1+1=3。它确实算错了,但这不是重点。它有一天会算对的。

500

全部专栏