汪行福|ChatGPT的终极之问:赐福还是诅咒?

ChatGPT(以下简称GPT)对人类来说,到底意味着什么?比尔·盖茨认为,它是电脑、互联网之后的第三大发明。基辛格对它的评价更高,认为它是继印刷术发明以来最为重要的技术进步。GPT潜能巨大,将在极大范围、极深程度上影响到当下生活和人类未来,其意义可放在上下五千年文明大背景下讨论。

GPT能量巨大,但对其认识呈现两极化,一些人把它视作赋能(empower)工具,百求必应。无需多少时日,与互联网联结实时查询,就成了webchatGPT,与翻译软件结合遍访人类所有的知识库,就成了globalchatGPT。也有一些人认为它是黑箱,不透明,缺少反思和批判能力,拉低我们的道德水平。其实,一个终极之问是:GPT和AIGC是人类的自我赋能还自我罢黜(dethrone)?人自诩为万物之灵,是天地之间唯一的有意识的动物,是能说话、有思维和推理能力的动物。如果AI有了类人式意识,又没有人在记忆和耐力上的限制,它是否会把人从王座上推下去,自己登上王位? 

500

我的核心观点是,GPT成功地使人工智能自然语言化,为人类创造了知识生产和运用的母体和平台,有可能改变文明的底层逻辑。人类的文明是以智人大脑为基础的自然语言文明,以人工智能为基础的人机一体化的新文明到底是赐福还是诅咒,是我们需要回答的“终极之问”。

以智人大脑为基础的自然语言文明

GPT是大型自然语言AI对话程序。之所以引起轰动,缘于其技术的优点。概括起来,它有三个方面优点:通用性、生成性、增强性。这些特征缘于AI的自然语言处理能力和大数据模型的结合。兹事体大,它意味着知识的获取、创造和运用的母体或平台的大迁移。

人工智能革命出现之前,科学技术已取得了一系列重大的突破和成就。一方面,人类已能上天入地,现代交通工具把全球联系在一起,不仅创造了地球文明(global civilization),如果火星移民计划实现,还会出现星球文明。这是人类在超距文明上取得的成就。另一方面,现代物理学、化学和生物学已进入到物质的内部,深入到感官无法感知到的细胞核、原子、分子层面,有了改造物质微观结构的能力,这些都是人类在微距文明层面的成就。然而,在人工智能取得决定性突破之前,人的智能、意识、思维和理性仍然是技术的禁区,是“化外之地”。在根本意义上,超距文明和微距文明影响的还是人类生活的环境,还没有影响到人之为人的特征,即人的意识和思维。GPT的决定性意义正在于它突破了禁区,进入到人性的幽暗之地。如果说,以智人的大脑结构和自然语言相结合为基础的人类文明称作人类纪文明,GPT以及AIGC的出现则可称为后人类或“后人类纪”文明。对这一次文明基础的大挪移的意义和重要性的反思,需要大尺度的视野。对此,我们不妨从《圣经》的巴比塔(The Tower of Babel)神话入手。故事的梗概如下:

人类祖先说着同样的语言,他们东迁来到示拿这个地方,遇到一片平原,决定在那里住下。有一天,他们彼此商量,决定建筑一座城和一座塔。建造一座塔,一座通天塔,以便传扬他们的名。建造一座城,以便聚拢他们的人。耶和华降临,看到世人所建造的城和塔,感到受到冒犯。耶和华说:“看哪,他们成为一样的人民,都是一样的言语,如今去做起这事来,以后他们所要做的事情,就没有不成就的了,我们下去在那里变乱他们的口音,使他们的言语彼此不通。” 由于上帝搞乱了人类祖先的语言,他们争论不休,于是造塔计划失败。“巴比”(Babel)意为“变乱”,故事的核心是,上帝通过变乱人的语言挫败了他们的野心。巴比塔计划失败后,人类分散到全球各地,说着不同的语言,于是有了人类文明的多样性。

人类文明总是悬于天堂和地狱之间,既不太好,也不太坏。即使到今天也是如此。正如狄更斯在《双城记》中所说:

这是一个最好的时代,这是一个最坏的时代;这是一个智慧的年代,这是一个愚蠢的年代;这是一个光明的季节,这是一个黑暗的季节;这是希望之春,这是失望之冬;人们面前应有尽有,人们面前一无所有;人们正踏上天堂之路,人们正走向地狱之门。

500

为什么人类悬于天堂和地狱的中间?我们还需补充创世记神话。上帝在创造了天上和地上的一切以后,到第六日,上帝说:“我们要照着我们的形象,按照我们的样式造人,使他们管理海里的鱼、空中的鸟、地上的牲畜和全地,并地上爬行的一切昆虫。”也就是说,上帝赋予人以万物之灵的地位。《圣经》的神话有深刻的寓意。上帝按照自己的形象创造了人,赋予人以万物之灵的地位,让他具有意识能力,从而能够创造文明。同时又通过把人类祖先逐出伊甸园和变乱他们的语言来限制其野心。生活在地球上的人,说着不同的语言,分散地生活在各地,既为人类文明创造了条件,也限制了它的发展。简单地说,自然人的心智结构和自然语言的交往手段两者结合构成人类纪文明的母体。迄今为目,人类的一切文明和技术成就都是在这个平台上动作的,也是在这个母体中生成出来的。就此而言,人类文明是上帝赐福和上帝诅咒的双重作用约束下形成的。

人类文明的多样性缘于自然语言的多样性。自然语言的多样化对人类文明的意义是双重的。一方面,自然语言的多样性造成了种族、宗教和文化之间的隔阂、分裂和矛盾,阻止了人类团结和修建通天塔愿望的实现,这是自然语言之“咒”(Curse)。另一方面,人的心智和通过自然语言相互理解和交流的能力,又给人类创造文明提供了足够的空间。让他们对内交流,建立家庭、民族和国家,创造知识和文化;对外交流,相互学习借鉴,维系某种人类文明秩序,这可称为自然语言的“赐福”(Bless)。

人类文明史有多次大转型,从野蛮时代到农业文明,从农业文明到工业文明,从工业文明到后工业文明,每一次文明的成就都是祸福相依的,既是对人的赋能,也原有人类活动及其形式的重组,其中不可避免地在人际间重新分配收益和代价。就此而言,GPT与以往的文明变迁没有太多区别。然而,GPT还是有它的不同之处。作为自然语言的人机对话平台,还突破了智人大脑的生理限制,突破了自然语言的技术限制。这件事意味深长,如果GPT和AI的发展为我们拆除了上帝为人类文明设定的框架,在人类文明的底层逻辑上带来了根本性的变化,那么,它们的出现确实意味着人类文明史的奇点。巴比塔的倒塌意味着以智人大脑为基础的自然语言文明的到来,GPT的出现意味着以AI为基础的后人类文明时代的到来?希望之所在,也是恐惧之所在。

自然语言AI大模型意味着什么?

“语言是存在的家”(海德格尔语),人是语言的动物,语言的限度就是思想的限度。然而,自从现代科学诞生以来,特别是现代哲学的语言学转向以来,在语言上存在着两种范式的竞争。一种是自然语言,一种是人工语言。自然语言是文化的语言,人工语言是科学的语言。自然语言是是人类文化的家园,每一个宗教、族群、文化共同体都希望有自己的语言,即使没有也要创造出来。自然语言与人工语言各有其偏爱的领地。自然语言的独特领地是人文科学,它为人的本真性情感的表达提供了条件,也为民族认同建构提供了神圣象征。每一种自然语言在本民族人看来都是美的,在19世纪民族国家理念中,“一个民族”“一种宗教”“一种语言”被认为是从族群社会进入到民族国家行列的条件。然而,自然语言有其优点,也有其缺点,它承载着人类生活世界的一切背景知识,是人与人之间交往的中介,它的生动性、多义性为文学和艺术提供了得天独厚的条件。但是,自然语言的歧义性和含义的模糊性也给知识的表达和传播带来的消极影响。正因为如此,一些人仍梦想巴比塔之前的同一语言,用一种语言——如世界语——取代五花八门的自然语言。在理性主义和科学主义传统中,这一隐秘愿望构成许多人的思想动机。

500

古希腊就流传着这样的说法:上帝是一位几何学家,世界万物之美在于它符合几何学的比例和结构。除几何学外,数学也是人类知识的典范。毕达哥拉斯说:“数学支配着宇宙”。近代许多哲学家把数学和几何学视为知识的典范,因为在这些知识中,概念是严格定义,命题之间有严格的逻辑关系。像笛卡尔、莱布尼茨等哲学家都致力于数学的研究,把数学视为窥视上帝秘密的途径。斯宾诺莎甚至以几何学公理的方式写他的《伦理学》。

人工语言传统虽然很有影响,但长期以来,仍然是自然语言占据统治地位。在亚里斯多德的三段论和形式逻辑中也运用了符号,但它们仅仅用于表示语言判断之间的逻辑关系。从莱布尼茨开始,哲学家孜孜以求建立一套人工语言系统,用以表达人的思维和推理,并把算术机器化,然而,这个理想直到符号逻辑和符号数理学的出现才得以实现。即使如此,符号逻辑的运用范围也是有限的,它始终被限制在语言表达式之间的逻辑关系层面,并没有进入到思想内容本身。在人工智能取得突破性进展之前,语言的人工智能化陷入这样一个困境:或者接受一个应用范围有限的可技术化处理的人工语言系统,或者延续自然语言传统但放弃人工智能化。GPT的出现打破了这一僵局。它作为自然语言人工智能系统,不仅能够通用于各种自然语言,而且还具有生成性,能够生成新的内容。

新一代人工智能,即AIGC的最大特点是它的生成性,它可以根据语言或文本提示生成新的内容,完成文本写作、绘画、编程、解码等工作。谈到GPT,许多人都注意到,在巨量“喂食”后,大模型预训练模型后会“涌现”出神奇的新的能力,能信息搜索、语义理解、问题分析并生成新的内容,而这些本来只有人的思维才具有的能力,且在自然语言的理解和对话中才得到最充分展现的能力。

谈到“涌现”,不由得想起海德格尔。他强调,自然语言与其说是交往工具,不如说是存在。真正的思想不是说话者的思想,而是思想通过语言自行“道说”,而自然语言是这种六年升任最切己的表达手段。在某种意义上,海德格尔在这里阐述的是人类沉浸式思考的经验:一个人沉浸于思考之中,会文思泉涌。伽达默尔也说:“‘表达’并非主观选择的问题,即并非限于事实之后并且借助于个人思想中的意义被赋予了可传达性而加以于事实之上的某种东西。不如说它是精神本身的生成,它的‘解释’。”海德格尔和伽达默尔对存在之思、存在之言的论述,似乎先行地道出了GPT的逻辑:自行思考,自行生成。而GPT的对话之所以具有这样的特征,不仅在于它能够很好地耦合人的自然语言,而且其本身表现为类似于自然语言系统的东西。如果说AI是对人脑的神经网络的模仿,GPT则是人的自然语言对话系统的模仿:模糊认知、解释、交互学习等。在此意义上说GPT有了人的意识并不为过。

问题在于,GPT不仅具有类人式意识,而且具有超人式意识。依本人陋见,人类纪文明建立于自然语言与人脑思维之上的,两者的结合既人类文明提供了空间,也限制它的发展。上帝赋予人以像他一样思考和语言能力,又在人建造巴比塔时“变乱”人的语言,限制人类的野心,由此开启了人的理性能力和自然语言相结合的人类纪文明。GPT的出现截断了人脑机能与自然语言之间的联系,自然语言对话平台从人际移到了人机际,甚至会发展到机与机的对话。这是人类文明底层逻辑的重大变化。

无论是GPT(generative pre-transform)还是AIGC(AI generative content)大模型模拟的都是人脑神经网络。但在超大数据库(人类知识贮存)与计算机超级算力的加持下,其能力可以远远超过人类。正如计算机在计算领域取得的成就一样,AIGC也会在自然语言的理解、解释和生成内容方面拥有类似的能力。打个比喻,AI把思考和推理等人类思维活动从自然人的智能平台移到人工智能平台,就像原来在高低不平的泥路上跑的汽车上了高速公路,能力倍增。在其中,无数信息通过无数节点联结,极速地回答各种问题,完成各种任务。GPT的信息收集和处理能力巨大,被人们誉为“All-knowing Machine”或“全知之神”。

对GPT的近忧远虑

海德格尔曾区分“怕”与“畏”。“怕”有具体对象和缘由,可计算得失;“畏”则不同,它是对无之畏,是对存在之整体的沉沦的畏,在此,所有存在者被抛出自己的轨道,进入到无根无据的深渊。面对GPT,我们不由地生成复杂的感情,它不仅是“怕”,而且也是“畏”。

在现象层面,每一次技术创新都有复杂的伦理和社会后果。(1)像每一次技术创新和大规模运用一样,GPT不可避免地在人际间出现收益和代价的再分配,催生一些行业,毁灭一些行业。如果我们承认,人的尊严与其劳动中体会到的自主性有关,GPT的出现无疑会对那些剥夺了劳动机会的人的生活造成重大损害。(2)虽然GPT有极大的亲民性,小绿框有问必答。但该项技术的可及性有可能造成新的不平等,加深数字鸿沟。(3)与任何节省体力和脑力的技术工具一样,GPT的使用中会产生依赖性风险,它在教育和学习领域影响尤其显著。GPT可能提高人的学习效率,人也可能对其依赖而丧失学习动力。(4)GPT是自然语言的人机对话程序,形似人与人的对话,但毕竟不是人与人的对话。如果交往是人与人的关系和社会融合的条件,GPT的出现是否会导致人类逃避其同类,而这种倾向又会对人类文明依赖的各种组织形式——婚姻、家庭、宗教、艺术、民主政治等——产生什么影响?(5)与以往工业技术引起的卢德式抵抗不同,GPT似乎具有亲和性。它对人有求必应,答案不乏个性,表现得就像一个知心朋友。然而,大数据模型训练出来的回答到底有多少个性?它向人呈现的个性化是否只是一个幻影?诸如此类问题都是现实的,也是需要不同领域的研究者去探讨的。

真正引发人们担忧的是本体论层面的问题:GPT到底是什么?我们到底能对它做什么?前者可称为透明性问题,后者可称为可控性问题。有不少学者指出,GPT的透明性是一个很大的问题,我知道它输出什么,但不知道它的工作原理和机制。虽然有人对AI绘画神器Stable diffusion的绘画过程做了还原,即逆向地展示一幅画如何一步一步退回到最初的指令,从而能够直观它的工作。但是,对ChatGPT的对话似乎难以做到这一点。究其原因仍然需回到自然语言问题上。ChatGPT作为大型自然语言对话系统,其涉及的参数和语料库远远超过其他AI项目。谈到透明性,在任何时代,完全的透明性都是不存在的。长期以来,自然界对我们就是不透明的充满奥秘的世界,只是这种不透明在哲学家和诗人眼中是神圣的,而技术的不透明却是有罪的。收音机发明出来后,海德格尔就对那个小黑盒里面发出的声音感到恐惧。因为与风车和水车相比,它是不透明的,我们看不见它如何工作,即使拆开来也是如此。GPT比起收音机来说不知道还要不透明多少倍。甚至开发GPT的OpenAI技术人员也对它的神奇能力感到困惑,更不要说外行人了。在某种意义上,GPT对人类来说就是一个黑箱,所提出的任何问题瞬间都得到回答,且正确率越来越高。这不能不让人感到困惑:它到底是如何做到?如果我们接受海德格尔对“怕”和“畏”的区分,在GPT黑箱面前,我们感到的是畏,即对未知风险的恐惧。

在本体论层面上一个更大问题是GPT的可控性问题。回到《圣经》神话,上帝虽然通过把人驱出伊甸园和搞乱人的语言而对人的僭越进行了惩罚,但它毕竟赋予人以万物之灵的地位。人的思维依赖于大脑神经网络,通过对事物的感知激活大脑中贮存的知识和记忆,通过反思、推理形成自己的判断和观念。在这里,自然语言和符号成为记忆和感知的中介。虽然在波普尔的三个世界理论中,“世界3”即客观知识被认为具有自己的客观实在性。一本书的思想就在那里,不论人是否去读它。一个理论体系也是如此,数学是人创造的,但数被创造出来之后,就必然有奇数和偶数;无论人们是否认识到,不可能有比2小的偶数,正没有比1小的奇数一样。然而,说世界3有自己的生命只能在有限的和隐喻上才有意义。世界3既离不开物理世界1,也离不开心理世界2,离开了前者,它无法对象化,离开了后者它无活被激活。世界3是静止的世界,它不能生成新的内容。GPT则不同,它有自己的记忆,其记忆体即数据库可对电子数据信息一网打尽,它有自己的“大脑”,即神经网络AI程序。以后,通过电子感应器,它可以感知事物,通过机器人,它可以直接做事情。

今天,GPT还依赖于人的发问,但我们完全可以想象一个无人的AI世界。黑格尔《精神现象学》有一个著名命题:“实体即主体”。他把精神视为比人更高的主体,通过自身运动创造世界,通过自我反思认识自己。然而,黑格尔的“绝对精神”与波普尔的“世界3”一样,它们的自主性在某种意义上是还是拟人化的,是把主体的特征赋予给了某个实体性的存在,它们并非是真正的主体。现在的问题是,GPT是实体还是主体?按照通常的理解,GPT无论如何神奇,归根到底它是一个智能系统,是物,是实体。但是,如果GPT不仅具有了人的意识和思维能力,而且在回事迭代进化中获得越来越强的能力,不仅能为人所为,而且能为所不能为,我们还纠缠于它是否有意识、是否是主体之类问题,就失去了意义。

对人类文明来说,GPT或AIGC的真正挑战是:我们是否创造出了一个能够彻底逃逸人的控制的物,无论我们是把它称为人工理智还是超级智能。如果是后者,AIGC将导致人类王位的自我废黜,它的出现将不是上帝的赐福,而不是上帝的诅咒。阿多诺《否定辩证法》开篇曾说:一度似乎过时的哲学,由于错过了它的实现时机而得以保留下来。同样,一度过时的全知全能的理想因没有实现,人类才保存下来。今天面临的悖论是,也许GPT可以实现全知全能,成为“通天塔”,但它的成功会是人类的成功吗?GPT是人类新文明的开端还是人类文明终结的开始?但愿这不是在杞人忧天。

全部专栏