《普遍进化论》之一:我们感知的世界,是真实的吗?从柏拉图洞穴到AI时代的认知革命

摘要:宇宙万物每时每刻都处在变化之中,所有的变化都是某种形式的进化。或是基本进化,或是复合进化。即使像智能和创新这样的复杂行为也能用复合进化的原理来解释,因此,我们把这一系列现象称为普遍进化,把描述和解释这些现象的理论称为普遍进化论(Theory of Universal Evolution,TUE)。

《普遍进化论》包括7个理论模块,分别为:表征与表达、知识与实体、全谱知识理论、基本进化、复合进化、智能本源和全谱创新。我们将陆续推出多篇文章进行系统介绍,本文是第一篇。

引言

你有没有认真想过——你所看到的世界,真的真实吗?

这个问题听起来有点玄,像是科幻电影《黑客帝国》里的经典桥段。但今天,我想告诉你,这不仅是一个深刻的哲学问题,更是一个可以被现代科学层层剖析的认知难题。

两千多年前,柏拉图用一个著名的“洞穴隐喻”困扰了西方世界:一群囚徒自小生活在洞穴里,背对洞口,只能看到身后火光投射在墙壁上的影子,便以为影子就是世界的全部。

这个故事的恐怖之处在于,它暗示我们可能就是那些“洞穴里的人”。

今天,我们将从一个简单的向日葵故事开始,结合认知科学、生物学和人工智能的知识,为你揭示这个世界的“底层代码”。读完这篇文章,你可能会发现,你不仅是“洞穴里的人”,同时也是那个走出洞穴,并亲手创造新世界的“造物主”。

我们将围绕两个核心概念展开:表征(Representation)与表达(Expression)。它们是构建我们理论大厦的基石,也是理解从生命起源到AIGC(人工智能生成内容)所有创造行为的万能钥匙。

一:世界是一个“表征”系统——你的大脑正在为你播放一部“超高清电影”

让我们从一个场景开始。

春天,你在花园里种下一粒向日葵种子。两个月后,它开花了。阳光下,金黄色的花盘格外耀眼。你拿出手机拍了张照,又用彩泥捏了一个模型,甚至扫描进电脑,用3D打印机做了个一模一样的塑料向日葵。

现在,我们来解构这个过程中最关键的一步:你,是如何“看到”向日葵的?

向日葵自身不发光,是太阳光照射到它表面后,一部分被吸收,一部分被反射。极少数反射光子穿过你的瞳孔,在视网膜上聚焦成像。视网膜上的感光细胞像一台精密的传感器,立刻将光信号转化为神经电信号。这串电信号沿着视觉神经通路,经过大脑层层加工,最终抵达视觉皮层。此时,你才“感觉”到自己看到了向日葵。

请注意这个链条:

向日葵 → 反射光 → 神经信号 → 大脑中的“向日葵”影像

你真正“看到”的,既不是向日葵实体,也不是反射光,而是那串抵达大脑皮层的神经信号。认知心理学家将这个大脑中的“影像”称为向日葵的“表征”,意为“替身”或“替代物”。

这完美印证了柏拉图的洞穴隐喻。我们看到的并非事物的“原型”,而是它们在大脑这个“洞穴墙壁”上的“投影”。不仅是视觉,你的听觉、嗅觉、味觉、触觉,无一例外,都是外部物理刺激(声波、化学分子、压力)被感觉器官转换成统一规格的神经信号后,在大脑中形成的表征。

所以,认知心理学界有一个共识:

“个体所觉察的每一件事物,都是其在大脑中的表征。”

至此,我们可以给“表征”下一个正式的定义:

表征是指一种或一类事物通过特定的物理机制来关联、映射或表示另一种或另一类事物的过程。前者称为表征结果,后者称为表征原型。

这个概念的范畴极其广阔:

地图是空间位置的表征。

乐谱是音乐旋律的表征。

钟表和日历是时间的表征。

货币是价值的表征,而银行账户里的数字又是货币的表征。

科学家发明的概念,如“温度”

是分子平均动能的表征,“质量”是物体惯性的表征。

【前沿案例:脑机接口(BCI)——读取思维的密码】

近年来大热的脑机接口技术,正是“世界是表征”的铁证。埃隆·马斯克的Neuralink等公司,试图通过植入电极来“读取”大脑中的神经信号。当一个瘫痪病人想象移动手臂时,BCI设备可以捕捉到与该意图相关的特定神经放电模式(一种表征),并将其解码,命令机械臂移动。这说明,思维和意图在大脑中是以一种可被破译的“代码”形式存在的。

二:表征的两张面孔——“模仿秀”与“秘密暗号”

表征的形式五花八门,但根据表征结果与原型的关系,我们可以将其分为两大类:

模拟表征和符号表征。

1. 模拟表征(Analog Representation):宇宙级的模仿秀

模拟表征的核心是“相似性”19。表征结果在结构、属性或观感上模仿了表征原型。

你为向日葵画的素描、拍的照片、捏的泥塑,都是模拟表征,因为它们在视觉上与真实的向日葵相似。

老式黑胶唱片上凹凸不平的沟回,其物理形状模拟了声波的振动,因此也是模拟表征。

最早的象形文字,如甲骨文中的“山”、“月”,是通过描摹事物的轮廓创造的,属于模拟表征。

模拟表征直观、易懂,但其局限性也很明显:它能表征的东西有限,且难以进行复杂的逻辑运算。

2. 符号表征(Symbolic Representation):文明的基石与秘密暗号

符号表征则完全不同,它的关键是 “约定俗成”。符号本身与它所代表的事物之间无需任何物理相似性。

正如语言学家史迪芬·平克所言:“狗这个字不一定要看起来像狗、走起来像狗或吠起来像狗,但是它代表狗的能力不会因此而减低。”

汉字“向日葵”或英文“sunflower”,在字形上与植物本身毫无关系,但任何一个懂中文或英文的人都能理解其含义。这种关联是文化和学习赋予的。

符号表征又可细分为两种:

(一) 映射表征(Mapping Representation):简单的一对一

也叫单符表征,指一个独立的符号对应一个或多个固定的意义。这种系统简单直接,但能承载的信息量不大。

动物语言: 蜜蜂用不同的舞蹈(如圆圈舞和摆尾舞)来精确表征蜜源的距离和方向,是一种典型的映射表征。蚂蚁通过释放不同的信息素来传递“危险”、“有食物”等信号。

婴儿学语: 婴儿最初学习的“妈妈”、“要”、“车车”等单词句,就是一个词代表一个完整的意思,也是映射表征。

(二) 编码表征(Coding Representation):创造无限的有限游戏

这是最高级、最强大的表征方式。它用

有限的基本符号,按照特定的规则进行组合,从而生成无限的表征结果。

一个编码表征系统必须具备三要素:

基本符号(元素)、组合规则(语法)和意义对应表(字典)。

生命编码(DNA): 地球上最古老的编码系统。仅仅用A、T、C、G四种碱基作为基本符号,通过三个一组(密码子)的规则,编码了构成所有蛋白质的20多种氨基酸,进而表征了从病毒到人类的亿万种生命形态。

人类编码(语言和文字): 以几十个音素为基本符号,组合成音节、词语、句子,便可表达无穷无尽的思想。文字系统(无论是字母还是偏旁部首)则是对语言的再编码,让人类知识得以跨越时空传承。

机器编码(二进制): 这是最简洁的编码系统,基本符号只有0和1。通过ASCⅡ码或Unicode这样的“映射表”,0和1的组合可以表征世界上所有的文字、符号、图像和声音,构建了整个数字世界。

【前沿案例:大语言模型(LLM)——符号表征的巅峰之作】

ChatGPT、Claude等大语言模型,正是编码表征威力的极致体现。它们被投喂了几乎全部的人类互联网文本数据,通过深度学习,掌握了语言符号(Token)之间极其复杂的统计规律(一种隐性的“语法”和“字典”)。它们并不真正“理解”世界,但通过对庞大符号系统的精通,它们能够生成以假乱真的文本、代码和对话。LLM的本质,就是一个前所未有的、强大的符号表征处理引擎。

三:表达——从“代码”到“现实”的创世过程

如果我们把“表征”看作是从具体到抽象的“编码”过程,那么,是否存在一个反向的过程?

当然有,那就是“表达”(Expression)。

回到我们的向日葵。一粒小小的种子,吸收阳光雨露,最终长成一株结构复杂、生机勃勃的植物。在生物学中,这个从基因组到生物体的过程,被称为“基因表达”。

这个过程给了我们深刻的启发。如果说基因(一维线性序列)能“表达”为一株植物(三维实体),那么,人类世界中的许多创造活动,本质上也是“表达”。因此,我们扩展其定义:

表达是指通过某种特定的物理机制,一类事物以较低维度的结构组成来影响、关联或控制另一类事物的较高维度结构组成或状态属性的过程。前者称为表达原型,后者称为表达结果。

“表征”是降维和抽象,而“表达”则是升维和物化。

自然的表达: 基因组(表达原型)表达为生物体(表达结果)。

人类的表达:

远古祖先头脑中的想法(原型)表达为石斧(结果)。

建筑师的设计图纸(原型)表达为摩天大楼(结果)。

厨师手中的菜谱(原型)表达为一桌美味佳肴(结果)。

音乐家手中的乐谱(原型)表达为一场交响乐(结果)。

【前沿案例:AIGC与3D/4D打印——信息时代的“表达”魔法】

信息时代的“表达”工具正变得空前强大。

AIGC(人工智能生成内容): 你向Midjourney或Sora输入一段文字描述(低维度的符号表征),AI就能“表达”出一幅高清图像或一段视频(高维度的模拟表征)。这是典型的从符号到模拟的表达过程。

3D/4D打印: 计算机中的数字模型(低维度的表征),通过3D打印机逐层堆积材料,被“表达”为一个三维物理实体。而4D打印更进一步,打印出的物体还能在特定刺激下(如温度、湿度)自行改变形状,在三维空间的基础上增加了时间维度,是更高维度的“表达”。

四:表征与表达的宇宙之舞——创造世界的无限循环

现在,我们把这两个概念放在一起,会看到一幅奇妙的图景。

表征与表达,如同一枚硬币的两面,在世间万物的演化中交替出现,互为因果,构成了一个创造的无限循环。

让我们再次审视向日葵的故事,并用“表征-表达”循环来重新解读它:

1.表达1: 向日葵基因(低维表征) -> 表达 -> 向日葵花朵(高维实体)。

2.表征1: 向日葵花朵(高维实体) -> 表征 -> 大脑中的视觉表象(低维神经信号)。

3.表达2: 大脑中的视觉表象(低维表征) -> 表达 -> 手工制作的泥塑(高维实体)。

4.表征2: 泥塑(高维实体) -> 表征 -> 电脑中的数字模型(低维数据)。

5.表达3: 数字模型(低维表征) -> 表达 -> 3D打印模型(高维实体)。

看,这个链条可以无限延伸下去。每一次“表达”的结果,都可能成为下一次“表征”的原型;而每一次“表征”的结果,又可以作为下一次“表达”的原型。

我们感知世界,是在进行“表征”;我们改造世界,是在进行“表达”。人类文明的全部成果——从工具、建筑到艺术、科学,乃至整个社会体系,都可以看作是这个“表征-表达”循环不断迭代、升级的产物。

结论:回到最初的问题——我们是“缸中之脑”,还是“世界的主人”?

现在,我们可以回答开篇的那个问题了:我们感知的世界是“真实”的吗?

答案是,

它既真实,又不真实。

说它不真实,是因为我们永远无法直接触及“物自体”(康德哲学概念),我们所感知到的一切,都只是经过我们生理和认知系统“转码”后的表征结果。你看到红色,只是特定波长的光子激发了你的视锥细胞后产生的神经信号模式,一只蜜蜂看到的可能是紫外线图案。

说它真实,是因为这个表征系统并非凭空捏造。它与外部物理世界存在着稳定而可靠的对应关系。正是这种可靠性,才让我们能够通过“表达”与外部世界互动,并成功地生存、繁衍和创造。如果你对“悬崖”的表征出现错误,后果将是致命的。

“表征”与“表达”这两个看似简单的概念,为我们提供了一个统一的框架,去理解从生命演化到人类文明,再到人工智能的宏大叙事。它们是“普遍进化论”这座理论大厦的最底层基石。

我们或许永远都是“洞穴里的囚徒”,无法看到世界的终极真相。但与其他生物不同,人类不仅能意识到自己看到的只是“影子”,还学会了分析、解码这些“影子”(科学与表征),并反过来创造出新的、更复杂的“影子”和实体(技术与表达)。

在AIGC和元宇宙的时代,我们正在以前所未有的速度和规模,构建全新的表征与表达系统。我们创造的数字世界,本身就是一个巨大的“表征”集合体。这既带来了巨大的机遇,也引发了新的“柏拉图式”的困惑:当虚拟的表征变得与物理现实一样“真实”时,我们又该如何定义“真实”?

站务

全部专栏