是什么造就了一门成熟的科学?

500

编者的话

科学的成长从来不是一条笔直的时间线,而更像是一场漫长而曲折的冒险。炼金术士的迷雾尚未散尽,我们已经开始讨论基因编辑与人工智能;心理学仍在为“抽象名词”寻找可触摸的实体,而生物学,则不断在显微镜与算法之间重新定义生命的边界。

Slime Mold Time Mold 的这篇文章,就像一场思想实验,也是一次精神上的顽皮挑战。他们用玩味又犀利的笔触,追问一个看似简单却至关重要的问题:什么时候,一门科学才算真正“成熟”?

从瓦特的飞球调速器到《矮人要塞》里呕吐的猫,从 DNA 的突变到心理学的“炼金术阶段”,作者带我们穿行在科学史的隐秘走廊里。他们指出:唯有当我们能够用实体、属性与规律去描述它的对象时,科学才真正拥有了理解世界的语言。

这是一篇关于科学如何变得“有生命”的文章,它将让我们重新审视自己的研究方式与认知模型——当我们谈论“理解”时,我们究竟在理解什么?当我们说“机制”时,我们是否真的能看见那些在暗处运转的齿轮?知识究竟该如何被理解和被创造呢?

——Asimov Press 中国团队

500

图片来源:Ella Watkins-Dulaney

撰文 | Slime Mold Time Mold

翻译 | Rhei0x

审校 | 范阳

扬·巴普蒂斯特·范·赫尔蒙特(Jan Baptist van Helmont,1580–1644)在他那个时代是个非常敏锐的思想者。例如,他创造了“气体”(gas)这个词,其灵感来自希腊语中表示“混沌”的词汇(χᾰ́ος)。不过,他更广为人知的是在 17 世纪初进行的一项关于植物和树木生长的实验。他取了一棵重 5 磅的柳树幼苗,种在 200 磅的土壤中,并精心浇水照料了整整五年。五年后,他将树从土中取出,分别称重,发现树已经重达 169 磅,而干燥后的土壤只减少到了 199 磅 14 盎司。

这个实验强有力地表明,树的重量并不是来自土壤。然而范·赫尔蒙特却得出了错误的结论:他认为这是水元素转化为木材的证据。尽管他对气体的研究颇有建树,但他从未考虑过,大部分的质量可能实际上来自空气中的某些物质。

作为一名炼金术士,范·赫尔蒙特还相信一些奇怪的理论,比如你可以把罗勒叶研碎,夹在两块砖之间,在太阳底下暴晒,就能变成活蝎子。(你大概也不会惊讶地得知,这个实验是无法复现的。)说不定他在当时还算理性——其他炼金术士则声称,罗勒的气味能在你大脑里孵化出蝎子¹,或者如果你用大蒜“快速地”擦拭一块磁铁,或者把磁铁放在钻石旁边,它就会失去磁性。

500

还记得当元素周期表长这个样子的时候吗?

范·赫尔蒙特时代的炼金术,还不是一门成熟的科学。而今天的化学,显然已经是了。在 17 到 18 世纪之间的某个时刻,对物质和材料的研究从一门“不成熟的科学”——一群人戴着奇怪帽子闲逛的游戏,转变为一门“成熟的科学”——一群科学家戴着奇怪帽子认真工作。那么,一门科学究竟是如何走向成熟的?

一个答案是:成熟的科学会讨论机制(a mature science talks about mechanisms)。

这是一个不错的起点,但它常常被误解。人们非常乐意在流程图中,在两个方框之间再画一个方框,然后称之为“机制”。但虽然 A → Z → B 比 A → B 稍微详细一点,它仍然是表面的。与人们有时声称的相反,并不存在这样一种“状态变化”——即当你在流程图里加够多的方框后,就会突然拥有一门真正的科学。

因此,我们需要一种方法,能够超越泛化;从对人们所见事物的分类,转向解释其内部运作方式。“机械论”(mechanistic)这个方向是对的,但我们更倾向于说:当一门科学开始以“实体(entities)”、“属性(properties)”和“规则(rules)”来描述它所研究的那一角宇宙时,它就开始走向成熟。

这个过程是有阶段的。首先,我们必须问:哪些是螺母,哪些是螺栓?我们要识别出这一科学领域所关心的对象或过程,也就是那些隐藏在表面之下、在内部相互作用的微小要素。这些就是实体(entities)。

接着,我们必须问:这些螺母和螺栓之间有何不同?即使在同一类实体中,常常也存在变异。也许有些螺栓比其他的更长,有些螺母是六角形的,有些则是方形的或是翼状的。这些差异就是属性(properties)。

最后,我们要问:有哪些规律描述了系统的动态?也就是说,系统如何对外力作出反应,或随着时间发生变化?这些就是规则(rules)。

500

一脸不悦的扬·巴普蒂斯特·范·赫尔蒙特。

每一门相对成熟的科学,都能对这三类问题给出回答。以化学为例,它已经经历了明确划定自身实体与规则的过程。而其他科学,则仍在这条路上,或者卡在某个环节。我们不妨看看另外两门科学,它们正处于不同的发展阶段:

生物学正在走向成熟,但它的发展极不均衡:有些领域已经完全成熟,而另一些,我们还在摸索那些揭示机制所需的基本概念。

心理学则落后得多。对于“心智实体”(entities of the mind)的探索几乎才刚刚开始,甚至可以说还未真正起步。心理学希望实现的目标包括:预防拖延和成瘾、描述人格维度,以及治疗焦虑和抑郁等疾病。要达成这些目标,这门学科必须建立起机制模型。心理学若要真正理解我们内心发生的事情,必须经历它自己的“从炼金术到化学”的转变。

500

以机制思维来看待一个学科,意味着你要像从零开始构建它那样来看待你所研究的世界片段。就像搭建一个模型铁路展示,你首先得去模型店下单,而这要求你已经对需要哪些零件有了相当清晰的认识。这些零件——无论你是在研究铁路模型、一只甲虫,还是整个宇宙——就是实体,也就是这台机器的内部结构。要理解一件事物,你必须知道它是由什么构成的。

在为模型店准备订单时,你的零件清单不会无限长。一台蒸汽机或一架巨型喷气式飞机,可能包含100、200,或 5000 种不同的零件。即便如此,你知道,这个数字是有限的。这正是以“实体”为单位进行思考所带来的一个奇特却深刻的启示:我们至今不知道宇宙中究竟存在多少种基本粒子,但我们可以确定,这个种类数是有上限的。

这也是机制思维与简单描述之间的分水岭,也是科学区别于工程的地方。你可以用一大箱乐高积木拼出几乎无限多种对象,因此单纯研究乐高拼装本身可以永无止境地进行下去。但那一箱乐高积木里的积木数量是有限的,而且只要不是每块乐高都独一无二,那么“积木类型”的数量就更少。

但光有“实体”的概念,还不足以构建一个模型——每个实体还具备属性。比如,在引擎中你会找到“齿轮”这一类实体。虽然它们都属于同一类部件,但每个齿轮都有不同的属性:半径不同、齿数不同,等等。

有时,实体与属性的关系是固定的。举个例子:每个质子都拥有 160.2176634 zepto 库仑的电荷,这是一个固定值。但即便如此,电荷仍然是“质子”这个实体的一个属性。而有时,同类实体之间则会展现不同的属性。比如,两个硫原子可能拥有不同数量的中子,从而成为不同的同位素。属性,正是我们用来测量实体的维度(Properties are the dimensions along which you can measure an entity)。

最后,我们需要讲到规则(rules)。当两个实体在幽深林地中相遇,会发生什么?规则定义了实体如何根据其属性相互作用。分子按照能量守恒与动量守恒的普适原则发生相互作用。乐高积木的相互作用则受制于砖块与凸点之间的物理结构——除非加入热熔胶(“高能乐高”),否则乐高积木只能以特定方式拼接。

当我们用物理学或化学来研究一颗炮弹时,这两种方法会使用不同的实体来进行描述。对牛顿力学的信徒来说,炮弹本身就是一个实体:它是一个拥有质量、位置与速度的物体,这些属性会随着它与其他实体(比如地球)相互作用而演化,并且遵循特定规律。

而在化学家眼中,这颗炮弹则是由许多微小实体——原子——构成的。每种原子拥有诸如“原子质量”等属性,并且遵循一套不同的相互作用规则。这种视角让我们能够预测:如果这颗炮弹掉进了一桶硫酸(H₂SO₄)里,会发生什么。

这两种范式之间有足够的重叠性,可以将它们看作相容的——比如“质量”在两者中都是一个属性,且概念近似。但这两种范式的实用方向截然不同。如果你想判断这颗炮弹放在暴雨中是否会生锈,那你不会用位置和速度来描述它;同样地,如果你要预测它会落在哪里,那你也不会用原子和化学反应来建模。

所有能正常运作的大系统,都是由遵循某些规则的小组件相互作用而构成的。粗略地说,计算机里发生的一切,都是非常简单的实体(如二进制存储单元和基本布尔逻辑)以极其复杂的方式组合出来的结果。虽然这些组合非常复杂,但所使用的基本实体数量极少,而且本身相对简单。比 0 和 1、NOT、AND、XOR 更基础的东西,恐怕也不多了。

这正是所有系统的工作方式:万物皆由更小、更简单的事物组成,而它们又各自遵循一套特定逻辑。然而出于某种原因,我们往往觉得这一点不合常理——在没有受过机械式思维训练的地方,我们通常会本能地以印象式思维来理解世界。

这就带来了问题:如果没有模型,就容易陷入循环论证。这就是心理学为何会出现诸如“人们更重视近期发生的事件,因为存在近因偏差(recency bias)”这类解释的原因;也是医学为什么会说“你感到疼痛,是因为你患有纤维肌痛症”(Neo-Latin fibro-,希腊语 μυο- 表“肌肉”,άλγος 表“疼痛”)的原因。

但当你理解了那些规则之后,看似混乱的现象就会展现出其底层秩序。实体遵循一定规则,并拥有以逻辑方式运作的属性——这就让我们有可能获得全新的理解路径。这也是为什么,我们最伟大的科学突破,往往出现在我们开始构建模型的时候。

在“印象式研究”(impressionistic research,用简单预测来描述现象)和“机制研究”(mechanical research,以规则和实体为基础进行建模)之间,有着一道明显的分界线。两者都可以发挥作用,但有些问题,仅靠印象式研究是永远解决不了的。

500

大多数电子游戏都是抽象的。但《矮人要塞》(Dwarf Fortress)并非如此。这款游戏的非官方口号是:“失败是种乐趣!”(Losing is fun!)

表面上看,《矮人要塞》是一款管理游戏,你要指挥一群矮人在荒野中建立殖民地。实际上,它更像是一个机械化宇宙的模拟器,混乱又充满生命力,某种程度上和我们现实的世界颇为相似。复杂系统之间产生层层叠叠的涌现故事,但在这个模拟世界中挣扎求生的最终结局几乎总是一样的:灾难性的失败。

在多数电子游戏中,身体伤害是高度抽象的。伤害往往被简化为一个单一的数值:生命值(Hit Points, HP)。而在《矮人要塞》中,受伤的细节非常具体。游戏中设定了五个伤害等级,一个矮人(或者其他生物)可以在从“右下臂”到“胰腺”等各种身体部位受到创伤。

500

这是来自臭名昭著的《矮人要塞》实况系列 Boatmurdered 中一名受伤矮人的例子。可怜的矮人工匠 Kel Zimkelònul 被野生蛇人袭击,如你所见,他浑身是伤。其中,他的右小腿骨折,右手也完全不见了。

尽管细节如此丰富,《矮人要塞》相比现实世界仍然是抽象的。矮人并不是由单个细胞构成的,他们没有 DNA(至少现在还没有),但他们确实有眼睑。然而,正因为这款游戏在电子游戏中属于极少数的“高度机械化”作品,它也成了说明抽象世界与机械世界差异的一个绝佳例子。

《矮人要塞》的系统复杂到,连它的开发者都无法完全预测一个简单改动会带来怎样的后果。所以每当发布一次包含新功能的更新后,开发者往往要花好几个星期来修复成堆的 Bug。在某次更新后,开发者塔恩·亚当斯(Tarn Adams)收到了一条玩家的反馈:“我的酒馆(tavern)里全是猫呕吐物,还有几只猫死了。为什么?这游戏出问题了。”

原来,在那次更新中,亚当斯引入了“酒馆”这个新机制。酒会洒在地板上,猫会溜进酒馆。而由于之前的某段代码允许矮人走动时留下血迹,这些猫的爪子也会沾上酒精。接着,另一段允许猫咪舔干净自己的代码就起作用了,它们会把酒精舔掉。

亚当斯写的那段代码设定为:猫舔自己时会摄入“整剂量”的覆盖物。而在这种情况下,这“整剂量”就相当于一整杯酒。系统接下来运行关于“血液酒精浓度”的计算,这些计算是基于猫这种体型的生物设计的,结果导致猫喝醉、呕吐,甚至有几只因此死去。

在一个抽象的世界里,猫舔爪子上的啤酒是不会死的。这类意外组合根本不会发生,因为抽象世界不够复杂。而这件事之所以可能发生,是因为它发生在一个机械化的世界里——也就是为什么现实世界、还有《矮人要塞》,才会出现这种奇奇怪怪的现象。

这个“呕吐猫漏洞”很好地说明了为什么大多数电子游戏都是抽象的,而不是机械化的。详细的模拟工作量巨大,也不怎么有趣。游戏开发者永远无法考虑到所有可能的交互以及那些二阶、三阶甚至更高阶的效应,所以机械化设计往往会引发各种诡异的边缘案例(bizarre corner cases)。你现在或许也能理解:为什么上帝几千年前就停止了版本更新。再往下修复 Bug,实在是太令人头疼了。

500

光是诉诸“实体”——谈论猫、酒馆和矮人——并称之为“机制”,这还远远不够。拜占庭的斐罗(Philo of Byzantium)在公元前三世纪就尝试过这种做法:他研究燃烧现象,并用“火的原子”(atoms of fire)来解释它的本质。他诉诸的是隐藏的实体;那么,为什么他的炼金术还算不上是一门成熟的科学呢?

原因之一,是他的描述过于模糊,无法构成一个模型。一个模型应当能够预测出具体后果。比如在《矮人要塞》中,只要是有血的生物就可能喝醉;而在这款游戏里,猫是有血的。所以,即使这个结果完全是无意而为,也毫无预见性,《矮人要塞》中的猫就是会喝醉。

醉猫,是这个游戏运行机制下的自然且必然的结果。那么,斐罗所说的“火原子”又能推出什么自然且必然的后果呢?我们猜测是:几乎没有。他看到火,然后推理道:“火肯定是由某种东西构成的。那么它是由什么构成的呢?当然是火的原子!”但你应该也能看出,这种说法和“火是由火精灵、火神、或火焰乐高构成的”之间几乎没什么差别——只不过缺乏更多细节。

你永远可以随意挑选一个名词,说它是某种现象背后的实体,然后声称你发现了某种机制。你看到某种你不理解的行为,可以随手归结为一个新的“脚本”(script);你可以说某些化学反应是由某种“原理”(principle)或“本质”(essence)驱动的。人们之所以爱参加派对,是因为他们体内存在某种叫做“外向性”(extraversion)的隐藏特质。新兵能否成功成为海军陆战队员,是因为他们有或没有所谓的“坚毅力”(grit)。鸦片让人昏睡,是因为它含有“催眠特性”(somniferous property)。

这些说法的明显问题是循环论证。但还有第二个问题是:这种思维方式最终只能让你列出一张永无止境的“清单”。你总是可以往上面继续添加东西。而真正的实体思维,应该迫使你去压缩这个列表。就像一台机器的内部结构,能用到的螺母和螺栓种类是有限的。

正如孙子所说:

五音不全,五色不明,五味不尽。

然而,五音之变,不可胜听也;五色之变,不可胜观也;五味之变,不可胜尝也。

战法不过奇正,奇正之变,不可胜穷也。

化学第一次揭示出:地球上所有自然存在的物质,仅由 94 种元素构成。这是一份有限的清单,后来随着人造元素的发明,总数才增至 118 种。虽然这个数字比古代“四大元素”多很多,但用来解释地球上一切物质(乃至绝大多数可观测的宇宙物质)却显得惊人地少而精。

更令人惊叹的是,这 118 种元素本身,其实只是三种更基本的实体——质子、中子和电子——的不同组合。如此丰富的变化,竟源自如此有限的一组基本构件!如果化学当初始终只执着于描述“磁铁”、“热气”、“空气”等表面现象,那它根本不可能走到这一步。我们之所以最终能找到“元素”,靠的正是去构建模型,去理解表象之下到底发生了什么。

500

早期的生物学家更像是博物学家。他们研究的对象是各种动植物物种,研究方法是描述与分类。但“物种”并不能作为一个好的科学实体——这一点直到今天仍在不断被证明。物种之间并没有客观清晰的边界,因此这些边界经常变化。一门成熟的科学,它不是。

1665 年,罗伯特·胡克(Robert Hooke)用显微镜观察软木切片,发现它是由许多小腔室构成的。他写道:“我们的显微镜告诉我们,软木的物质完全被空气填满,被一个个彼此独立的小盒子或‘细胞’所包裹。”到了 1680 年代,列文虎克(Antonie van Leeuwenhoek)进一步扩展了我们对这个不可见世界的认识——他用自己设计的显微镜,在雨水、马尿和他自己的牙齿上发现了微小的“微生物”(animalcules)。

细胞和微生物的发现,似乎标志着生物学迎来了显而易见的“实体与规则”时刻:它们为“动植物由什么构成”这个问题提供了一个清晰、直接的答案。它们由细胞构成,而这些细胞遵循一套“细胞规则”相互作用。

不过话说回来,也有理由相信这些并不是我们真正寻找的实体与规则。虽然所有生命体都由细胞构成,但细胞本身并不能被清晰地枚举。确实存在不同类型的细胞,但至今我们还无法列出一个有限、明确、客观的列表——这与化学中的元素周期表形成鲜明对比。你可以统计一个生物体的总细胞数(人类大约有 37 万亿个细胞),但细胞的类型是依赖上下文的(context-dependent),其边界模糊,分类也具有可变性——实际上,和“物种”非常相似。

1859 年,随着《物种起源》的出版,查尔斯·达尔文似乎为生物学提供了一套更精确的解释机制:进化论。它的解释力甚至不依赖 DNA。达尔文在世时并不知道 DNA 的存在(DNA 实际上直到 1869 年才被弗里德里希·米歇尔从士兵绷带上的脓液中提取出来),而他也不需要知道。进化论的伟大之处在于它既简单又深刻:任何一种具有变异与自然选择的复制机制,都会随着时间推移积累适应性改变(Any kind of replication with natural selection will lead to the accumulation of adaptations over time)。复制的内容并不重要——无论是基因、代码还是模因(memes)——只要有变异和选择机制,进化就会发生。这不是关于染色体的学说,而是关于选择逻辑本身的学说。

然而问题在于,这种逻辑让“实体与规则”变得不再具体:在这里,“实体”可以是任何拥有变异的生物,而“规则”即便再简单(比如选择的数学模型),却适用于所有生物。如此一来,达尔文式的实体与规则集合就过于庞大,难以构建出生物学内部清晰的结构。

那么,生物学中还有哪些东西是可以被明确枚举的呢?

500

查尔斯·达尔文已知的第一幅草图,展示了他关于进化树的构想。

20 世纪初的孟德尔遗传学为我们提供了另一个候选方向。尽管理解 DNA 并非提出进化论的必要前提,基因及其底层组成部分却是高度机械化的。基因、蛋白质和核苷酸的定义远比“细胞”更清晰、更少歧义。

构成生命的一切,背后只用了 5 种基本核苷碱基:腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)用于 DNA;而在 RNA 中,胸腺嘧啶被尿嘧啶(U)取代。自然界虽然存在 500 多种氨基酸,但只有 22 种 α-氨基酸真正出现在遗传编码中,被整合进蛋白质里。²

我们对癌症机制的最新研究进展正好凸显了基因作为生物学“实体”的有用性。多年来,人们都是根据癌症发生的部位来分类的:乳腺癌、结肠癌、肺癌等等。你或许至今仍习惯说“脑癌”或“胰腺癌”。但随着我们对癌细胞内在机制的认识不断深入,科学家们开始尝试用引发癌症的基因突变(如 BRAF V600)来对癌症重新分类,而非其起源部位。医生现在可能会说:“你患有一种具有某种特定突变的癌症,恰好这个肿瘤出现在你的肺里,”而不是说:“你患了肺癌。”

事实证明,试图从“细胞的哪个部分失灵了?”的角度去理解癌细胞,要比“癌症最初出现在哪个器官?”的角度更有效。并非所有起源于肺的癌细胞都是由于相同机制变异而来的,就像废旧摩托车并不是因为相同原因被丢弃的一样。有些你可以带回家修好,有些则只适合报废。

肿瘤对治疗的反应,通常更多地取决于导致它的基因突变,而不是那些细胞恰好位于身体的哪个部位。因此两个患有“乳腺癌”的病人,可能需要完全不同的治疗方式;而两个肿瘤长在不同部位的病人,反而可能适合同一种疗法。只要你还在关注癌症的表层特征,你就注定会被困惑;而一旦你深入其基因构成,你就能真正理解它的工作方式。

像我们对癌症认识的这种进展,让人感觉生物学确实正在走向成熟。很难想象有哪个例子,比这个更能体现从表象走向结构思维的转变。我们的希望是同样的变革也将出现在其他疾病诊断中。已有迹象表明,目前被统一称为“类风湿关节炎”的疾病(rheumatoid arthritis),实际上可能包含不止一种疾病。更先进的基因检测技术,就像它曾彻底改变癌症诊断一样,或许能让这一点变得清晰。

还有一些其他路径,也可能推动生物学进一步走向真正成熟科学所具备的机械性与预测力。比如:发明更好的工具,或发现不带例外的原理。

想想望远镜的发明吧:在更精密的工具出现之前,天文学的发展只能停留在有限的层面。肉眼观测固然可以,但一旦发明了望远镜,伽利略便能利用三角学来估算月球山脉的高度,并由此开启了天文学作为一门成熟科学的新纪元。

在生物学中,显微镜、荧光 DNA 染料、超声技术等各种能帮助科学家更好地描绘研究对象“螺母与螺栓”(即微观机制)的工具,使我们的理解远远超越了这门学科的“炼金术时代”。基因测序这样的工具,让我们能基于突变而非器官位置来诊断癌症,并且使靶向基因疾病成为可能。几十年来我们一直知道碱基对、RNA 和 DNA 的存在,但由于工具的落后,我们无法充分利用它们。如今,我们需要帮助生物信息学领域的“斯宾诺莎们”磨制出新的镜片。

除了更好的工具之外,生物学也急需更多努力去寻找真正的组织原则与模式。目前的情况是:每条规则都有例外,而这些例外又有更多的例外,望不到尽头。

这种状态有点像当年天文学家还以为地球是宇宙中心的时候。他们手上虽然有一些可用的概念——行星、恒星、彗星——但整个体系是倒过来的,直到日心说模型被采纳,一切才开始变得有条理。生物学如今也需要类似的重组,使其摆脱依赖例外的状态,真正建立起通用的原理。

这件事却极其难做。以分子生物学为例,多年来科学家坚信遗传信息的传递是单向的,即从 DNA 到 RNA 再到蛋白质。按照这种观点,蛋白质是功能产物,DNA 提供主指令,RNA 则是一个临时的工作副本。³ 但越来越多的例外正在挑战这个“规则”,比如一种叫逆转录酶(reverse transcriptase)的酶,它可以用 RNA 模板合成 DNA。

然而,尽管揭示机制与寻找组织原理的努力极为重要,要想将复杂性充分简化,从而将生物学打磨成一门成熟科学,仍然是一项艰难的任务。或许“生物学”这个领域本身就太庞大了,以至于不能指望领域内的所有问题都能用一套工具解决。对于某些问题,比如传染病,从“细胞”的角度思考非常有帮助;而对于另一些问题,比如基因疗法,聚焦于核苷酸与氨基酸才更有前景;至于再一些问题,从“进化”的宏观视角出发——几乎是一种纯粹的信息论的思维方式——可能才是最合适的。至于选择单位是以什么形式编码的?那根本就不重要。

500

比起生物学,心理学更像是仍处于“炼金术阶段”的学科。当代心理学几乎完全是印象主义式的(impressionistic)——我们对其中的机制一无所知,没人能指出那种类似“蓝图”或“构件”的东西。心理学家确实擅长给事物命名,但这些名称往往只是抽象名词;它们最多只能记录某种效应和现象,而无法解释背后的因果。正如我们的一位朋友亚当曾说过的:

这种做法的问题在于,它让你陷入那些实际上并不存在的东西里。比如说,“生活热情”(zest for life)到底是什么?它的字面意义就是——“你在《生活热情量表》上的反应”。那么,《生活热情量表》又在测量什么呢?它测量的……正是“生活热情”本身。如果你对任何心理学中的抽象概念追问得足够深入,你最终都会发现一个自我循环的同义反复。

我们确实可以观察到一些有趣的现象。例如,将信息进行“分块”(chunking)会让记忆变得更容易——这在日常生活中随处可见,比如电话号码。想想看,哪个更容易记住:348-428-2328 还是 3484282328?

同样地,我们也注意到,当海马体受损时,人们可能会在几分钟内忘记新经历,但仍然可以记得旧记忆。基于这些观察,我们可以合理推测,大脑中可能存在“短期记忆”和“长期记忆”这两种功能分类。但观察这些现象和真正理解记忆是如何被储存的,是两回事。

再比如,当你让人们根据一长串形容词来为自己(或他人)打分,然后用因子分析处理这些数据,往往会出现一个五因子解(five-factor solution)。把这五个因子命名为责任心、外向性、宜人性、神经质、开放性,并称之为“大五人格”(the Big Five),听起来也确实合理。

但这远远不能等同于知道为什么有些人更随和,而有些人则更难相处。在心智中,一定存在某种“旋钮”“开关”或“参数”,决定了这种我们称之为“宜人性”(agreeableness)的表层差异。但我们并不知道这个实体是什么,也没有任何可靠的理论来解释它。而且,这个东西可能并不是一个真正的旋钮或开关,而是某种实体或实体属性上的差异——等我们搞清楚这些“实体”究竟是什么之后,才能明白它们的作用。

要让心理学从“炼金术”迈向“化学”,成为一门成熟的科学,它必须找出一整套可用来描述与建模的规则(rules)与实体(entities)。只有这样,心理学家才可以建立起物理模型,并进行机械式的实验研究。

说“为心理学找到它的‘元素周期表’”这类话,听上去可能有点陈词滥调,甚至显得天真。但说到底,心智是由某些东西构成的。也许这些构成元素有大约 118 种,就像化学元素一样;也许它可以被归约到仅仅三种基本要素,像我们当初发现原子物理那样令人震惊;又或许,它永远无法被化简到少于一万种“配料”。我们尚无定论,但我们脑中的这锅“思维大杂烩”,肯定是由某组可识别的成分构成的。那我们当然有理由问一句:这锅里到底煮的是什么?

目前已有一些试图为心理学制定“实体与规则”框架的方案——从荒诞滑稽的到机制上可行的,不一而足。

我们先从最荒诞的例子说起——第一个例子是《模拟人生》(The Sims)。可能有读者会质疑:《模拟人生》怎么能算是科学模型?你可以怎么称呼它都行,但《模拟人生》及其后继作品确实是在模拟人类行为的模型,这就使它们成为心理学模型,无论你是否愿意承认。其他那些试图模拟真实大脑输入与输出的电子游戏,也同样如此。

在游戏中,模拟市民(Sims)会自己吃饭、洗澡、娱乐,如果你观察它们一段时间,甚至会忘记它们其实是虚拟的。当然,它们缺少很多东西,比如人类的语言能力——因为在创世之初,开发者 Will Wright 就诅咒他们只能说“模拟语”(Simlish)——但它们仍提供了一个相当不错的人类行为仿真模型。

第一个检验标准是,这个模型是否至少能粗略模仿它的目标对象。但比模仿更高级的,是替代(replacement):任何能够真正完成人类心理任务的系统,本身就具备强大的说服力,能够成为一种心理模型。

当然,《模拟人生》无法替代人类心理劳动(mental labor),因此我们来看一个不那么荒诞的例子:计算机。数字计算机是一个有趣的“错误起点”(false start)。从最早的计算器开始,它们就已经能替代人类完成某些心理任务,甚至在某些任务上比人类高效得多:你可以试一下,3482 × 9192 等于多少?

理论上,数字计算机可以运行任何算法,因此我们的思维如果是由某种算法驱动的,那么原则上也能在计算机上运行。但问题是,绝大多数计算机程序并不像人类那样行为,也不像任何其他动物。ELIZA 这个早期的聊天程序通过模式匹配骗过了不少人,但总的来说,它的行为和人类完全不同。

说到这里,许多人可能已经忍不住在屏幕前喊出:那深度学习和人工神经网络呢?这正是我们要讨论的下一个方案。看看今天深度学习与大型语言模型能做到的事情,你很难不注意到它们与人类和动物行为之间的某种诡异相似性。图像识别模型可以识别鸟类和停车标志,准确度与人类差不多;像 ChatGPT 这样的大型语言模型,阅读和写作的能力也堪比普通人;自动驾驶汽车的驾驶能力甚至超过了许多司机……等等。

这一传统下的模型可以归结为几个基本构件:神经元与连接(neurons and connections),加上诸如反向传播(backpropagation)等简单规则。虽然它们的整体架构可能很复杂,但底层机制却非常朴素。它们看起来很有潜力,能够成为具备属性和规则的实体候选。

不过,也有理由谨慎对待将神经网络当作人脑的直接模型。尽管这些系统打着“神经”的旗号,它们与真实神经元的相似程度其实非常有限。在一些领域,神经网络的发展也已经停滞。它们在 2019 年之前对《星际争霸 II》(StarCraft 2)的表现已经非常出色,但到今天依然无法超越最顶尖的人类选手。

更深层次的问题在于:神经网络是一种强大的函数逼近工具。它们能模拟人类行为的外在表现,但这并不意味着人类的实现方式也一样。神经网络可以拟合广泛的函数,但这并不说明大脑内部采用了类似的机制。

早期的蒸汽机脾气古怪、耗费人力,常常会在没有预警的情况下加速或减速。要保持它们的稳定运行,需要持续的人力监控。操作员必须手动调节阀门、监控压力,并用手稳定发动机。若疏于操作,发动机可能会迟缓、熄火,甚至在极端情况下发生爆炸。

这一切因飞球调速器(flyball governor)的发明而改变。这是一种由詹姆斯·瓦特(James Watt)在 18 世纪末引入的巧妙机械装置:通过两个随发动机转速升降的旋转金属球,自动调节蒸汽流量,从而在无需人工干预的情况下稳定发动机速度。这是工业史上最早的自动控制系统之一,也标志着一个转折点:工程师终于可以坐着看报纸了,而机器则能自行完成关键调整。

控制系统越来越多地取代了人类的判断与注意力。过去,要在冬天保持大房子温暖、夏天保持凉爽,需要一整个仆人团队来管理。现在,这些任务由一个简单的反馈回路——恒温器——就能完成。温室里的湿度曾经需要手动调节,而现在至少部分实现了自动化。开车时,你曾经必须自己控制车速!如今,你可以让巡航控制系统替你完成。

负反馈回路,也被称为“控制系统”或“调节器”(governors),就像瓦特的飞球调速器一样,已经在不断取代人类的心理任务。当它们被层层组织起来时,即使是最简单的控制系统,也能展现出类似生物智能的行为,比如我们在“The Senster”这类机器人中所见。它们能代替我们的功能、表现令人信服且高效,这意味着它们有潜力成为心理学的一部分模型 ⁴。

不要听信那些说“心理学永远只能模糊不清”的唱衰者。在心理学中,存在一些根本性的问题。

我们经历事件,并将部分经历以某种形式存储为记忆。因此,“记忆是如何运作的?”就是一个根本性问题。这些记忆以某种方式、某种格式被储存着,终有一天,有人会揭示它的原理。

我们渴望保暖、渴望摄入盐分,出于难以理解的原因,许多人会连续数小时沉迷于玩《糖果传奇》(Candy Crush Saga)。这些行为背后总有原因——即便不是一个好理由。这些驱动力似乎是彼此独立的,因此它们应该有一个清单。“到底有多少种驱动力?”似乎是一个根本性的问题。

如果你把这些“驱动力”看作控制系统,那么就会引出更多问题:我们渴望摄盐,那到底是什么信号被调节?“盐分调节器”(salt governor)的设定点是什么?安全感、地位、温暖,这些驱动力的“设定点”又是多少?像“业余隧道挖掘”(hobby tunneling)这种行为背后,又是哪些调节机制在发挥作用?

当我们观察心理学中的某个部分——一种行为、一句言语、或是对路怒的倾向——我们必须能够用某种东西来解释我们所看到的现象。在表象之下一定有什么东西在运作,有某种“齿轮”在转动——当只不过它们并不是真正的齿轮,而且目前没人知道它们到底是什么。

生物学也是同样的道理。生命由微小的机器组成,而在这里,我们对它们有一定的了解。DNA 是编码,RNA 是信息,线粒体是细胞的能量工厂。我们已经远离了“拿蒜头猛擦磁铁”的时代。那条探索之路经历了荒诞但略带机械感的问题,比如“水能变成木头吗?”,最终引向了更有意义的问题,比如:“当一棵树的重量增加时,它一定是通过向自身形态添加新的物质来增加质量。如果新增的质量不是来自土壤,那它必然来自其他地方。这些新的原子从哪里来的?”

必须有人去提出这些问题,并以一种可以被解答的方式来表述它们。而当他们提出这些问题时,接下来就是我们所有人的责任:努力寻找答案。

注释

1. “罗勒(Basil)有一种能滋生蝎子的特性,其气味能让蝎子在人的脑中生长,Hollerius 对此进行了深入研究。他曾在一个非常喜爱这种香味的人脑中发现了这种昆虫。”——托马斯·布朗爵士,《常见谬误》(Pseudodoxia Epidemica)。无论如何,下次吃香蒜酱的时候小心点。

2. 其他 478 种以上的氨基酸被认为是“非正典”,基本上是同人版的氨基酸,所以我们假设它们主要存在于上帝的“花絮设定”(God’s omake)中。

3. 中心法则(Central Dogma)——由弗朗西斯·克里克最初提出——从未被打破。克里克所说的只是:“一旦信息进入蛋白质,它就无法再出来。”他从未说过 RNA 无法被逆转成 DNA,那只是许多生物学家当时错误持有的信念。

4. 这个观点很早就有人提出了,但依然被低估了,这也是我们写了一个系列文章更详细阐述它的原因。

500

Slime Mold Time Mold 是一个由“疯狂科学”精神驱动的集体意识体(a mad science hive mind),活跃于网络博客世界。他们可能正在早餐时做华夫饼,也可能是在溪流中嬉戏的两个孩子。你可以在 slimemoldtimemold.com 阅读他们的博客,并或在 X(原 Twitter)上关注他们:@mold_time。

引用:Slime Mold Time Mold. “What Makes a Mature Science.” Asimov Press (2025). https://doi.org/10.62211/26jw-08ok

英文原文链接:https://press.asimov.com/articles/mature-science

本文经授权转载自微信公众号“ASIMOV PRESS”。

注:本文封面图片来自版权图库,转载使用可能引发版权纠纷。

500

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。

站务

全部专栏