现代概率论之父:柯尔莫哥洛夫的“随机”人生

500

柯尔莫哥洛夫,20世纪最伟大的数学家之一。在此前推送过的文章《概率论和统计学中的巨匠——数学与水晶球(下)》中简略地提到,让概率论成为现代数学中一部分的,除了早期欧洲的一些数学“大神”的铺垫工作外,正是柯尔莫哥洛夫把概率论建立了公理化的基础上。这项工作让他有了“概率论中的欧几里得”的美誉。在学术上,这位天才数学家的研究几乎涉及数学中的所有领域,还在经典力学、弹道计算、结晶学、湍流等诸多领域有所建树。他还是一位教育家,不仅带出过一大批优秀的数学家,还投身基础教育,创办学校。

作为现代概率论的创始人,他的一生颇有“随机”的意味,想了解他的一生以及学术成就,并非一言两语几篇文章所能道尽。本文仅取其中一个侧面,在学术生涯起步时,在政治风波下,以及对艺术的研究中,了解这位伟大的数学家。

撰文 | Slava Gerovitch(麻省理工学院数学系讲师)

编译 | Leo

踏入数学世界

如果两个统计学家在森林里迷了路,那他们首先要做的事情就是把自己灌醉,这样两个到处乱晃的醉汉或许能彼此相遇。但如果他们是要想背起竹筐采蘑菇,那还是少喝两杯为好,毕竟毫无目的的随机走动会让他们回到已经采摘过的地点。

这件事情在统计学中,被称之为随机游走(random walk)或者说是醉汉漫步(drunkard's walk),这一模型表示,系统的未来状态仅取决于当前的状态,而与过去无关。时至今日,这一模型已经广泛地应用于股价建模、分子扩散、神经活动和种群动力学等过程,也可以用来解释遗传学中的“基因漂变”是如何导致某一基因(比如眼睛颜色)在人群中普遍存在的。

颇具讽刺意味的是,该理论模型不在乎过去、不在乎历史,但它本身却可谓是历史悠久。它是苏联数学家安德烈·柯尔莫哥洛夫(Andrei Kolmogorov,1903-1987)众多理论成就之一。这位奇才异能的数学家涉猎极广,他在平衡政治生活与学术生活的同时,也改变了“不可能”在数学中的地位。

500

柯尔莫哥洛夫(Андре́й Никола́евич Колмого́ров,1903.4.25-1987.10.20)丨图源:yarwiki.ru

后俄国革命时代的莫斯科文化思想活跃,当时氛围中充满着实验性文学、前卫的艺术与激进的新科学思想。年轻的柯尔莫哥洛夫也受此影响。在 20 世纪 20 年代初,柯尔莫哥洛夫还只是一名历史系的学生,那时他在莫斯科大学提交了一篇论文,对中世纪俄罗斯人的生活进行了非常规的统计分析。他发现,政府对村庄的课税往往是整数,而分到每家户人家时就成为了分数。因此,他认为在当时税收政策是按村缴纳再摊派到户,并不是按户纳税再由村庄收齐上缴。“孤证不立”,历史教授对他的发现给出了极为严厉的批评,“一个证据是不够的,你至少要找到五个例证。”

这也就不奇怪为何柯尔莫哥洛夫会投身数学——数学定理只证明一次就够了。

500

青年时代的柯尔莫哥洛夫丨图源:yarwiki.ru

学术理论背后的政治现实

柯尔莫哥洛夫转向概率论领域也同样源于一次偶然。当时,概率论这一数学分支的声誉并不太好,因为过去的人们总是把概率视为神灵意志的体现。在古埃及和古典希腊,人们就认为掷骰子是一种可靠的占卜和算命的方法。到了19世纪初期,欧洲数学家已掌握了一些正确计算概率的方法,并将概率定义为目标事件数与所有等可能事件数的比值。但其缺陷在于,概率是根据等可能的事件来定义的,因此只适用于元素有限的系统。面对无穷大的系统时,比如有无数个面的骰子,或者一个连续的球面,当时的概率论就显得捉襟见肘了。

然而,柯尔莫哥洛夫是珍惜声誉与名望的。换专业后,柯尔莫哥洛夫最先被莫斯科大学里的一个数学圈子所吸引。他们的领导者是一位魅力非凡的老师,尼古拉·卢津(Nikolai Luzin,1883-1950)。卢津的弟子们给这个组织起了个绰号叫卢津塔尼亚(Luzitania)——把卢津的名字和一战中被击沉的著名英国远洋邮轮卢西塔尼亚号(RMS Lusitania)连在了一起。如柯尔莫哥洛夫所说,他们是通过“共同的心跳”凝聚在一起。他们常在课后一起批判数学创新。在他们的口中,偏微分方程(partial differential equations)成了“偏不尊重方程”(partial irreverential equations),有限差分(finite differences)成了“美梦差分”(fine night differences)。那时,概率论因其理论根基不牢又悖论丛生,在他们口中就变成了“不幸论”(theory of misfortune)。

500

尼古拉·卢津 (Николай Николаевич Лузин,1883.12.9-1950.1.28),描述集合论的创始人之一,在三角级数、复分析、微分方程和数值计算等领域有杰出贡献。丨图源:ru.wikipedia.org

受卢津塔尼亚的影响,柯尔莫哥洛夫对概率论的态度也发生了转变。20 世纪 30 年代斯大林主义的恐怖活动爆发,秘密警察会在半夜敲响每个人的房门,毫无规律的随机性似乎统治了人们的生活。在恐惧的威慑下,很多人为了自保而告发他人。数学圈中的布尔什维克党活动人士里就有卢津的学生。他们以卢津在国外发表自己的研究论文为由,指控其政治上不忠诚并对其进行批判。柯尔莫哥洛夫也在国外发表过文章,出于对自己学术生涯的担心,他对政治问题表现出了明显的妥协。当莫斯科大学数学研究所所长因支持宗教而被监禁时,他接任了这一职位。此时,柯尔莫哥洛夫也加入了批判卢津的人群。卢津收到了来自苏联科学院的审判,失去了所有的职务,但他却逃脱了来自政府当局的逮捕和枪决。

与卢西塔尼亚号一样,卢津塔尼亚也被击沉了。不一样的是,卢津塔尼亚是被自己的船员击沉的。

“不可能”的大圆

且不谈柯尔莫哥洛夫的道德问题,他确实“赢了”,保住了自己的研究工作。而与他在政治上的顺从所不同的是,柯尔莫哥洛夫的研究思想却是比较激进的,他将概率论做了根本性的修正。他所使用的是一种由法国传入的名为测度论(Measure theory)的东西,当时算得上是时髦理论。测度论将长度、面积、体积等概念泛化,使得无法被常规方法测量的数学对象可能被测量。例如,一个有无限多个孔的正方形,被切割成了无穷多份并散落在了无限的平面中,借助测度论我们仍然可以表示出这个七零八碎的物体的“面积”(测度)。

柯尔莫哥洛夫在概率和测量之间进行了类比,得出了五个公理,现在通常表述为六个,他的工作使概率论真正成为数学分析中的一部分。他的理论中最基本概念是“基本事件(fundamental event)”,即单一实验的结果,例如掷硬币。所有基本事件构成了一个 “样本空间(sample space)”,即所有可能结果的集合。举个例子,假如某个区域常会出现闪电,样本空间就包括该区域所有可能发生闪电的位置 。一个随机事件被定义为样本空间中的一个“可测集(measurable set)”,而随机事件的概率则是可测集的“测度(measure)”。例如,闪电击中某位置的概率只取决于这个位置的面积(“测度”)。两个同时发生的事件可以用它们的测度的交集来表示;条件概率可以看成测度的相除;两个互不相容的事件其一发生的概率则用测度的加法来表示(也就是说,A或B被闪电击中的概率等于它们面积之和)。

大圆悖论(The Paradox of the Great Circle)就是通过柯尔莫哥洛夫的概率论得以解决的。大圆悖论是说,假设有外星人会随机降落到一个完美的球形星球上,且降落到每个点的概率也都是平均的,这是否意味着所有球体的大圆(great circle,即过球心的平面和球面的交线,把球体分成了两个相等的半球)上的降落概率都是一样的呢?其结果是,对于赤道所在的大圆而言,圆上每个点的概率是均等的。而对于经线来说,靠近赤道的点概率大,靠近两极的点概率小。这一发现或许可以用越靠近赤道纬度圈越大来解释。但是,这种结果与我们的直觉相违背,因为对于一个完美的球体而言,通过旋转,赤道可以变成任意一条经线。柯尔莫哥洛夫认为,大圆是一条线段,面积是零,因此测度为零。这一悖论的矛盾之处就在于我们无法严格计算相关的概率。

500

“大圆”,定义并不严格丨图源:en.wikipedia.org

500

大圈悖论在概率论中称为Borel-Kolmogorov 悖论,随机变量在以经线和纬线两种条件下的分布下得到了不同结果,实际上是测度为0的条件概率问题。丨图源:Yarin Gal

在零测度的条件概率世界中短暂的逃避了“大清洗”后,柯尔莫哥洛夫仍然要为现实世界的问题所困扰。二战时期,苏联当局要求柯尔莫哥洛夫研究提高炮火效率的方法。柯尔莫哥洛夫发现,在某些情形下,与其提高每一颗炮弹的命中率,还不如对小幅度偏离目标的范围进行连续猛击。这一策略被称之为是“人工散布(artificial dispersion)”。在柯尔莫哥洛夫主持下的莫斯科大学概率系也计算了低空、低速轰炸的弹道表。为表彰柯尔莫哥洛夫在二战时期的贡献,苏联政府于1944年和1945年授予了他两枚列宁勋章。二战后,他担任了热核武器计划的数学顾问。

洞察艺术世界的概率视角

出于专业兴趣,柯尔莫哥洛夫实际上对哲学更加有所偏爱。数学出身的他相信,这个由随机决定的世界却有序运行,其背后也有概率论的规律可循。他常常思考那些“不可能”的事情在人类生活中的影响。

1929年,在一次独木舟旅行中,柯尔莫哥洛夫与数学家帕维尔·亚历山德罗夫(Pavel Alexandrov,1896-1982)相遇,从此二人也成为了终生的好友。在一封长信中,亚历山德罗夫坦率地指责柯尔莫哥洛夫喜欢在火车上与人攀谈,并暗示这种交际太肤浅,并不能真实地了解一个人。而柯尔莫哥洛夫表示了反对,他以一种激进的概率论视角来看待社会交际。在这样的交际互动中,交际的对象是更大群体的统计样本。“人会从环境中领悟真谛,并将养成的生活方式与世界观带给周围任何的人,不只是特定的朋友。”柯尔莫哥洛夫在回信中说。

对柯尔莫哥洛夫来说,音乐和文学也非常重要,他相信自己可以从概率的视角去洞察人类心灵的运作方式。他也是一个文化精英主义者,认为艺术的价值是分三六九等的。最顶尖的就是歌德、普希金和托马斯·曼的著作,还有巴赫、维瓦尔第、莫扎特和贝多芬的音乐作品——这些作品的永恒的价值类似于永恒的数学真理。柯尔莫哥洛夫强调,每一件真正的艺术作品都是独一无二的,是所谓“不可能”的事物,是超脱统计规律以外的事物。他在1965年的一篇文章中讽刺地问道,“有没有可能把‘托尔斯泰的《战争与和平》’以一种合理的方式纳入‘所有可能的小说’集合中,并进一步假定这一集合中存在某种特定的概率分布?”

500

柯尔莫哥洛夫对绘画、音乐、雕塑、建筑等艺术有浓厚兴趣丨图源:yarwiki.ru

同时,柯尔莫哥洛夫也渴望能找到解密艺术创作本质的钥匙。1960年,柯尔莫哥洛夫为一组研究人员配备了机电计算器,指派他们计算俄罗斯诗歌的节奏结构。柯尔莫哥洛夫对实际韵律与古典韵律的偏差特别感兴趣。在传统诗学中,抑扬格是由一个非重读音节跟着一个重读音节组成的。但在实际的创作中,这条规则却很少被遵守。普希金的《叶甫盖尼·奥涅金》是俄语中最著名的古典抑扬格诗,全诗的5300行中,几乎有四分之三的诗句违反了抑扬格定义,超过五分之一的音节都非重读音节。柯尔莫哥罗夫认为,重音偏离古典韵律定义的频率为诗人提供了一个客观的“统计画像”。在他看来,一种不太可能出现的重音模式恰好反映了艺术的创造性和表现力。通过对普希金、帕斯捷尔纳克和其他俄国诗人作品的研究,柯尔莫哥洛夫认为,诗人对韵律格式的独特运用,奠定了自己作品的“调性”。

为了衡量文本的艺术价值,柯尔莫哥洛夫还采用了字母猜测法来估算自然语言的熵(entropy)。在信息论中,熵是对不确定性或不可预测性的度量。对于信息而言,一份信息的不可预测性越大,它所携带的信息量就越多。在柯尔莫哥洛夫眼中,熵成为了一种评价艺术独创性的指标。他的研究小组进行了一系列实验:给志愿者们展示一段俄罗斯散文或诗歌,并让他们猜下一个字母,再猜一个,以此类推。柯尔莫哥洛夫私下说过,从信息论的观点来看,苏联报纸的信息量不如诗歌。因为政治话语会使用大量的固定短语,内容更容易预测。而对于诗歌来说,尽管存在严格的格律要求,但那些伟大诗人的作品却难以预测。他认为这就是诗人的独特标志,也是艺术上的不可能,但概率论有助于衡量艺术的价值。

虽然将《战争与和平》这样的小说置于一个概率样本空间的想法遭到了柯尔莫哥洛夫的蔑视,他却可以通过计算《战争与和平》的复杂性来表达其不可预测性。柯尔莫哥洛夫假设,复杂性是一个对象的最短描述长度,或者是生成一个对象的算法的长度。确定性的对象的描述是简单的。比如,它可以通过一个周期性的0和1组成的序列产生。但不确定的、真正随机的对象则是复杂的,任何生成算法的长度都必须和对象本身一样长。比如,无理数,小数点以后的数字没有规律可循(循环小数可用一个简洁的分数来表示)。因此,大多数无理数都属于复杂对象,因为要描述它们就只能原样再写一遍。这种对复杂性的理解是符合直觉的,即没有任何办法去预测、描述一个随机对象。今日,这一观点对于衡量一个物体所需的计算资源非常重要,在网络路由、排序算法和数据压缩都有所应用。

500

柯尔莫哥洛夫与他创办的学校学生一起丨图源:internat.msu.ru

了解不可能就是最大的可能

按照柯尔莫哥洛夫的标准来看,他自己的一生也是复杂的。柯尔莫哥洛夫于1987年去世,享年84岁。他一生经历过俄国革命、两次世界大战和冷战,而在学术上他几乎触及了数学的一切领域,其影响也远超学术界。无论他的人生历程属于“醉汉游走”,还是“不走回头路的采蘑菇之旅”,这一段历程都难以预测,难以描述。他在描述并应用“不可能”的成功,使概率论真正成为“可能”,由此为无数科学与工程应用开辟了新的天地。当然,对于不可预测性,他的理论也拉大了人类所拥有的直觉和数学理论之间的差距。

对于柯尔莫哥洛夫来说,他的思想既没有消除不确定性,也没有肯定我们世界根本上的不确定。他只是提供了一套严谨的语言来讨论那些无法确定的事情。他曾经说过,“绝对随机”并不比“绝对必然”更有意义,我们无法对不可知的事物存在确切的认知。

但要感谢安德烈·柯尔莫哥洛夫,我们可解释自己何时以及何因不知道。

本文译自The Man Who Invented Modern Probability

https://nautil.us/issue/4/the-unlikely/the-man-who-invented-modern-probability

全部专栏