高维数学如何主宰我们的世界?
人类生活在三维世界,但探索的触角早已延伸至更高维的数学世界。从物理理论到人工智能,高维数学正在揭示隐藏在复杂现象背后的结构与规律。
撰文 | Benjamin Skuse
翻译 | zzllrr小乐
从直觉上来说,我们能够想象一个一维实体,它永远只能在一条无限延伸的直线上移动;或者一个二维生物,它注定只能生活在一个平坦的平面上。而三维生物无需我们刻意想象,因为这正是我们感知宇宙的方式。然而,驱动现代世界运转的计算能力,却在五维、十维乃至数千维的抽象空间中蓬勃发展。高维数学究竟是如何帮助我们处理和解读信息,又如何揭示那些支配着从生物学到人工智能等万事万物的隐藏规律呢?
超越感知的维度
我们不妨先区分“宇宙的维度”与“维度”的其他定义,这是一个不错的切入点。如果讨论的是前者,那么核心问题便是:我们是否真的生活在一个三维宇宙中?抑或这只是我们感知方式的局限所致?左与右、前与后、上与下,这是我们仅有的移动方向,也是我们感知到三维世界的原因。但阿尔伯特·爱因斯坦(Albert Einstein)的出现改变了这一切。他提出的狭义相对论与广义相对论将时间纳入了考量范畴。尽管我们只能感知到时间的单向流逝,其体验方式与三维空间维度截然不同(从数学角度而言亦是如此),但相对论将空间与时间整合为一个整体,即时空(spacetime)。
数学家赫尔曼·闵可夫斯基(Hermann Minkowski)的研究让时空的数学表达变得具象化。他证明,若将空间与时间置于近乎平等的地位,狭义相对论便能得到简洁优美的阐释。这种统一视角催生了闵可夫斯基空间(Minkowski space)的概念——这是一个四维空间,时间被视为第四个坐标。
这项研究为将时空视为单一四维结构奠定了基础。在数学术语中,这种结构被称为流形(manifold),它并非一成不变,而是会受到质量或能量的影响。当靠近黑洞这类大质量天体时,空间确实会被拉伸,时间亦是如此。换句话说,这个四维流形的维度会发生几何扭曲。
一个多世纪前,相对论带来的启示让人们意识到,我们所处的宇宙或许拥有三个以上的维度,并以一种深刻的方式说明,我们感知到的事物未必就是全部现实。但更多的突破性发现还在后面。
超立方体(左)与立方体(右)折叠和展开过程示意图丨图源:Christopher Thomas (CC-BY-SA 1.0)
在爱因斯坦向世界提出广义相对论后不久,德国数学家特奥多尔·卡鲁扎(Theodor Kaluza)与瑞典物理学家奥斯卡·克莱因(Oskar Klein)意识到,这个理论中还少了点什么:另一个空间维度。两人证明,倘若宇宙是五维而非四维的,那么五维形式的爱因斯坦方程将可以分解为三组四维方程,分别是描述引力的爱因斯坦原始场方程、描述电磁力的麦克斯韦方程,以及一个全新的标量场方程。
这个新增的第四空间维度可以蜷缩成一个极小的闭合环路,其半径远小于任何可测量尺度——这也解释了为何我们无法感知到它的存在。但与此同时,它却可能对我们周遭的世界产生深远影响,堪称是实现引力与电磁力统一的“秘诀”。
这便是后来著名的卡鲁扎-克莱因理论(Kaluza–Klein theory),它在数学层面精妙绝伦,但在物理层面却存在缺陷。该理论无法准确预测粒子的属性,也未能涵盖另外两种基本作用力(强核力与弱核力)以及诸多基本粒子。尽管如此,它是首次严肃尝试证明,我们所感知到的基本相互作用,或许只是高维几何结构的一种表现形式。如今,这一理论的思想遗产依然延续,催生出一系列试图通过多个蜷缩空间维度来统一基本作用力与粒子的理论,例如弦理论(String theory)与M理论(M-theory)——后者由1990年菲尔兹奖得主爱德华·威滕(Edward Witten)首次提出。
四维广义相对论、五维卡鲁扎-克莱因理论,以及十维、十一维的弦理论与M理论都暗示,我们宇宙的几何结构或许远比我们能感知到的更为奇特。但这些理论所涉及的维度,在数学家与统计学家研究的高维范畴中,还处于“低维”水平。那么,为何人们要涉足这些高度抽象的领域呢?
定义数据
当我们描述某个N维空间内一个点的位置时,高维数学的作用就变得易于理解了。前文提到的那个在无限直线上移动的一维生物,只需一个坐标(x)就能确定其位置;平面上的二维生物需要两个坐标(x,y);而我们人类,若只考虑空间位置,用三个坐标(x,y,z)即可定位;若要同时描述时空位置,则需要四个坐标(x,y,z,t)。
一维、二维与三维生物示意图丨本图在Google Gemini的协助下制作。
高维空间中的点,其实只是拥有更多的坐标而已。当我们不再将维度视为宇宙的构成要素,而是从其他角度定义维度时,高维空间的价值便凸显出来。我们不妨将维度理解为在特定空间中被考虑的属性或变量的数量,而非可能存在的现实。例如,金融模型师想要追踪并预测某项资产的风险,就可以将其视为N维风险空间(N-dimensional risk space)中的一个点,其中N代表多种变量,如当前价格、波动率、利率等。
另一个典型例子是人口普查数据。政府的人口普查数据库包含数百个关于人口(年龄、性别、种族、职业等)和家庭(住房类型、产权状况、卧室数量等)的变量。这样一来,每个人就成为了数据库这个N维空间中的一个点,N对应的是普查中测量的数百种不同特征。
在这两个例子中,想要获取有价值的洞见,关键在于发现并分析隐藏在高维数据中的低维模式与结构。金融模型师可以运行算法,在高维风险空间中寻找一个超平面(hyperplane),以此将安全投资与高风险投资进行最优划分。统计学家则可以将原始变量整合为主成分(principal components)——这些主成分能够反映不同群体在社会经济地位上的主要差异,进而构建出基于区域的贫困指数(deprivation index)。
高维数学的重要性还体现在一个当下的热门领域中,即大语言模型(large language models, LLMs)。这类模型的发展得益于约书亚·本吉奥(Yoshua Bengio)与杨立昆(Yann LeCun)等研究者数十年来在人工智能、机器学习与自然语言处理领域的深耕——两人均是2018年图灵奖(ACM A.M. Turing Award)得主。事实上,没有高维数学,大语言模型便无从运转。
约书亚·本吉奥与杨立昆分别出席2019年与2022年海德堡获奖者论坛丨图源:HLFF / Flemming
大语言模型中,文本完全通过向量数学(vector mathematics)处理。模型会将每个“标记(token)”(可以是单词、子或标点符号)转换为一个高维向量,其维度通常在512至4096之间,同时标记在序列(句子)中的位置也会被编码为附加向量。模型的运算主要由自注意力机制(self-attention mechanism)驱动:通过计算高维向量之间的点积(dot product)来衡量所有标记之间的语义关联,进而生成一系列新的高维向量,这些向量包含了给定序列的上下文信息。最终生成的输出向量会被映射到词汇空间(vocabulary space),该空间的维度等于模型词汇表中可能存在的标记数量。最后,模型会通过一个函数筛选出合适的标记,完成文本生成。
复杂性的形态
当大型数据集包含本身就是高维向量的数据点时,数据分析并获得有用信息的难度便会大幅提升。例如在单细包RNA测序技术中,每个单细胞都被表示为一个向量,其维度对应数万个基因的表达水平。想要理解如此庞大而稀疏的空间,需要采用一种截然不同的方法。
如果我们将这个空间视为一个巨大的数据云(data cloud),忽略其中具体的坐标信息,就能退一步,从宏观上把握数据的“形态”。这种方法被称为拓扑数据分析(Topological Data Analysis, TDA),它能够刻画高维数据流形的全局结构与连通性。这类分析方法源于现代拓扑学,其理论基础包括1982年菲尔兹奖得主丘成桐(Shing-Tung Yau)关于弯曲空间的几何分析,以及1986年菲尔兹奖得主迈克尔·弗里德曼(Michael Freedman)在流形结构领域的深刻洞见。
拓扑数据分析借助持续同调(persistent homology)识别数据的拓扑特征——这些特征是数据形态的固有属性,即便数据被拉伸、压缩或进行连续变换,它们也不会发生改变。此类结构包括簇、环与空洞,它们的存在往往蕴含其他方法难以发现的深层信息。
这一技术在癌症基因组学中已产生重要影响。研究人员利用拓扑数据分析,识别出了具有特定预后的乳腺癌患者亚群,而传统方法未能发现这一群体。这一发现为精准治疗奠定了基础。此外,该方法还被用于识别可预测治疗反应与患者预后的基因组标记物,准确性较高。
无限的循环
当我们的研究超越这些已经极高的维度时,我们又会回到一切的起点:探究现实与宇宙的本质。在创立相对论的同时,爱因斯坦也是现代物理学另一大支柱——量子力学——的重要奠基人之一。量子力学描述了原子与亚原子尺度下物质与光的运行规律。在这一尺度下,对物理现象的数学描述需要满足空间上的连续性,同时还要遵循叠加原理(principle of superposition),即在被观测之前,物理系统(波或粒子)可以同时处于所有可能的状态。
这些特性导致量子系统具有无穷多的潜在自由度,也就是无限维度。而这种复杂性,就需要借助泛函分析(functional analysis)这一数学分支来处理。泛函分析将函数视为无穷维空间中的点或向量,而希尔伯特空间(Hilbert space)正是量子态所处的一种特殊无穷维向量空间。事实上,由著名的全才型学者约翰·冯·诺依曼(John von Neumann)严格构建,并经著名数学家伊斯雷尔·盖尔范德(Israel Gelfand)与1962年菲尔兹奖得主拉尔斯·霍尔曼德(Lars Hörmander)进一步推广的无穷维希尔伯特空间框架,构成了量子力学的数学基石。倘若没有泛函分析与希尔伯特空间理论,我们便无法准确定义量子态、量化概率,也无法描述亚原子世界的连续动力学过程。
正如我们所看到的,日常感知的局限反而成为深入理解世界的起点。如今,我们不再局限于对三维世界的观察,而是掌握了构建和探索任意维度空间的数学语言,这让我们在众多领域与应用中,都获得了全新而深刻的认知。
作者简介
Benjamin Skuse是一位专注于科学领域的专业自由撰稿人。他早年曾从事学术研究,获得爱丁堡大学应用数学博士学位和科学传播硕士学位。目前他居住在英国西乡地区,致力于为各类读者创作通俗易懂、引人入胜且具有说服力的文章——无论主题内容有多复杂。他的作品曾发表在New Scientist、Sky & Telescope、BBC Sky at Night Magazine和Physics World等杂志上。
本文经授权转自zzllrr小乐公众号,原文译自Benjamin Skuse,How High-Dimensional Mathematics Rules Our World,Heidelberg Laureate Forum,https://scilogs.spektrum.de/hlf/how-high-dimensional-mathematics-rules-our-world/
注:本文封面图片来自版权图库,转载使用可能引发版权纠纷。
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2.『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。



返朴官方账号




