只有一个数学
本文是杰出的匈牙利数学家Lâszlô Lovâsz于1998年所作,他深入探讨了数学世界中看似难以弥合的分裂:纯粹与应用、抽象与具体、连续与离散。随着研究群体的壮大和计算机、生命科学等新领域的兴起,数学的疆界不断扩展,也带来沟通与合作的挑战。Lovász 认为,数学的真正力量来自其统一性,而非割裂。他主张不仅要重视定理与证明,还应认可综合报告、解释说性文章等研究形式;同时强调跨领域的交流与工具的互补,呼吁数学家积极跨越藩篱,以交流、阐释和合作维系“一个数学”的整体力量。
撰文 | Lâszlô Lovâsz
翻译 | 胥鸣伟
审校 | 李文林
拉兹洛·洛瓦兹(László Lovász),1948年3月9日出生于匈牙利布达佩斯,欧洲科学与艺术学院院士,欧洲科学院院士,德国科学院院士,俄罗斯科学院院士,瑞典皇家科学院院士,美国国家科学院院士,罗兰大学名誉教授。阿贝尔奖、沃尔夫奖、哥德尔奖得主。
数学被许多分界线所割裂。有划开纯数学与应用数学的最突出的那一条,也有“抽象”与“具体”的对抗,这正是围绕 Bourbaki 学派的论战焦点。而结构性数学(其主要成果是定理及证明)与算法性数学(其成果是算法及其分析)的区分则可追溯到古代;另外,在连续数学与离散数学间也有一个深刻的分界(至少表面上看来如此)。
它们中的某些划分是由于工作环境的不同而出现的:例如,应用数学家是在与纯数学家迥然不同的财政条件及成败判定准则下工作的。还有其他一些划分则是文化的:各个不同的数学分支有它们自己的会议、刊物、奖励系统;还有一系列在谈请交流中出现的不同的数学概念、基础或许还有价值标准。当然,这种抽象的评价会因个性和个人的品味不同而有极大的差异。难道我们应该把“我是一个地道的、纯粹的、抽象的、算法的、离散的数学家”这种划分当作一个不可更改的事实来接受吗?一些人说,这种划分相当不错,人们应该接受把数学分成越来越细的相互独立分支这个无可争辩的事实。我觉得,如果接受这点就真正会导致悲剧性的后果,我还觉得我们学科深刻的统一性赋予了它力量和活力。我要力图证实,我们学科中当今的趋向使得这些分界线比它们看起来要更加复杂;我们必须尽力弥合这些裂隙;而同样这些新趋势将赋与我们弥合的方法。
三个新趋势改变着数学世界
学术界的规模。在过去50年里数学出版物的数量(与其他学科一样)以指数般速度增长,这已是老生常谈了。数学已经不再是过去小而严密的会社,它长大了。随着其规模的增长,这个行业变得更加多种多样,更加组织有序,更加复杂。
数学家是些保守的人;我不是说我们是右派(就我所见,我们所含盖的政治派别与其他行业的一样),但是我们不要求改变:除了力图去证明 P≠NP(或者 Riemann 假设,或是任何使我们当前着迷的问题)外我们不愿在其他事情上花功夫。于是,我们假装认定数学研究仍是原来的样子。我们相信,通过浏览图书馆桌上的新期刊就能获得所有相关的信息,而且如果我们在一份成熟的刊物上发表了文章,则相信它会到达那些要利用我们的结果进行研究的人们手中。
较大的结构绝不正好是较小结构按比例的翻版。较大较复杂动物的躯体的相当大部分被用作“上层结构”,输送原料、协调各部分的功能。在较大较复杂的社会中,其资源不断增长的较大部分则被用作非生产性活动,如像运输和信息处理。我们必须认识并接受这样的事实,即我们的数学活动的越来越大的部分应该也将要被用作交流。这容易看出:业务访问、会议、研讨班以及研究机构数目快速增长,电子邮件的使用越来越频繁。由多位作者合写文章的百分比也猛增。或许我们很快要达到这样的地步,在那里个人的相互接触再也不能提供充足的信息流。
规模上增长的另一个后果是:不可避免地形成了更小的会社(或称之为子文化)。它们似乎是在一种随意的基础上产生的但却在相当长的时间内持续和决定了研究方向。这样一些子文化有离散数学、计算理论、运筹学。
除去文化上的理由外,我一点也不明白为什么计算复杂性理论应该被离散算法设计者所接受,而大多数数值算法设计者却对它抱着浓重的怀疑态度。
应用的新领域。数学的传统应用领域是物理学:它涉及到最深厚的数学与最伟大的成功的故事。在这些应用中所用到的数学是分析,这是数学的真正艰难的核心。但是在本世纪后半叶的科学繁荣期中,许多其他的学科都到了需要严肃的数学工具的地步。传统的分析工具常常不能胜任。例如,生物学试图要了解遗传密码:一个巨大的任务,它是了解生命而最终了解我们自己的钥匙。遗传密码是离散的:像寻找相配的模型或描述翻转子串的后果这一类的简单基本问题,听起来更感熟悉的是图论学家而不是微分方程的研究者。关于密码的信息容量,剩余量或者稳定性这类问题在一个经典的数学家听起来是过于含糊了,但对于一个理论的计算机学者而言他至少立刻会明白有某些手段可以确定它(即使目前可能还难以找出答案)。甚至于物理学也会碰到不平常的离散结构:基本粒子、夸克这一类的东西是极具组合性的;而理解统计力学的基本模型需要图论和概率论。经济学是数学的一个大用户而其所需的许多东西并非来自传统应用数学的工具箱。经济学中的线性规划及运筹学的成功运用依赖于凸性和无限可除性;把不可除性考虑进去(例如,逻辑决策或逻辑个体)则就要用到整数规划或其他的组合优化模型,而处理它们要困难得多。最后,有一个全新的应用数学领域:计算机科学。电子计算方法的发展提出了一大批表达明确的、困难且重要的数学问题,这些间题发生在算法、数据库、形式语言、编码、计算机安全及大规模集成板设计等许多方面的研究中。其中大部分都与离散数学、形式逻辑及概率论有关。在最近的将来那一门数学分支富于应用这完全是不可预测的事。就在25年前,在数论中像3×10^200与4×10^200之间有多少个素数这一类问题似乎是那种最纯粹的、最经典的、完全没有应用可言的数学;现在与其相关的问题都属于数学编码与计算机安全的核心。应用的多样性似乎是另一种离心力,但是我想,相反地它应该强化了跨越所有分界线的信息流。
没有一个领域能够退回到它的象牙塔里而对应用关上大门;也没有一个领域可以宣称自己是应用数学。
新工具:计算机。当然,计算机不仅仅是有趣和新颖的数学问题的来源,而且它们也提供了从事和组织研究的工具。不同的数学家与计算机之间的关系有着很大的差异。一些人完全避免用计算机。另有一些人则泡在计算机上。我像大多数人一样,用它来发电子邮件,来作文字处理,我还用它们来做实验,来从网上获取信息;通常是通过浏览电子杂志,或者更有意思地是进入别的数学家的私人网页。
计算机的这些用法是否只不过是个玩具,或者最多是为了图个方便?我以为不是,这些用法的每一种都要对我们的学科产生深刻的影响。
电子杂志和数据库、私人网页及电子邮件提供了发布结果和想法的新途径。从某种意义上说,它们在扩大研究规模方面有强化作用:不仅仅参加研究的人员不断增加,而且在我们的指尖下可供使用的信息也不断增加(常常有不断增加的花哨无用和具有政击性的东西:电子邮件的规范还远没有确立)。但是我可以把它们用作对付信息爆炸的手段。初看起来,文字处理只是看作书写的一种方便方式,数学研究的最终成品依然是印刷的论文,在一种期刊上发表出来或者是越来越多地在他们办公室里打印世来,供他人阅读。但是,逐步地,一些电子刊物出现了。它们较之通常的印刷品来的优越:极便联结、有色画面和图解,生动活泼等等。阅读一篇数学文章几乎从来不是严格按顺序的:跳回前面去重新看一个定义,又跳到后面去看一个引理是怎样用到的,第一遍阅读时略去证明,反复回到前面来验证在某个例子中的一些论断--这更使人媳虑了浏览互联网而不是读一部小说。既然并不按顺序阅读一份文件,那么为什么还要按顺序去写呢?
这里我不想讨论电子出版物的这些特点所提供的机会(陷阱);然而极有可能它们会改变我们写论文的方式,而通过这点也可能改变我们搞研究的方式。
数学活动的新形式
具有2500年传统的数学研究模式是:定义概念,叙述定理然后证明它们。或许很少意识到,算法设计也几乎是同样古老(想一下欧几里得辗转相除法及牛顿法)。这两种数学研究方法尽管不同却有很强的内在联系。另一个显见的事实是,计算机在实质上增强了算法设计的可视性并使其受到更大的重视。
然而,研究范围扩大的结果必定在现有的研究模式中添加上科学成就的新形式。它们包括写出优秀的解说文章和综合报告,列出问题和猜想,汇编例子,实验和通报成果。我要对前两个加以评论。
综合报告。数学研究范围的极度狭窄是对数学统一性最严重的威胁。没有人能读懂新研究论文中哪怕很小的一段。解决这个问题的方法之一是创建一个对研究成果进行二次处理的活动。虽然我更愿意把它看作为一种数学研究的形式而不是一个书写形式,但是由于没有恰当的词汇,我姑且称它为解说性书写:找出某成果在别的领域中的派生影响,进行解释,或许还要对来自不同子文化的人们作点翻译。数学界已经产生了这种活动:对于解说性文章、综合报告、简易课程、手册及百科全书等都提出了越来越多的需求。许多会议主要或全部用来作综合型的讨论,而出版商也是非常愿意出综合文章的而不是研究论文的集子。
我们每四年组织一次国际会议(以及许多类似的地区性会议)。当一些数学家觉得数学家大会没有什么价值(如果你把它视作一个大型的研究性会议也的确如此)时,其他一些领域的人都为此而嫉妒我们。如果把这个大会用来维护我们领域的统一性,当作作综合报告,解释最重要的新成果、新领域及应用的新方法的讲坛,它则是一笔巨大的财富。我们还不情愿承认解说性的、综合性的写作是一种科学成果。人们往往对于某人写了关于其他某人新成果的一篇解说性文章持保留态度(相反,我个人以为这类活动应得到鼓励)。如果正如所建议的那样把解说性书写当作受到高度重视的研究活动,那么人们必须要找到评价它的方法。写综合报告应该怎样适应我们已经达到的状态呢,这包括了职位、升迁以及资助?我们几乎不知道一篇好的数学综合报告的评判标准,虽然我们同样也没有判断一个定理是否好的正式标准,但不管怎样,仍然有一些合理而准确的必要条件(一个定理应当是新的,非平凡的,还应该是正确的),数学界还趋向于同意另外一些评判标准,它们是些更加难于规定的东西,譬如有趣味和有意义这类概念。我来推荐一个带根本性的想法:让我们按照人类评价他们自身成就的方式来评价这些综合报告吧。我们往往把这些领域轻视为“软的”(相较于我们自己的“硬而精确的”领域),我们相信其成功只是种侥幸,往坏里说,是善于自我拾高而己。这种感觉显然与事实相距十万八千里,而人类总是以他们自身的方式去认识智力成就中的优秀成品的。学会怎样不带主观的标准去做评价,只有这样我们才能真正有所收获。
将丰富的人类思想宝库中更多的方法用于追寻知识之中,只会有利于我们的学科。
问题与猜想。在一个小圈子里,每个人都知道什么是主要问题,但在一个十万人的圈子里,必须对问题以精确的方式去鉴别和陈述。陈述得糟糕的问题引起人们厌烦和导致不相干的后果。这就把猜想的准确阐述提升到研究成果之中了。在已故的 Paul Erdős 手中,提出猜想成了一种艺术,他所提出的猜想恐怕比他之前的所有数学家所提出来的总和还要多。他把他的猜想看作为与他的定理一样的是他的数学著作的一部分。我最为珍贵的回忆之一是他的一段评述:“我从不嫉妒任何人的一个定理;但为此猜想我却嫉妒你。”当然,正如对于综合报告一样对于猜想我们也陷入了同样的困境:难于规定什么叫一个好的猜想。围绕着 Erdős 猜想的风格也的确有许多争论。容易取得一致的观点是,一个好的猜想应当可期望其结果在实质上超前于我们现有的知识。当我们在构建数学时可清晰看到猜想所处的地位以及它可能的解答,这正是许多数学家所感觉到的那种好猜想;但是,确有一些猜想是那样地出人意料,以现有方法它是那样地完全不能接受而它们的解答必定会带来一些新东西——只是我们还不知道它们在哪里。
离散与连续
在这些分界线中最具本质性的是分割离散与连续的那条,这是由于它涉及到了我们学科的基本结构和方法。在此最后一节文字中,我不得不涉及较多一点技术性的内容,同时还要举出一些例子以证明:如果让这种裂缝继续扩大,我们将蒙受多大的损失。而如果能弥合它,则我们又将获得多少益处。
从无限到有限。或许没有必要去论证什么离散数学与连续数学互为补充,什么它们彼此利用对方的方法和工具这一类的话。但除此之外,我们还用有限去逼近无限。把复杂的连续结构离散化一直是一种基本方法—比如从以同调论中剖分流形来给出 Riemann 积分的定义到在网格上对偏微分方程做数值解。尽管如此,我感觉在连续性数学中应用离散数学的状况仍令人不满。或许组合方法还未达到分析或代数所具有的那种深度与力度,或许部分地出于文化方面的原因:离散数学家学过 Galois 理论或 Borsuk-Ulam 定理的可能性要比“经典”数学家学过 Ransey 或 Max-Flow-Min-Cut 定理的可能性更大。
从有限到无限。无限常常(或者总是?)是一个较大有限的近似,这是个比较难于捉摸的想法。连续结构比它相对应的离散方面常常更干净、更系统、更内涵丰富(例如,一个平面网格较之于欧氏平面只具有很小的对称度)。把离散结构“嵌入”到连续世界中去研究应用到组合方面。把这个最重要的组合最优化问题准确表达为一个具有整性条件的线性规划问题是相当容易的,而且只要忽略掉整性条件给出解答也是十分容易的;策略是要找出一种方法使列出的这种忽略整性条件的线性规划问题是合理的。
其他工具的威力。为支持我的数学统一性的主张,让我来讨论一下在算法论中新近的一个进展。从一个例子开始,即图论中一个简单的算法问题:给定一个(有限)图,找出它的顶点集的一个一分为二的划分使得连结这两个子的边数最多(尽管简单这却是个很重要的问题:参见 Deza 与 Laurent 叙述与它广泛关联问题的专著)。不幸,这个问题具有 NP-难度,如果你对复杂性理论的基本概念不甚熟悉,那么粗略地讲它表示没有有效的(以多项式时间)方式来找出这种最好的划分(至少遵循于假设P≠NP)。我们必须放宽一些要求,比如说去寻求一个近似的优化划分。可以很容易找到一个划分,使得至少有一半的边连结两个子集。这是 Erdős 六十年代在不同的背景下首先发现的。由于没有划分能包含所有的边,所以这便给出了一个近似解,它至少取得了50%的优化。能够做得更好些吗?直到不久前这仍是个没有解决的、纯真的问题。但是最近刚刚有两个重要结果几乎同时得到了:Goemans 和 Willianson 给出了一个有效的近似算法,这具有13%以内的最优化;而 Hastad 在建立了一系列较弱结果的基础上证明了没有有效的(多项式时间的)近似算法能做到好于6%的最优化。对这一类问题而言,这是个使人惊讶的小缺口,然而从我们观点来看,更为重要之处在于这两个结果都依赖于那些来自完全意想不到之处的工具。上述那个否定性的结果是各种近似优化的许多下界之一,而它们都是以相似的方法证明的。其中第一个证明应用了来自交互证明系统理论中的一个结果,第一眼看来这个理论是复杂性理论中一个十分特殊的领域,但它却非常有意思。紧随其后的那些改进显示出证明中所用到的最重要的数学构造是由代数方法得到的一个纠错码。这个算法本身依赖于前面的另外一系列结果,它们基于相距甚远领域间的关联。关键步骤是使用了半定最优化,它是线性规划理论的推广且很大程度上建立在对称矩阵的谱理论之上。这也不是个孤立的结果;运用半定最优化(并结合随机算法)在近似算法的设计上也取得了极大的成功。
概率论。这带给我的话题似乎是要弥合数学中大部分的分界线。在组合理论、图论及算法论中概率方法的重要程度正在猛烈增长着。除了传统地在积分和模拟理论中运用 Monte-Carlo 方法之外,随机算法被用于计数、精确与近似最优化、原始测试等等。Erdos 在五十年代首先在非算法图论中引进了概率方法。它现在作为对象(图或给定图的着色)存在性证明的方法是很基本的也是非常强有力的。概率论已经进入那些在陈述上根本与概率无关的定理的证明中。概率论的作用绝不局限于组合论和图论:只要提一下素数理论中的筛法以及用统计力学对湍流所作的解释就行了。
更深刻的统一性。比那种仅仅运用从别的分支引进工具来说明数学的统一性而言,概率论是唯一一个表现更深刻统一性的实例。许多基本问题并不只是认定它是否离散或连续一它们自可标以离散问题或连续问题。近年来我从事于样本算法方面的工作(即这样一种算法,它生成了一个一致分布的随机元)。而它属于一个较大的并常常只以隐式描述的集合。这个问题会导出对马尔可夫链的混合时间(即链成为实质稳定前的步数)的估计。从这个应用的角度看,自然要考虑有限马尔可夫链—在计算机上的计算必须是有限的。但是分析起来,它取决于人们是愿意使用有限还是愿意运用一个广义可测的状态空间的特别选取。在这两种模式中都具有已经发现的所有这些实质性的(也很有趣味的)关联。事实上,一般的数学问题是扩散性的:我们对物质的热扩散感兴趣,或是对随机遊动中的概率扩散或其他相关问题感兴趣。总是有一个拉普拉斯算子来描述出这种扩散的一个步骤。扩散的速度由这个拉普拉斯算子的谱间断所控制;但若对此间断没有有效的信息,则可将此扩散速度问题联系到状态空间的等周不等式上去。要建立等周不等式人们经常去构造(显示地或隐式地)多重物流。
我要举的第二个例子更为含糊。就从这十来年在图论中那一系列或许是最重要的成果,即从主要由 Robertson 和 Seymour 发展起来的图子式理论(Graph Minor Theory)开始。回想一下 Kuratowski 的经典定理:一个图可以被嵌入平面的充要条件是它不包含两个特殊图。包含性这个概念在这里可以以许多不同但等价的方式来定义;让我们来确定“包含子图”的含意:如果从 G 中消去某些边、节点、及将某些边收缩于单个节点得到了图 H,则称 H 是 G 的一个子图。平面图类(正如嵌入在任何其他一个给定曲面的图的类一样)在取子图时是封闭的。因此,平面图类可以在除去子图后再来刻划(只要列出所有最少子图的非平面图即可)。Kuratowski 定理的关键就是证明被排除的那些子图的集合只有两个图。在三十年代 Wagner 提出了一个大胆的猜想:每个在取子图时封闭的图类可以由有限个被排除的子图来刻划。Robertson-Seymour 理论的核心结果就是这个猜想的证明。然而我想要论及的是一个“辅助”结果,它在某种意义上描述了不含有一个给定图 H 为子图的一个较大的图。不严格地说,即每个这样的图可由下述方式来构造:在一个具有界亏格的曲面上取一个随意大的图;加上一些边以连结在同一曲面上的节点,但要有有界距离;加上有界个数的更远的点;然后沿着树形的节点的有界集合把这些图粘合起来。这里所用的“有界”是指只依赖于图 G 而不依赖任何别的一个界。
在这里我们可以看到出现一种图的“整体”理论的端倪:一个巨大的图是什么样子?在这种似乎无任何结构的庞然大物里究竟能看出什么隐藏的结构?或许存在一个更一般的理论能在大图中识别出了3-维或 4-维结构?但是在 Robertson-Seymour 理论(现已扩大到超过了19篇论文)中的难以对付的难点警示我们,这样一种理论恐怕不易建立。
最近我知道了 David 和 Semmes 的工作,不禁注意到它与 Robertson-Seymour 理论的某些相似之处。他们给出了一个“合理的”度量空间的分解,把它分成了大小不同的具有不同维数的片段。这个类似还有更多的内容吗?但是一谈到“整体”图论就会想起其他一些重要结果。Szemeredi 的正规化定理说,每一个巨型图可以“分解”为有界数目个片段,它看起来是“随机的”(片段的个数依赖于近似随机性的误差;若要精确地表述要作过多的准备)。当前,这个基本引理的令人激动的应用潮流已经出现。是否 Szemeredi 引理有更广泛的背景?Frieze 和 Kannan 最近的工作或许是一个提示,表明了 Szemerdi 引理与矩阵的低秩逼近之间的关联。
没有自然的方式来划分数学,但是除非我们意识到必须作出努力去避免,否则就会发生严重的在交流上的断裂:不仅仅要在组织上作出努力而且要用研究时间去致力于解说性写作,阅读那些解说性文章,致力于普及数学并从各种应用领域吸取数学问题。
致谢。感谢Tom Zaslavsky 仔细阅读了此文并提出了许多改进建议。
注释
注1)原题: One Mathematics, There is no natural way to divide mathematics, 译自:Berlin Intelligencer, ICM'98
注2)作者系耶鲁大学计算机科学教授
本文经授权转载自微信公众号“数学大院”,载于《中国数学会通讯》(1998年)。
注:本文封面图片来自版权图库,转载使用可能引发版权纠纷。
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。