为导师起草书稿,却意外收获博士论文……(上)
部分研究生不大会自己找题目做研究,而是“等米下锅”。美国南密西西比大学数学系教授丁玖回忆了自己求学和论文选题、写作的特别经历。
撰文 | 丁玖(美国南密西西比大学数学系教授)
新冠疫情爆发前,我回国学术访问、与教授们交流时,他们提到,部分研究生不大会自己找题目做研究,而是像课堂考试等发试卷那样,等导师指定一个研究论题。“嗟来之食”总没有自助餐吃得舒畅。我们都知道,农家自由放养的草鸡味美汁鲜,远非集体圈养的肉鸡可比。盖因肉鸡饭来张口,食谱单调;而草鸡到处觅食,营养丰富。草鸡的市场价钱,也因此比肉鸡贵许多。我小时候住在父母的学校教工宿舍,下雨前最爱在操场上,用大扫帚拍捉矮飞的蜻蜓来喂鸡,因为它们给我们下蛋吃呢。就像念书时,视野不应囿于教科书的方寸纸页,选择学位论文研究课题时,也最好能处处注意,主动出击。就我而言,博士论文的选题虽然出于偶然得之,事先可能连导师李天岩(1945-2020)教授也没想到,却是“到处留心皆学问”的结果。其实,我赴美后写的第一篇研究文章,是得益于我南大老同学魏木生博士的先驱性工作,而与导师涉足的几个领域无关。虽然它未被放入我的博士论文,其诞生机缘却与后来的学位论文有异曲同工之处。
为准确起见,本文将引进一些数学概念。我将用初等或几何语言,以及比喻类比,来描述概念,即便读者不全懂数学内涵也无妨。性急的读者不必望而生畏而减少继续读下去的劲头,希望所讲故事的戏剧性和启发性燃起他们更大的阅读火苗。
“找米下锅”
我读博阶段的第一项研究,是关于亏秩矩阵最小二乘解的摄动理论。最小二乘法祖师爷之一高斯(Carl Friedrich Gauss,1777-1855)早在十八岁时就已萌生出该法的思想。作为哥廷根大学天文台台长的他,在研究天文观测数据时发明了最小二乘法。这在几何上与平面上给定试验数据点的曲线拟合有关。比如说,设想在直角坐标平面上有十个点,可以看成是某个试验结果的十组数据。它们一般不会恰巧沿着一条直线排列。但是,我们能不能画出一条直线,使得它和这些点的“垂直距离”的平方之和最小?这就是“最小二乘问题”的简单一例。它的答案是肯定的,其解法就是“最小二乘法”。最小二乘问题由一个矩阵确定,它是排成几行几列的一组数字。对于“满秩”矩阵(即矩阵的“秩”等于行和列数之较小值),最小二乘的理论与算法已很成熟,构成了计算数学子学科数值线性代数的一部分。
我的大学同学魏木生,在七七级江苏高考中数学全省第一——正题及附加题皆为满分,本科毕业后公费去了美国布朗大学留学,1986年获博士学位。他的博士论文是关于散射波计算,这需要考虑最小二乘问题。但此时矩阵不再是满秩的,而是“亏秩”的,即矩阵之秩小于矩阵的行和列数。他在文献中找不到现成的亏秩问题摄动理论可供参考。有次在学术会议上,魏木生遇到数值代数大人物、美国科学院与工程院双院士、斯坦福大学计算机科学系的高露博(Gene Howard Golub,1932-2007)教授,便向他求教。对方的回答让他相当惊讶:还没有人认真研究过此类问题。于是魏木生决定,自己动手打下这个新领域的第一根桩。1989年,他关于亏秩矩阵最小二乘摄动理论的首篇论文刊登于期刊《线性代数及其应用》(Linear Algebra and Its Applications)。
1986-87学年,魏木生在明尼苏达大学数学及其应用研究所做博士后。1987年秋,魏木生来我读博的密歇根州立大学数学系,继续他的博士后研究。李天岩教授在六七个申请者中挑选了他,因为柯朗数学科学研究所的大数学家拉克斯(Peter Lax, 1926-)教授写了一封有力的推荐信。能让拉克斯提笔写信的人,当然绝非等闲之辈。的确,魏木生之所以得此殊荣,是因为他在博士论文中,推翻了拉克斯散射波理论专著的一个观点。整整一学年,我们两个老同学经常偕家人驱车去购物,共同度过了许多愉快的时光。就在那个秋学季,我拜读了魏木生写的几篇文章,觉得非常有意思。
魏木生博士的开创性工作,本质上是通过估计亏秩最小二乘问题摄动解的误差上界,论证了一般最小二乘解的“上半连续性”。自然界许多现象都是连续的,比如水是连续流动的。“解的连续性”大概是说,当所解问题的数据稍有变化时,解的变化也不大。为了能够应用矩阵论中著名的“奇异值分解定理”,他不得不使用以一百年前德国数学家弗罗贝尼乌斯(Ferdinand Georg Frobenius,1849-1917)名字命名的一种矩阵范数。这个范数是把m行、n列矩阵的所有元素排成有mn个分量的向量,再计算出该向量的欧几里得范数(即所有分量平方求和,再开平方根)。读毕全文,一股强烈感受很快涌上我的心头:文章结论自然漂亮,数学分析也很精辟,但使用这个范数,总不及最小二乘问题本身定义所采用的向量欧几里得范数来得自然。于是我主动出击,集中精力苦苦思索,不久就有了头绪,只用欧几里得范数,获得了一个较为简洁的摄动界。
因为这是我来美后写成的第一篇文章,完稿时我颇有点小激动。我的硕士论文从未投稿以求发表,一方面因为当时太太怀孕,我当然要尽点责任,加上后来又忙于出国留学,无暇整理;另一方面我早已对那个工作不再看重,盖因来美后发现,国际上基于三角剖分的单纯不动点算法研究已趋沉寂,不像七十年代到八十年代初那么红火。而基于微分拓扑思想的现代同伦算法,生命力却一直旺盛。我几个师兄弟的博士论文,都与这个方法密切相关。我后来也将同伦延拓法的思想用于最优化的研究。
兴奋之余,我将文章初稿寄给了当时远在日本京都大学数理解析研究所担任讲座教授的导师李天岩,请他提建议。李天岩教授很快回函,在三页长信中对我文章的主要定理发表了具体意见,并在有关读书研究的方法论上,给予了启迪心智的评述。平时不大当面表扬学生的他,这次却满腔热情地鼓励了我,因为在做学问这件事上,我没有“等米下锅”,而是“找米下锅”。按照他的观点,这是一个研究生“应尽的义务”。
师者传道
对于博士生怎样做研究,李天岩教授自己的求学经历就是最好示范。他三十岁前的三大学术贡献为:八页短文《周期三意味着混沌》首次在数学上给出“混沌”概念的精确定义;率先计算性构造布劳威尔不动点,是现代同伦延拓法的开山之作;历史首次证明了计算遍历理论中的乌拉姆猜想。其中最有名的第一项工作,是他与博士论文导师约克(James Yorke,1941-)合作研究的结晶,迄今被引用超过五千九百次。这在引用次数普遍大大低于实验科学和工程领域的数学论文群体中,是名列前茅的。第二篇论文的作者,除约克外又加了凯洛格(Bruce Kellogg,1930-2012)。他单独完成的第三项成果,则提供了我博士论文的灵感源泉。
我们先回顾一下,他是怎么“走运”地写出了天下第一篇用现代同伦延拓法计算布劳威尔不动点的文章。这个以荷兰数学家命名的拓扑学大定理,在最简单的一维情形,就是初等微积分中的介值定理,其几何性质人人都懂:连接一条直线两侧之点的任意连续曲线必与直线相交。布劳威尔不动点定理在二维的情形就是:闭圆盘上任意一个连续自映射(即值域包含于定义域)必有不动点,即该点被映到自己。李天岩1968年毕业于台湾新竹清华大学,当兵一年后,去了美国马里兰大学数学系读博,师从约克教授。毕业前一年的1973年,他修了凯洛格教授的课《非线性方程组数值解》。课中,教授讲述了加州大学伯克利分校数学系赫希(Morris Hirsch,1933-)教授十年前发表的布劳威尔不动点定理新证明。
这个简洁反证法的思路是:假设不动点不存在,则导致与拓扑学某定理相矛盾。这后一定理是说,不存在将闭圆盘映到其圆周边界的光滑映射,使得圆周上的所有点保持不动。这些拓扑学上有趣的深刻定理,可以解释为什么人头顶上有处不长头发的旋窝。李天岩听到如此新颖的证明,喜欢思考的他顿生一计:可用该思路计算定理保证存在的不动点。因为闭圆盘是个二维区域,而圆周仅是一维曲线,对于赫希考虑的将圆盘映到圆周的映射,定义域比值域多了一维,故存在“逆像”曲线,它起始于圆周上一点而终止于原先映射的不动点集合。只要能在数值上跟随这条“同伦曲线”,不动点就可以算出来。主动而独立的思维,牵引出这么奇妙的新算法!创造性的思想,是那些靠死记硬背定义、定理、证明的读书者难以想象的奇迹。但是对喜欢追根求源、寻找原始思想的探索者,这却是最自然的水到渠成。
当李天岩告诉了约克他的想法后,后者全力支持他干下去,尽管他手中还有其他研究项目,眼光深远的导师知道该课题的价值。经过两个月编程计算,李天岩的算法思想终于实现——薄薄的一页打印纸,记录了历史上第一个现代同伦算法的数值结果。将在克莱姆森大学召开的不动点算法及其应用会议的筹委会,一听说他们用微分拓扑思想构造了新的同伦不动点算法,而不是沿着耶鲁大学经济学教授斯卡夫(Herbert Scarf,1930-2015) 1967年开辟的基于单纯剖分和组合技巧的单纯不动点算法的路线走,马上提供了两张机票,邀请他们赴会宣读论文。后来,斯卡夫在会议论文集序言中,对凯洛格-李-约克文章的新思路赞不绝口。从此,现代同伦延拓法进入了计算数学的大舞台。
“凭着一股牛劲”
如前所述,李天岩教授学术生涯中三项最著名的杰出工作,都完成于他的博士生阶段。其中第三篇关于“乌拉姆猜想”的论文由他独立完成,1976年发表于美国《逼近论杂志》(Journal of Approximation Theory)。这篇文章是如何诞生的呢?1973年,约克与其合作者、波兰科学院院士洛速达(Andrzej Lasota,1932-2006)在期刊《美国数学会汇刊》(Transactions of the American Mathematical Society)上发表了一篇现已成为遍历理论经典文献的论文,其中证明了一个关于绝对连续不变测度的存在性定理。它断言,定义在区间上的一类逐片拉长自映射,存在一个“不变密度函数”。密度函数是常在概率论里露面的数学对象,它是取值为非负数的函数,并且总体积分为1。即位于它的图像之下、区间之上的“曲边矩形”面积等于1。不变密度函数的存在性保证后,李天岩开始考虑怎样把它计算出来。或言之,怎样在数值上有效地逼近它。他提出了一个使用逐片常数函数的逼近法,并对洛速达和约克考虑的那类区间映射,证明了算法的收敛性。顾名思义,逐片常数函数在剖分定义域区间的那些子区间上分别取常数值。
但是李天岩却全然不知,美国氢弹之父、波兰裔杰出数学家乌拉姆(Stanislaw Ulam,1909-1984),在他1960年出版的一本篇幅只有一百五十页的小书《数学问题集》(A Collection of Mathematical Problems)中,已经提出这个方法,用来计算不变密度函数。文章写好后,李天岩才听说这就是十几年前已有的乌拉姆方法。并且乌拉姆在书中猜测,只要不变密度函数存在,算法就收敛。“乌拉姆猜想”催生了在物理及工程中有重要应用价值的“计算遍历理论”学科问世。李天岩文章与乌拉姆方法的“历史性巧合”,也导致文章题目改动,加上了“乌拉姆猜想的一个解答”。这篇计算遍历理论领域的里程碑之作最终是《弗罗贝尼乌斯-佩隆算子的有限逼近——乌拉姆猜想的一个解答》。
多年后,李天岩教授对我回忆他这篇大作的出炉经过,十分感慨地说道:“如果我当时事先知道,这个算法的收敛性,连和冯·诺伊曼一个级别的数学家乌拉姆也未给出证明的话,可能不大敢啃这块骨头。”但是,年轻时的李天岩,是个“初生牛犊不怕虎”的猛士。按照自己的说法,他“凭着一股牛劲,凡事坚持到底,绝不轻易放弃。”他认为,大人物解决不了的问题,并不能说明小人物也解决不了,大人物思考问题的途径也不一定是解决问题的唯一途径。在学问的道路上,只要有独立的精神、自由的思想,只要比别人多花了一分钟思考,就能够将看似困难的问题搞个水落石出。
1987年初夏前,我在通过两门外语(英文和中文都不算外语)考试后,一边继续修课,一边积极跟上一个崭新领域——线性规划内点算法。它与我在南大读硕士的最优化方向相关,起始于印度人卡玛卡(Narendra Karmarkar,1956-)于1984年发表的一篇开创性论文。这个领域当时在国际优化界已开始热浪滚滚,跟进的研究者趋之若鹜。许多人甚至预测卡玛卡在上世纪结束前将会获得诺贝尔经济学奖,就像最早提出线性规划有效计算方法的苏联数学家康托诺维奇(Leonid Kantorovich,1912-1986)当年那样。不过这个预测没有变成现实。李教授考虑到我的老本行是数学规划,建议我跟上内点算法快速发展的步伐。他的一些素有学术往来的朋友,如日本最优化理论著名学者小岛政和(Masakazo Kojima,1944-)教授,常寄来这方面的文章预印本。斯坦福大学运筹学博士叶荫宇等几个华人学者,也开始崭露头角。我力图多了解这些最新的研究成果,慢慢靠近学术前沿,并完成了几篇关于线性相补问题内点算法的文章。其中与导师合作的第一篇,有幸在1991年发表于美国工业与应用数学会那年新办的《SIAM最优化杂志》(SIAM Journal on Optimization)创刊号上。我曾打算将这些内容整理成我的博士论文,但后来的结局却是始料未及的。
本文受科普中国·星空计划项目扶持
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。



返朴官方账号




