这种广义逆矩阵,由彭罗斯在24岁时重新发明|N文粗通线性代数

500

不少同学在初学线性代数时感到迷茫、痛苦,体会不到课程的实际意义。这很大程度上是因为,教材为了由浅入深、循序渐进,须从基础的抽象概念讲起,而真正直观的部分,往往要等到后面的细分领域或具体应用。于是初学者往往知其然,不知其所以然;只见树木,不见森林。希望本文能让你换个视角,以轻松有趣的日常眼光,看到一个不一样的线性代数。

本文是系列文章《N文粗通线性代数》的第五篇。在上篇文章中,我们讨论了如何处理线性方程组无解、有无穷多解的情形。当A为满秩方阵时,线性方程

500

撰文 | 吴进远

上回书说到,某近视宅男,某日下楼到早点铺买早餐。眼镜忘在家里,看不清黑板上写的价目。于是,宅男就一边排队,一边听着前边顾客买早点的品种数量,和服务员小妹报的总价,据此计算各种早点品种的单价。

宅男买了早餐,一边吃,一边思考。我们知道,只有正方形的矩阵,也就是说,行数与列数相同的矩阵,才可能存在逆矩阵。不过,即使是正方形的矩阵,也不一定有逆矩阵。因为一个矩阵存在逆矩阵的条件,除了必须是方的,它还必须是满秩的。可是,我们在现实世界中,经常会遇到不方的矩阵,或者不(列)满秩的矩阵。对于这种情况,难道我们就只能干瞪眼,一筹莫展吗?

这个问题本身是一个实实在在的问题。在求解线性方程组的时候,尽管我们可能无法求出方程的唯一解,但我们希望通过这个方程组了解未知数之间的关系。这就要求我们去寻找一个任意矩阵的广义逆矩阵。

(1)假美术老师教的真数学

一个任意矩阵A,不管这个矩阵是不是方的,也不管它的秩满不满,假如有个矩阵G,符合 AGA = A 这样一个条件,则G就被称为A的一个广义逆矩阵。如果同时符合 AGA = A 和 GAG = G 这两个条件,则G被称为一个自反的广义逆矩阵。我们下面讨论一个例子。

矩阵的作用可以用坐标变换来解释,实际上,绘画摄影都可以看成是坐标变换。当然我这样说艺术家们会抄起苕帚把我赶出去,所以这里需要限定我们说的是像我这样的假美术老师。比如有一天,我画了一个苹果。

500

我自己画技很差,但如果换成一个经过训练的画家,应该不难画得像下图那样非常像。

500

这个图实际是P出来的,用在这里是为了表明有的画家确实是可以画到这么像的。

我们可以把摄影看成是一个矩阵:A。它的作用是把实物(x)或者画作(v)变成照片(u)。

实物变成照片:u = Ax

画作变成照片:u = Av

同样,我们可以把绘画看成一个矩阵:G。它的作用是把实物或者照片变成画作。

实物变成画作:v = Gx

照片变成画作:v = Gu

在现场,我们不难看出画作和实物是很不相同的,同样,照片和实物,照片(斜着一定角度拍摄的照片)和画作也都是不同的。

不过,我们可以进行如下操作:

500

这个过程中,照片1如果和照片2相同,则绘画矩阵G可以看成是摄影A的广义逆矩阵,因为它们符合 AGA = A。

同理,我们可以进行如下操作:

500

如果画作1和画作2相同,则有 GAG = G。

这里强调一下,绘画显然不是摄影的逆矩阵,因为我们不可能从照片画出一个真的苹果,哪怕是一个三维的模型苹果也不行。但绘画却是摄影的广义逆矩阵,因为把照片通过绘画变成画作之后,再把画作通过摄影变成照片,这两张照片是一样的。

同理,摄影不是绘画的逆矩阵,但却是它的广义逆矩阵。

两者同时是对方的广义逆矩阵,并且都是自反的。

(2)寻找靠谱的广义逆矩阵

现在,我们换数学老师换一个角度来讨论。广义逆矩阵要满足什么条件呢?如前所述,对于一个矩阵A,如果有另一个矩阵G,满足 AGA = A 这个条件,G 就是A的一个广义逆矩阵。我们仍然用近视宅男买早餐为例,来说明广义逆矩阵的定义。

比如宅男前面假定只有两个顾客,如下表所示。

500

这两笔买卖构成一个线性方程组,用矩阵乘法写出来是这样的:

500

很显然,这里我们有三个未知数,却只有两个方程,约束条件不够,不可能有唯一解。从系数矩阵上看,这个矩阵是矮胖的,显然不是列满秩的,因此这个矩阵没有对应的逆矩阵。但我们可以定义这个矩阵的广义逆矩阵。

这个定义可以画成下面这样一个图。

500

早餐店有三种食品,三个单价构成向量x。两个顾客购买不同品种食品的数量,构成一个2行3列的矩阵A。而两位顾客购物总价构成一个有两个元素的向量y。总价的计算过程是一个矩阵乘法 Ax = y,这个计算如图中第一行所示。

我们从两个顾客的购物总价y出发,尽管无法计算出三种食品的准确单价,但完全可能算出一组可能的单价u,如上图第二行所示。这个算法说到底是把y里的两个元素拿来做线性组合,这个线性组合可以看成是一个矩阵乘法:u = G y,其中G是A的广义逆矩阵,它可以从A计算出来,尽管这个计算比较复杂,我们暂时先不讨论。注意,这里算出的可能单价u与我们事先知道的单价x完全可能是不相同的,但这组可能单价应该是靠谱的。

可是,“靠谱”又是什么意思呢?我们通过上图第三行来解释。简单说,就是 Au=y。或者说,当我们用这一组新的可能单价去代替我们事先知道的真实单价,以此计算前两位顾客的购物总价时,得到的结果必须不变。具体在我们这个例子中,我们事先知道的单价:油饼3元,茶叶蛋4元,豆腐脑7元。而使用广义逆矩阵,我们可能算出另一组可能单价:油饼3元,茶叶蛋5.5元,豆腐脑5.5元。这一组可能单价显然不是我们事先知道的真实单价,但由这组可能单价算出的两位顾客的购物总价却是不变的。实际上,当茶叶蛋单价加豆腐脑单价等于11元时,我们总会得到相同的结果。

(3)广义逆矩阵可能不止一个

我们要求广义逆矩阵“靠谱”,或者说 AGA=A,这是一个非常松的条件。因为这个条件很松,因此对于一个矩阵A,完全可能有无穷多个矩阵G满足条件。因而一个矩阵可能有无穷多个广义逆矩阵。

当然,如果矩阵A是一个满秩的方阵,则它的广义逆矩阵就只有一个,这个广义逆矩阵就是我们以前学过的逆矩阵。

500

在 AGA = A 中,确实(GA)这个乘积有点像单位矩阵,因为它与A相乘还会得到A:A(GA) = A,但(GA)通常不是单位矩阵,它通常只能还原A,而不能还原其他矩阵。

(4)在广义逆矩阵中挑三拣四

虽然满足 AGA = A 的矩阵G是一个“靠谱”的广义逆矩阵,但满足这个条件的矩阵G在一般情况下会有无数个。像我们前面这个例子中,只要一个矩阵G能算出茶叶蛋单价加豆腐脑单价等于11元,它就可以算一个广义逆矩阵。

我们自然会想到,能不能让我们挑选的广义逆矩阵范围缩小一点,最好能缩小到只剩下一个?

我们人类一向如此,任何事物没有的时候焦虑,多了也焦虑。比如富家小姐挑女婿,先提个条件要个子高,符合条件的多了就又提条件要家里富,然后再提条件要长得帅。

缩小广义逆矩阵范围其实也是这个思路,没有什么万里挑一的事情不能通过加限制条件来实现,如果不行,那就再加几个条件。

我们最容易想到的条件是 GAG = G,从外观上看它和 AGA = A 对称。它表达的意思可以用下图来说明。

500

在我们前面买早餐的例子中,根据两个顾客的付款额y',我们可以用广义逆矩阵算出三种食品的单价,尽管这个单价和真实的单价并不一样,但它多少能提供一点有价值的信息。比如,从道理上说,如果今天两个顾客的付款额都比昨天低了,我们可以猜出今天有优惠,食品单价降低了。

利用我们手里众多广义逆矩阵中的一个,近视宅男可以算出今天的食品单价 u = Gy',如上图第一行所示。当然,这一组单价并不一定正确。使用这一组单价,服务员小妹可以算出两位顾客的付款额:Au = y,如上图第二行所示。注意这一组付款额y和近视宅男听到的y'可能会是不同的。现在如果近视宅男反过来再算食品单价 u = Gy ,如上图第三行所示,一般情况下不一定会得到相同的结果。不过,由于广义逆矩阵一般情况下有无数个,如果一开始我们选择了一个合适的广义逆矩阵G,它满足GAG =G,则上图第一行与第三行这两次计算都会算出相同的单价。

我们看到 AGA = A 和 GAG = G 这两个条件是对称的,同时符合这两个条件的一对矩阵A与G互为广义逆矩阵,它们互相之间是自反的(reflexive)。在有的文献中,把符合 AGA = A 这个条件的矩阵G,叫做A的内逆(inner inverse);把符合 GAG = G 这个条件的矩阵G,叫做A的外逆(outer inverse)。

有了 AGA = A 和 GAG = G 这两个条件,同时符合这两个条件的广义逆矩阵数目显然少了,但令人抓狂的是,对于一个一般的矩阵A,我们仍然可能会有无数个G。这就需要我们进一步增加限制条件,我们后面会进一步讨论。

(5)挑出唯一的那个广义逆矩阵

增加限制条件可以让我们的寻找范围缩小,可以想象,如果选定的条件合适,我们完全可能在无数个广义逆矩阵挑出唯一的一个。当然这里还必须确保我们设定的条件不能太苛刻,因为那样可能会出现没有广义逆矩阵符合全部条件的尴尬情形。好在,我们现在至少有一组条件,可以确保筛选出一个、而且只有一个广义逆矩阵。

现在,到了彭罗斯闪亮登场的时候了。对于任何一个矩阵A,存在一个而且只存在一个矩阵G,同时满足下面四个条件。这个矩阵G叫做矩阵A的彭罗斯逆矩阵。

500

可以看出,这四个条件中,第一个是广义逆矩阵的定义,第二个是我们刚刚讨论的自反广义逆矩阵的关系式。第三和第四两个关系式中“*”是共轭转置的意思,就是把里面所有元素换成共轭复数,同时把元素的行与列对调。如果括号里矩阵所有元素都是实数,则共轭转置“*”与转置“T”等价,或者说括号里两个矩阵的乘积AG或GA对称。(这里提醒读者注意,A通常不是正方形的,因而G通常也不是正方形的。但AG以及GA却是正方形的,这两个正方形矩阵一般情况下一个大一些另一个小一些。)第三个条件让广义逆矩阵提供最小二乘解,同时满足第一与第三条件的G,在 Ax = y 自相矛盾没有解的情况下,可以用 Gy 算出最小二乘解。(当原方程组不自相矛盾时,Gy 就是方程组的解)。而第四个条件让广义逆矩阵提供最小范数解。我们知道,如果原方程组约束不够,则它可能有无穷多解。现在第四个条件的作用是把最小范数解挑了出来。

在大学教科书上留下名字的人,几乎没有活人,但罗杰·彭罗斯(Roger Penrose)还活得好好的,他2020年得到了物理学的诺贝尔奖,成果是黑洞方面的。

500

罗杰·彭罗斯 | Nobel Prize Outreach. Photo: Fergus Kennedy

彭罗斯发现彭罗斯逆这个工作发表于1955年,说起来,这种逆矩阵在30多年前就已经被前人发现了。可是彭罗斯当时压根不知道这回事,从某种意义上说,可以算是再次发明轮子(re-inventing wheels)。

当然这个事情并不能怪彭罗斯,因为当时数学界很多人也不知道这回事。实际上,在彭罗斯之前,1951年,瑞典大地测量学家Arne Bjerhammar已经重新发明过一回轮子了。到彭罗斯投稿的时候,至少可以想象他那篇文章的审稿人也不知道前人的工作,否则这篇文章就可能发不出来了。你可能觉得哪个编辑敢拒稿诺奖得主的文章?但诺奖得主也有做黄口小儿的时候。彭罗斯得诺奖是60多年后的事情,他当时只是个24岁的博士生。

当初在1920年发现这个广义逆矩阵的数学家是穆尔(Eliakim Hastings Moore),他是用矩阵的行列子空间上的投影来表述他的发现的,非常抽象难懂,所以没有很多人继续研究下去。我没有查到他1920年的论文原文,但读过后人的一个转述文章。大家形容文章难懂都是说字全认识意思不懂,可这篇文章里我连有的字母都不认识。上网查了希腊、希伯来、西里尔字母表都查不到,最后发现那个不认识的字母是一种花体的拉丁字母。

500

穆尔 | wikipedia

若干年后人们知道彭罗斯的逆和穆尔的逆是等价的,但彭罗斯和穆尔的表述非常不同。此外,彭罗斯的四个条件是可以拆开来互相混搭使用的,由此能够揭示广义逆矩阵的更多新奇性质。因此数学界完全认可彭罗斯的新贡献,人们现在把这种逆叫做穆尔-彭罗斯逆。我们后面会进一步讨论。(未完待续)

500

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。

版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。

站务

全部专栏