为什么矩阵的行秩等于列秩?
“我经常举的一个例子是,我对一个矩阵的‘行秩’和‘列秩’为什么会相等的好奇。其实在任何基本的线性代数书里,我们都可以找到它们为什么相等的证明。但是从那些逻辑推理的外表,我实在看不出它们为什么会巧合地相等。在我真正了解到它们为什么会一样的过程中,这个好奇却帮我了解了许多广义逆矩阵的几何意义。”
——李天岩《回首来时路》
撰文 | 朱慧坚(广州南方学院数学与统计学院副教授)、丁玖(南密西西比大学数学系退休教授)
在理工科基础课《高等代数》或《线性代数》中,“矩阵”或许是出现频率最高的数学词汇,其重要性不亚于《数学分析》或《高等数学》中的“函数”。对于电子工程或计算机科学等应用学科的学生们而言,矩阵在《线性代数》中的一项基本用途是求解线性方程组,因为线性方程组的所有系数若不变动位置,可以自然地排成一个有几行几列的数组,即矩阵的形式,然后利用课本中定义的一系列矩阵运算和性质,同学们便掌握了求解方程组的有力工具。然而在面向数学专业的《高等代数》课程中,矩阵不仅延续了求解线性方程组的传统功能,还挺身而出,担当了连接抽象概念和具体模型的桥梁重任,用更专业一点的话来说就是:任何两个有限维向量空间之间的线性映射,只要在定义域向量空间和值域所属的向量空间中各自选取了一个基底,那么这个线性映射就有一个唯一确定的、看得见摸得着的“矩阵表示”,这时“矩阵有大用”的威力就充分显现了。
“打倒行列式!”
笔者分别在中美两国的大学多次讲授《线性代数》,所用的都是畅销教材。在中国使用的教材是工程名校同济大学编写的《工程数学·线性代数》,第一版四十四年前问世,第七版三年前推出;在美国则教过一浅一深的两门课:《线性代数I》和《线性代数II》。前者本质上只讲矩阵的初等理论,与上述同济大学教材的覆盖面相仿;后者主要学习有限维向量空间之间的线性映射理论,这时矩阵大致起到“助手”或“工具”的次要作用。
矩阵的历史源远流长。早在近两千年前的中国古代数学典籍《九章算术》中,它便已初现端倪,并被三国时期的伟大数学家刘徽(约225年-约295年)所应用。1850年,英国大数学家西尔维斯特(James Joseph Sylvester,1814-1897)正式将其命名为matrix;随后,比他小七岁的律师兼数学家凯莱(Arthur Cayley,1821-1895)率先引入了矩阵的代数运算。一百五十年来,矩阵一直被代数学家和工程技术家们“玩”个不停,其卓著功勋,不在话下。
因为线性代数入门教程主要讨论作为具体代数运算对象的矩阵,中美两国的传统教科书一般都沿着数学史发展的足迹,在正式开讲矩阵前,第一章先讲行列式。然后以它为主要工具,一章又一章、一节又一节地推演出矩阵几乎数不清的种种性质,比如具有非奇异系数矩阵的线性方程组的著名解公式;它完全依赖于行列式的计算,名为克莱姆法则。还有,可逆矩阵的逆矩阵有个看上去美丽简洁的逆矩阵公式,其每个元素的计算都少不了行列式帮大忙;可惜这个忙帮得太花时间,以至于后世强调高效实用的计算数学家和工程师早就把这个“中看不中用”的求逆公式弃之不理了。
多年的教学实践提醒我们,尽管行列式理论曾在历史上为现代数学的不断进步立下过汗马功劳,但如今它对线性代数的影响力已日渐式微。其繁琐的计算公式,无论是基于排列的和式定义,还是拉普拉斯展开,都难以讨得学生欢心,有时甚至会引起他们的恐惧和反感——尤其是在需要化简一个颇为复杂的行列式时。所以,在线性代数的数学教育中出现了一种质疑的声音:行列式是否仍有讲授的必要?
恰好三十年前,美国数学家阿克斯拉(Sheldon Axler,1949-)教授在读者如云的数学期刊《美国数学月刊》(第102卷)上,发表了题为Down with Determinants!(《打倒行列式!》)的文章。文章摘要的第一句开宗明义:
“本文展示了在没有行列式的情况下,如何更好地构建线性代数。”
第二年,《美国数学月刊》的东家——美国数学协会将1996年度的“莱斯特·R·福特阐述写作奖”颁给了阿克斯拉,表彰他这篇影响深远的数学檄文。笔者之一在密歇根州立大学数学系攻读博士学位时,修过阿克斯拉教授一学年的《高等泛函分析》研究生课程,为他的教学艺术所倾倒,当年提名他评选教学奖,他也当之无愧地将其收进囊中;须知他1975年从加州大学伯克利分校博士毕业后,去麻省理工学院担任两年摩尔讲师(极富荣誉的一种博士后位置)期间,就获得过校级教学奖。
在“讨伐”行列式的同一年年底,阿克斯拉教授出版了教科书《线性代数应该这样学》(Linear Algebra Done Right),其写作风格继承了他的师祖、美国数学写作与演讲高手哈尔莫斯(Paul Halmos,1916-2006)的名著《有限维向量空间》(Finite-Dimensional Vector Spaces),即用基于集合论的函数语言撰写代数课本。正如阿克斯拉教授在前述文章中所宣称的,他没有拿起行列式这把榔头来捶打出线性代数的各种零件,不过还是给予行列式足够的礼遇——将它放进了全书十章的最后,与矩阵迹共享一章,毕竟它是矩阵之子(西尔维斯特给矩阵所取的英文名字matrix来自拉丁语matrix,原意为“子宫”,隐喻行列式为矩阵所生)。
阿克斯拉教授精心写作的这部教材在美国高校极受欢迎。2009年,人民邮电出版社翻译出版了该书,此后一直跟随英文新版更新译本,目前已出版至第四版。积极从事数学普及的西北农林科技大学林开亮博士,还在《数学文化》杂志上发表了热情洋溢的书评。
《线性代数应该这样学》的译者在序中写道:“描述线性算子的结构是线性代数的中心任务之一,传统的方法多以行列式为工具。作者认为行列式既难懂又不直观,还缺少动机,并且导致思路曲折,从而掩盖了线性代数的本质。因此,本书完全抛开行列式,采用更直接的方法阐述了线性算子的基本理论,作者认为这种方法可使学生更加直观、深刻地理解线性算子的结构,线性代数就应该这样教与学。”
这本书起点较低,不需要太多预备知识,而特色鲜明,是公认的阐述线性代数的经典佳作。原书自出版以来,迅速风靡世界,其中包括斯坦福大学和加州大学伯克利分校等著名学府。根据阿克斯拉教授不断更新的统计数据,到目前为止全球共有超过四百二十所大学和学院采用这本书作为教材。笔者之一任教的大学数学系也慧眼识珠,及时用它替换了旧教材。当笔者再次讲授这门课时,书中清晰易懂的语言表述与滴水不漏的逻辑推理,令笔者马上想起八十年代末那个学年,自己坐在教室里,看阿克斯拉教授演绎泛函分析之美的生动场景。到了2020年,阿克斯拉教授出版新书Measure, Integration & Real Analysis(《测度、积分和实分析》),并告诉笔者他一如既往地将电子版免费上线。笔者毫不犹豫地选择了这本书来讲授《实分析》课程,再一次满怀喜悦地品味了他的写作风格。
重新定义“秩”的基石
与矩阵形影不离的一个数学概念是“矩阵的秩”,它在线性代数中的地位,堪比微积分中的“导数”。在通常的教科书中,由于行列式最早登台亮相,自然它必须身兼数职,不仅要服务好之后登场的逆矩阵计算,也要充当矩阵秩的“解说员”。它向学生们这样介绍矩阵秩的概念:矩阵的秩是其非零子式的最大阶数。这句简洁的定义更通俗地说就是:从矩阵中任取k行k列元素而不改变相对位置,组成一个k阶方阵,其对应的行列式称为原矩阵的k阶子式。如果所给的矩阵有一个k阶子式不等于0,但所有更高阶的子式都等于0,那么我们就说这个矩阵的秩为k。
看来,按照这个定义,要找到一个矩阵的秩,我们必须耐心地计算不同阶数的子式,直到算出一个子式不为0,但又要确保更高阶数的子式统统等于0,才算大功告成。对学生而言,即便将这个定义背得滚瓜烂熟,也很难理解“秩”的意义到底是什么,可能知其然而不知其所以然。为了做习题应付考试,只好硬着头皮死算一通,以期熟能生巧。
现在,让我们暂时忘掉行列式,或者干脆假设它只是小说家杜撰出的一个莫名其妙的概念,以此来重新定义矩阵的秩。当然到了最后,为了让读者信服新定义其实与基于行列式计算的旧定义殊途同归,我们将再请行列式“复活回归”,举杯共贺对“秩”的新解释。
在进入下面的数学讨论之前,我们先做两点说明。首先,为了与笔者此前文章保持一致,本文将继续采用泛函分析中的通用术语“线性算子”(linear operator),而不用常见的“线性映射”(linear map,如前述阿克斯拉教授的著作)或“线性变换”(linear transformation,见多数线性代数教科书)。其次,和以前一样,我们只在实数范围内谈论矩阵,当然文中的结果对复矩阵甚至一般数域上的矩阵也成立。照常,符号R代表实数集。
既然矩阵是上下左右排列整齐、有几行几列的一组数,它免不了要和只有一行的数组(称为行向量)和只有一列的数组(称为列向量)发生联系。某个向量中的分量个数如果是n,
线性相关与基底
有了上面的预备知识,我们现在着手建立矩阵秩的概念。不过在此之前,必须先掌握线性代数中另一个关键概念。先看一个示例,给出三个向量
x=(1, 2, 3), y=(1, 1, 1), z=(0, 1, 2).
通过简单的观察可以发现,x减去y恰好就是z,即z = x – y。等式的左端只有一个单独的向量,而右端是另外两个向量的某种组合。因为这种组合是将一个向量组中的向量乘以常数系数(本例中是1和-1)再求和的结果,所以我们说这是一个线性组合,即向量z是向量x和y的线性组合。现在,我们将这个线性组合的关系式z = x - y改写成一边只剩零向量的形式:
1x+(-1)y+(-1)z=0,
注意到三个向量x,y,z前面的系数不全为0(事实上就此例而言,它们都不为0)。这时我们说给定的向量x,y,z线性相关。
接下来,我们考察这三个向量中的前两个x和y,看一看它们是否也线性相关——是否存在两个不全为0的数α和β,满足等式αx +βy = 0。将x和y的分量代入,简单的代数运算给出下面关于未知数α和β的一个线性方程组:
α+β=0, 2α+β=0, 3α+β=0.
它只有平凡解,即零解α = 0, β = 0。这说明,使得线性组合αx +βy等于零向量的系数α和β只能全为0。换言之,两向量x和y不像上面的x,y,z那样是线性相关的。这个时候我们说向量x和y是线性无关或线性独立的。
读懂了上面的例子,下面关于线性相关或线性无关的定义就不难理解了。由于涉及多个向量,我们不再使用x,y,z,而是改用带下标的字母v表示向量,这里的v是英文单词vector
可由有限个向量张成,则说它是有限维的,否则称为无限维的(例如,所有多项式组成的向量空间就是无限维的)。线性代数研究有限维向量空间,而把无限维向量空间留给泛函分析去探讨。
从上两段中的定义,易得下面五个有用的简单事实:
(1)若一组向量包含零向量,则它们必定线性相关;
(2)若一组向量线性无关,则去掉其中任意一个向量,所剩向量也线性无关;
(3)若一组向量线性相关,则加进任意一个向量后也线性相关;
(4)若一个向量是其他几个向量的线性组合,则所有这些向量线性相关;
(5)在一个向量空间的张成集中,如果某个向量是集内其他向量的线性组合,那么该张成集去掉此向量后,剩余向量依然张成同一个向量空间。
底,那么l = k。这个结论当然正确,下面对此作出证明。
我们只需论证k≤l就够了,因为互换这两个基底便推出l≤k,从而得证l = k。事实上,我们可以证明更一般的命题:
好证明的读者可以将它们一一证出:
(6)k维向量空间M中的k个线性无关向量构成M的一个基底。
(7)k维向量空间M中,由k个向量组成的M的张成集是M的一个基底。
为什么矩阵的行秩等于列秩?
如上的讨论顺便回答了文章标题提出的问题:
定理. 矩阵的行秩等于列秩。
定义. 矩阵的行秩或列秩称为矩阵的秩。
通过行列式学过矩阵秩的读者自然会问最后一个问题:你们定义的秩等于我们的教科书中定义的秩吗?回答是,是的,它们是同一个整数。但在这里,我们不打算细致讨论行列式与矩阵秩的关系,因为这些关系相当地繁琐,这里就不赘述了。但是,只要考虑可逆矩阵A这一特殊但并不太失一般性的情形,还是能洞察到用“最大非零子式阶数”和用“线性无关张成集向量个数”这两种方法定义矩阵秩的等价性。
推出detA≠0。因为detA是A的最大阶数的非零子式,根据同济大学《线性代数》中的定义,A的秩等于n。
尾声
笔者写作此文的一个动机,来自李天岩教授在《回首来时路》(原载台湾《数学传播》杂志,2011年转载于《数学文化》杂志)中的一段话:
“我经常举的一个例子是,我对一个矩阵的‘行秩’和‘列秩’为什么会相等的好奇。其实在任何基本的线性代数书里,我们都可以找到它们为什么相等的证明。但是从那些逻辑推理的外表,我实在看不出它们为什么会巧合地相等。在我真正了解到它们为什么会一样的过程中,这个好奇却帮我了解了许多广义逆矩阵的几何意义。”
今年是笔者之一的博士论文导师李天岩教授逝世五周年及八十周年诞辰。我们撰写这篇科普文章,不仅试图以广义逆算子的思想解释为何“行秩等于列秩”,也是为了纪念他追求数学思想、授业解惑带徒的灿烂一生。
完稿于2025年10月27日星期一
注:本文封面图片来自版权图库,转载使用可能引发版权纠纷。
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。



返朴官方账号



