矩阵的若尔当标准型

500

当一个方阵无法对角化时,我们还能将它简化到怎样的程度?这是线性代数中一个自然又深刻的问题。本文围绕上述疑问展开,介绍了若尔当标准型——它是方阵在相似变换下所能达到的"最简形式",也是最接近对角矩阵的标准结构。

无论你是初学线性代数的学生,还是希望重温这一经典课题的数学爱好者,本文都将带你一窥矩阵内涵的简洁之美。

撰文 | 朱慧坚(广州南方学院数学与统计学院副教授)、丁玖(广州南方学院数学与统计学院教授)

关于矩阵,我们近来已经写了几篇文章,如特征值问题、矩阵可对角化的充分必要条件,以及可对角化的几类矩阵,如实对称矩阵和正交矩阵。然而,当一个方阵不可对角化时,或者等价地说,该矩阵至少有一个特征值的代数重数大于几何重数时,可提的一个数学问题是:通过

500500

对于长成这番模样的矩阵,以及与它们具有相似关系的其他矩阵,其背后暗藏着怎样的玄机?本文旨在揭开这类矩阵的神秘面纱:在我们熟知的特征值与特征向量背后,还隐藏着一类"广义特征向量"。它们与普通特征向量一起,如同一根根立柱,共同支撑起矩阵内部结构最简洁的呈现形式——"若尔当标准型"。由于一般矩阵在实数范围内可能没有实特征值,下面的讨论都是在复数域中进行。

广义特征向量

500500

若尔当块与若尔当链

500500500500

若尔当块数量公式

到目前为止,为介绍若尔当矩阵标准型的基本思想起见,仅对所得到的标准型只有一个若尔当块的那些矩阵开发出了一个相似变换化简程式。这类矩阵仅有一个特征值,它的代数重数自然

500

即,计算公式(6)给出本例矩阵标准型各阶若尔当块的个数。

几乎所有的矩阵都不会是这么特殊的,所以需要继续挖掘标牌为"若尔当"的矩阵数学金矿。然而,为了让读者稍稍放松一下思考中的神经,先离开线性代数的主题,从近代欧洲的数学史中稍稍了解一下若尔当这位十九世纪杰出法国数学家的简历。

卡米尔·若尔当(Camille Jordan,1838-1922)以与伽罗瓦群有关的基础性研究和教科书《巴黎综合理工学院分析教程》而闻名于世,但他的半生职业却是工程师。后来他在综合理工和法兰西学院教书。他在分析学中最著名的工作是复分析中需要用到的一个拓扑结果"若尔当曲线定理",即该闭曲线将平面分为以曲线为共同边界的有界"内部"和无界"外部";这几何上看似直观,却非显然。若尔当矩阵是他留给线性代数这门当今大数据时代最实用学科之一的重大遗产。若尔当于 1870 年首次提出了现以他名字命名的矩阵标准型。

若尔当矩阵

下面将考虑一般方阵的若尔当标准型问题。这时,所给矩阵通常有相异的特征值,并且每个特征值的几何重数可以是不大于代数重数的任意正整数。因而可以想象它的这个"最简结构"通常含有若干个若尔当块。在进一步的讨论前,先引进若尔当型矩阵的正式定义。

定义. 主对角块是若尔当块的一个块对角方阵 被称为是若尔当矩阵。

由于若尔当矩阵中的若尔当块都是上三角矩阵,而且每个若尔当块只有一个特征值,它就是主对角线上共同的常数,故若尔当矩阵所有特征值的全体,若按代数重数排列,则与所有若尔当块的主对角元一一对应。这里提醒读者注意,不同若尔当块的主对角元可能相同,或言之,每个相异特征值都有可能"携带"一个或几个主对角元都等于这个特征值但尺寸却可以不一的若尔当块,全依这个特征值的"级别"而定。这就像国际航空公司的"常旅客计划"会员制,普通会员只能免费托运一件行李,金卡会员却可以免费托运两件行李,而最高级别的钻石会员则能享受到最高礼遇:免费托运三件行李。正是由于这个待遇,笔者之一去年退休回国时,三件托运行李中的一只帆布大包,装进了几十年教学生涯中收集保存的近百本《美国数学月刊》,赠送给了新近成立的广州南方学院数学与统计学院。希望这一批拥有全世界读者最多人数、文字与数学均编辑得极为专业、几近完美的阐述性数学期刊,能给今年秋季入学的"创院首届生"留下难以磨灭的数学阅读记忆。

有了上述若尔当矩阵的定义,我们可以进而讨论怎样将一般方阵通过相似变换尽可能地化简到一个最靠近对角矩阵的"极简矩阵";这就是它所对应的"若尔当标准型"——若尔当矩阵。作为证明这个标准型存在性定理的先期准备,我们再考虑一种方阵,巩固读者对若尔当链和若尔当块的印象。新的矩阵比之前的要求稍微少了一点限制。

500500

若尔当标准型定理

然而,具体地将所有的若尔当链都提取出来,对一般矩阵而言,写出详细的构造性证明是一项颇为繁琐的工作。在包含若尔当矩阵的书籍中,若尔当矩阵标准型定理的证明都有好几页的篇幅,有的需要若干个引理的预备结果。比如美国矩阵理论行家霍恩和约翰逊在他们合著的内容洋洋大观的《矩阵分析》的第三章第一节专讲若尔当标准型定理,借助于舒尔定理"任意复方阵酉相似于上三角矩阵",先证明了这个上三角矩阵又相似于一个块对角上三角矩阵,其中每个对角块都有相等的对角元素,继而证明有相等对角元素的上三角矩阵相似于一个若尔当矩阵。这个过程复杂而冗长。1971 年,苏联数学家菲利波夫(Aleksei F. Filippov,1923-2006)发表了一个精巧的证明,其对若尔当标准型的归纳法构造思路,被美国麻省理工学院的数学家斯特朗(Gilbert Strang,1934-)在他的教科书《线性代数及其应用》的附录 B 中称为"可能是最清晰简单的",并把它放进了自己的著作里。

这里,为缩短本文篇幅起见,跟随菲利波夫思路,用数学归纳法证明

若尔当标准型定理. 任何复方阵相似于一个若尔当矩阵。

500500500500

若尔当标准型的计算步骤

500500500

若尔当标准型的应用

一般方阵的若尔当标准型给出了在相似变换下,该矩阵能够达到的最简形式。它保持原矩阵的特征多项式不变,也继承了特征值及其代数重数和几何重数。对于可对角化的矩阵,若尔当标准型的外形是对角矩阵。在许多涉及矩阵的问题中,将矩阵化约成对应的若尔当标准型,不仅有可能使得分析和计算更易进行,甚至在某些方面是唯一可行的求解方案。这里给出两个应用例子,一个早就写进了教科书,另一个则是十多年来的研究论题。

500500

十五年前,当笔者之一读到杨振宁先生的访谈录并初步认识到杨-巴克斯特方程与辫群、扭结理论等数学学科的关系后,心中冒出奇想:姑且不论该方程在物理中的重要意义,即便仅仅考察与它具有同一形式的如上矩阵方程,说不定是一件满足好奇心的快事。说干就干,先手工求

500500

矩阵的若尔当标准型揭示出了矩阵的基本性质,其外在表现是特征值、特征向量及其广义特征向量。由于将有限维向量空间映射到自身的线性算子,在任一被选定的空间基底下有且仅有一个"坐标表示",它就是线性算子的矩阵化。通过这个矩阵的若尔当标准型,人们可以将该线性算子分解成更为简单的"子算子",使得原先算子的关键内涵暴露无遗,易被充分理解。

最后,我们简单提及矩阵若尔当标准型在通常的大学本科线性代数教材中不大涉及的"矩阵的解析理论"中的一个应用。这个解析理论可使人人都会直接计算的矩阵多项式跃进到傍上微积

500

致谢:《返朴》周舒义编辑发现了文中六阶矩阵例子的计算错误并修改之,特此致谢!

注:本文封面图片来自版权图库,转载使用可能引发版权纠纷。

500

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2.『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。

版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。

站务

最近更新的专栏

全部专栏