秩 (线性代数)

线性代数中,一个矩阵 的列秩是列向量生成的最大线性无关组的向量个数。类似地,行秩是矩阵线性无关的横行的个数。矩阵的列秩和行秩总是相等的,因此它们可以简单地称作矩阵 Rank)。通常表示为

线性代数
向量 · 向量空间 · 基底  · 行列式  · 矩阵

可替代定义

用行列式定义

   矩阵。若   至少有一个   阶非零子式,而其所有   阶子式全为零,即矩阵的最高阶非零子式的阶数为r。则称    的秩。

用向量组的秩定义

对于  线性空间   中的一个向量组  ,若   中的   个向量线性无关,且若      个向量都线性相关,则称   极大线性无关组  。可以证明   的秩等于向量组   生成的子空间的维数。 矩阵  列秩定义为   的列向量组的秩,也即矩阵的列空间的维数。类似地,矩阵的行秩定义为   的行向量组的秩,即矩阵的行空间的维数。

用线性映射定义

考虑线性映射

 
 

对于每个矩阵    都是一个线性映射,同时,对每个   的 线性映射  ,都存在矩阵  使得  。也就是说,映射

 
 

是一个同构映射。所以一个矩阵   的秩还可定义为   的像的维度(像与核的讨论参见线性映射)。矩阵   称为  变换矩阵。这个定义的好处是适用于任何线性映射而不需要指定矩阵,因为每个线性映射有且仅有一个矩阵与其对应。秩还可以定义为  的维度;秩-零化度定理声称它等于   的像的维度。

行秩列秩相等性

矩阵的行秩与列秩相等,是线性代数基本定理的重要组成部分。其基本证明思路是,矩阵可以看作线性映射的变换矩阵,列秩为像空间的维度,行秩为非零原像空间的维度,因此列秩与行秩相等,即像空间的维度与非零原像空间的维度相等(这里的非零原像空间是指约去了零空间后的商空间:原像空间)。这从矩阵的奇异值分解就可以看出来。

给出这一结果的两种证明. 第一个证明是简短的,仅用到向量的线性组合的基本性质. 第二个证明利用了正交性[1]. 第一个证明利用了列空间的基, 第二个证明利用了行向量空间的基. 第一个证明适用于定义在标量域上的矩阵,第二个证明适用于内积空间。二者都适用于实或复的欧氏空间,也都易于修改去证明当A是线性变换的情形.

证明一

  是一个   的矩阵,其列秩为   . 因此矩阵   的列空间的维度是   . 令    的列空间的一组基,构成   矩阵  的列向量  ,并使得   的每个列向量是    个列向量的线性组合. 由矩阵乘法的定义,存在一个   矩阵  , 使得  . (   元素是    的第   个行向量的点积.)

现在,由于  ,   的每个行向量是   的行向量的线性组合,这意味着   的行向量空间被包含于   的行向量空间之中. 因此   的行秩 ≤  的行秩. 但 仅有 行, 所以 的行秩 ≤   =  的列秩. 这就证明了 的行秩 ≤  的列秩.

把上述证明过程中的“行”与“列”交换,利用对偶性质同样可证 的列秩 ≤  的行秩。更简单的方法是考虑 的转置矩阵 ,则 的列秩 =  的行秩 ≤  的列秩 =  的行秩. 这证明了 的列秩等于 的行秩. 证毕.

证明二

  矩阵,其行秩是 . 因此 的行向量空间的维度是 ,设  的行向量空间的一组基. 如果把这组基当作原像列向量看待,则向量集 是线性独立的。 这是因为对一组标量系数 ,如果:

 

其中 . 则可以推出有两个事实: (a)   行向量空间的线性组合, 即 属于 的行向量空间;(b) 由于  = 0,  正交于 的所有行向量,从而正交于 的行向量空间的所有向量. 事实(a)与(b)结合起来,则 正交于自身,这意味着  = 0. 由 的定义:

 

再由  的行向量空间的一组线性独立的基,可知 .  因而是线性独立的.

  的列空间中的向量. 因此  的列空间中 个线性独立的向量. 所以 的列向量空间的维数( 的列秩)必然不小于 . 这证明了 的行秩r ≤  的列秩. 把这一结果应用于 的转置矩阵可以得到:  的列秩 =  的行秩 ≤  列秩 =  的行秩. 这证明了 的列秩等于 的行秩,证毕.

最后, 还可以证明rk(A) = rk(A*), 其中A*A的共轭转置或称施密特转置. 当A的元素都是实数, 这一结果变为rk(A) = rk(AT). 然而对于复系数矩阵,rk(A) = rk(A*)并不等价于行秩等于列秩, 需要用到上述两个证明.

证明三

A是一个m×n矩阵. 定义rk(A)为A的列秩,A*A的共轭转置或称施密特转置. 首先可知A*Ax = 0当且仅当Ax = 0.

A*Ax = 0 ⇒ x*A*Ax = 0 ⇒ (Ax)*(Ax) = 0 ⇒ ‖Ax‖2 = 0 ⇒ Ax = 0,

其中‖·‖是欧氏范数. 这说明A的零空间与A*A的零空间相同. 由秩-零化度定理, 可得rk(A) = rk(A*A). A*A的每一个列向量是A*的列向量的线性组合. 所以A*A的列空间是A*的列空间的子空间. 从而rk(A*A) ≤ rk(A*). 即: rk(A) = rk(A*A) ≤ rk(A*). 应用这一结果于A*可获得不等式: 由于(A*)* = A, 可写作rk(A*) ≤ rk((A*)*) = rk(A). 这证明了rk(A) = rk(A*). 证毕.

性质

我们假定A是在域F上的m × n矩阵并描述了上述线性映射。

  • m × n矩阵的秩不大于m且不大于n的一个非负整数,表示為 rk(A) ≤ min(m, n)。有尽可能大的秩的矩阵被称为有满秩;类似的,否则矩阵是秩不足(或称为“欠秩”)的。
  • 只有零矩阵有秩0
  • A的秩最大为min(m,n)
  • f单射,当且仅当A有秩n(在这种情况下,我们称A有“列满秩”)。
  • f满射,当且仅当A有秩m(在这种情况下,我们称A有“行满秩”)。
  • 在方块矩阵A (就是m = n)的情况下,则A可逆的,当且仅当A有秩n(也就是A有满秩)。
  • 如果B是任何n × k矩阵,则AB的秩最大为A的秩和B的秩的小者。即:
     
    推广到若干个矩阵的情况,就是:
     
    证明:
    考虑矩阵的秩的线性映射的定义,令A、B对应的线性映射分别为fg,则AB表示复合映射f·g,它的象Im f·gg的像Im g在映射f作用下的象。然而Im g是整个空间的一部分,因此它在映射f作用下的象也是整个空间在映射f作用下的象的一部分。也就是说映射Im f·gIm f的一部分。对矩阵就是:秩(AB)≤秩(A)。
    对于另一个不等式:秩(AB)≤秩(B),考虑Im g的一组:(e1,e2,...,en),容易证明(f(e1),f(e2),...,f(en))生成了空间Im f·g,于是Im f·g维度小于等于Im g的维度。对矩阵就是:秩(AB)≤秩(B)。
    因此有:秩(AB)≤min(秩(A),秩(B))。若干个矩阵的情况证明类似。
    作为"<"情况的一个例子,考虑积
     
    两个因子都有秩1,而这个积有秩0。
    可以看出,等号成立当且仅当其中一个矩阵(比如说A)对应的线性映射不减少空间的维度,即是单射,这时A是满秩的。于是有以下性质:
    • 如果B是秩nn × k矩阵,则
       
    • 如果C是秩ml × m矩阵,则
       
  • A的秩等于r,当且仅当存在一个可逆m × m矩阵X和一个可逆的n × n矩阵Y使得
     
    这裡的Ir指示r × r 单位矩阵
    证明可以通过高斯消去法构造性地给出。
  • 西尔维斯特不等式: 如果 A 是一个 m × n 的矩阵且 Bn × k 的, 则
     [i]
    这是下一个不等式的特例.
  • 这个不等式是由Frobenius提出的: 如果 AB, ABCBC 有定义, 则
     [ii]
  • 子加性:当矩阵  的形状相同时,有  . 因此,一个秩为k的矩阵能够表示成k个秩为1的矩阵的加和,但不能是k-1个或更少。
  • 矩阵的秩加上矩阵的零化度等于矩阵的纵列数(这就是秩-零化度定理)。
  • 如果 A实数上的矩阵,那么 A 的秩和它对应格拉姆矩阵的秩相等。于是,对于实矩阵
     .
    该性质可以通过它们的零空间证明. 格拉姆矩阵的零空间由所有满足  的向量 组成。如果上式成立, 那么下式也成立:  ,于是, ,即  的零空间相同.[2]
  • 如果 A复数上的矩阵且 A* 表示 A 的共轭转置(i.e., A 伴随), 则
     

向量组的线性相关性

  维列向量排列成 的矩阵A,这个对应矩阵的秩即为原向量组的秩。

原向量组线性相关的充分必要条件为:

 

如果

 

则向量组线性无关。另外,不存在

 

特殊的,若向量的个数 大于向量的维数 ,则根据:

 

这个向量组必然线性相关。

计算

计算矩阵A的秩的最容易的方式是高斯消去法,即利用矩阵的初等变换生成一个行阶梯形矩阵,由于矩阵的初等变换不改变矩阵的秩,因此A的行阶梯形矩阵有同A一样的秩。经过初等变换的矩阵的非零行的数目就是原矩阵的秩。

例如考虑4 × 4矩阵

 

我们看到第2纵列是第1纵列的两倍,而第4纵列等于第1和第3纵列的总和。第1和第3纵列是线性无关的,所以A的秩是2。这可以用高斯算法验证。它生成下列A的行阶梯形矩阵:

 

它有两个非零的横行。

在应用在计算机上的浮点数的时候,基本高斯消去(LU分解)可能是不稳定的,应当使用秩启示(revealing)分解。一个有效的替代者是奇异值分解(SVD),但还有更少代价的选择,比如有支点(pivoting)的QR分解,它也比高斯消去在数值上更强壮。秩的数值判定要求对一个值比如来自SVD的一个奇异值是否为零的依据,实际选择依赖于矩阵和应用二者。

应用

计算矩阵的秩的一个有用应用是计算线性方程组解的数目。如果系数矩阵的秩等于增广矩阵的秩,则该方程组有解。在这种情况下,如果它的秩等于方程的数目那么该方程组有唯一的一个精确解。如果增广矩阵的秩大于系数矩阵的秩,则方程组是不一致(Inconsistent)的。

控制论中,矩阵的秩可以用来确定线性系统是否为可控制的,或可观察的。

註解

  1. ^ 证明: 对不等式 使用秩-零化度定理
  2. ^ 证明:商空间之间的映射C: ker(ABC) / ker(BC) → ker(AB) / ker(B)有定义且为单射。因此我们得到了关于核维数关系的不等式dim ker(ABC)-dim ker(BC) ≤ dim ker(AB) - dim ker(B), 利用秩-零化度定理即可得到结论(即dim ker(ABC)-dim ker(BC)=rank(BC)-rank(ABC), 右边同理)。或者也可以这么证明:假如M是一个子线性空间,A是线性映射,那么dim(A(M)) ≤ dim(M) (*); 记映射BC(注意先进行C映射后进行B映射)的像为im(BC), 映射B的像为im(B), 则im(BC)⊆im(B), 取im(B)中im(BC)的正交补(不一定要正交,构成直和关系即可,这里取正交补只是为了方便)记为D, 则dim(D) = rk(B) – rk(BC); 而由线性映射的规律知im(AB) = AD + im(ABC), 但不一定再是直和,即dim(AD) + rk(ABC) ≥ rk(AB), 利用不等式(*)可得dim(D)[=rk(B) – rk(BC)] + rk(ABC) ≥ rk(AB), 从而得证。

参考文献

  1. ^ Mackiw, G. (1995). A Note on the Equality of the Column and Row Rank of a Matrix. Mathematics Magazine, Vol. 68, No. 4
  2. ^ Mirsky, Leonid. An introduction to linear algebra. Dover Publications. 1955. ISBN 978-0-486-66434-7. 
  • Horn, Roger A. and Johnson, Charles R. Matrix Analysis. Cambridge University Press, 1985. ISBN 978-0-521-38632-6.
  • Kaw, Autar K. Two Chapters from the book Introduction to Matrix Algebra: 1. Vectors [1] and System of Equations [2]

参见