可對角化矩陣

線性代數
	向量 · 向量空間 · 基底 · 行列式 · 矩陣
向量
	純量 · 向量 · 向量空間 · 向量投影 · 外積（叉積 · 七維叉積） · 內積（點積） · 二重向量
矩陣與行列式
	矩陣 · 行列式 · 線性方程組 · 秩 · 核 · 跡 · 單位矩陣 · 初等矩陣 · 方塊矩陣 · 分塊矩陣 · 三角矩陣 · 非奇異方陣 · 轉置矩陣 · 逆矩陣 · 對角矩陣 · 可對角化矩陣 · 對稱矩陣 · 反對稱矩陣 · 正交矩陣 · 么正矩陣 · 埃爾米特矩陣 · 反埃爾米特矩陣 · 正規矩陣 · 伴隨矩陣 · 余因子矩陣 · 共軛轉置 · 正定矩陣 · 冪零矩陣 · 矩陣分解（LU分解 · 奇異值分解 · QR分解 · 極分解 · 特徵分解） · 子式和餘子式 · 拉普拉斯展開 · 克羅內克積
線性空間與線性變換
	線性空間 · 線性變換 · 線性子空間 · 線性生成空間 · 基 · 線性映射 · 線性投影 · 線性無關 · 線性組合 · 線性泛函 · 行空間與列空間 · 對偶空間 · 正交 · 特徵向量 · 最小二乘法 · 格拉姆-施密特正交化
	閱; 論; 編;

可對角化矩陣是可化簡為對角矩陣的方陣。矩陣對角化後大幅降低了某些屬性的計算難度，比如其行列式就是對角線上所有數字的乘積，而對角線上的數字就是其特徵值。

可對角化也使該線性變換的幾何意義更直觀，因為每個線性變換都可以對應到一個矩陣，所以將矩陣對角化等價於找到一組基底，使的線性變換的作用僅僅是伸縮基底向量而已。類似的，若用對角矩陣表示差分方程組或者微分方程組的系數的話，這樣每條等式只含有一個未知函數，這樣也大幅度了化簡了方程式的難度。

若爾當-謝瓦萊分解表達一個算子為它的對角部分與它的冪零部分的和。

正式定義

定義 — $A\in K^{n\times n}$ 是一個定義在純量域 $K$ 上的 $n$ 階方陣，若存在一個 $n$ 階的可逆方陣 $P\in K^{n\times n}$ 使得

P^{-1}AP

是對角矩陣，則 $A$ 就被稱為可對角化的。

可對角化的線性映射

定義 — $V$ 與 $W$ 是定義在同個純量域 $K$ 上，且維度相等的向量空間，若存在 $V$ 的某基底 ${\mathfrak {B}}_{V}$ 和 $W$ 的某基底 ${\mathfrak {B}}_{W}$ ，使線性映射 $T:V\to W$ 對應的矩陣 $\mathbf {T} ={[T]}_{{\mathfrak {B}}_{W}}^{{\mathfrak {B}}_{V}}$ 是對角的，那線性映射 $T$ 也會被稱為可對角化的。

特徵化

關於可對角化映射和矩陣的基本事實可表達為如下:

在域 F 上的 n × n 矩陣 A 是可對角化的，若且唯若它的特徵空間的和的維度等於 n，它為真若且唯若存在由 A 的特徵向量組成的 Fⁿ 的基。如果找到了這樣的基，可以形成有基向量作為縱列的矩陣 P，而 P^-1AP 將是對角矩陣。這個矩陣的對角元素是 A 的特徵值。
線性映射 T : V → V 是可對角化的，若且唯若它的特徵空間的維度等於 dim(V)，它為真若且唯若存在由 T 的特徵向量組成的 V 的基。T 關於這個基將表示為對角矩陣。這個矩陣的對角元素是 T 的特徵值。

另一個特徵化: 矩陣或線性映射在域 F 上可對角化的，若且唯若它的極小多項式在 F 上有不同的線性因子。

下列充分(但非必要)條件經常是有用的。

n × n 矩陣 A 只在域 F 上可對角化的，如果它在 F 中有 n 個不同的特徵值，就是說，如果它的特徵多項式在 F 中有 n 個不同的根。
線性映射 T : V → V 帶有 n=dim(V) 是可對角化的，如果它有 n 個不同的特徵值，就是說它的特徵多項式在 F 中有 n 個不同的根。

作為經驗規則，在複數域 C 上幾乎所有矩陣都是可對角化的。更精確地說: 在 C 上不可對角化的複數 n × n 矩陣的集合被當作 C^n×n 的子集，它是關於勒貝格測度的零集。也可以說可對角化矩陣形成了關於扎里斯基拓撲的稠密子集 : 補位於特徵多項式的判別式變為零的集合內，後者是超平面。從中得出的還有在平常的(強拓撲)中密度由範數給出。

對於 R 域就不是這樣了。隨着 n 增長，隨機選擇的實數矩陣是在 R 上可對角化的可能性越來越小。

例子

可對角化矩陣

對合在實數上(甚至特徵不是 2 的任何域)是可對角化的，帶有 1 和 -1 在對角線上。
有限階自同態(包括對合)是在複數，或域的特徵不整除自同態的階的任何代數閉合域(因為單位一的根是不同的)是可對角化的，帶有單位根在對角線上。這是循環群的表示理論的一部分。
投影是可對角化的，帶有 0 和 1 在對角線上。

非可對角化的矩陣

某些矩陣在任何域上都是不可對角化的，最著名的是冪零矩陣。如果特徵值的幾何重次和代數重次不一致，這會更一般的出現。例如考慮

C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}

這個矩陣是不可對角化的: 沒有矩陣 U 使得 $U^{-1}CU$ 是對角矩陣。實際上，C 有一個特徵值(就是零)而這個特徵值有代數重次 2 和幾何重次 1。

某些實數矩陣在實數上是不可對角化的。例如考慮

B={\begin{bmatrix}0&1\\-1&0\end{bmatrix}}

矩陣 B 沒有任何實數特徵值，所以沒有實數矩陣 Q 使得 $Q^{-1}BQ$ 是對角矩陣。但是如果允許複數的話， $B$ 仍可以對角化。實際上，如果我們取

Q={\begin{bmatrix}1&{\textrm {i}}\\{\textrm {i}}&1\end{bmatrix}}

則 $Q^{-1}BQ$ 是對角的。

矩陣對角化的方法

考慮矩陣

A={\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{bmatrix}}

這個矩陣有特徵值

\lambda _{1}=3,\quad \lambda _{2}=2,\quad \lambda _{3}=1

所以 A 是有三個不同特徵值的 3 × 3 矩陣，所以它是可對角化的。

如果我們要對角化 A，我們需要計算對應的特徵向量。它們是

v_{1}={\begin{bmatrix}-1\\-1\\2\end{bmatrix}}\quad v_{2}={\begin{bmatrix}0\\0\\1\end{bmatrix}}\quad v_{3}={\begin{bmatrix}-1\\0\\2\end{bmatrix}}

我們可以輕易的驗證 $Av_{k}=\lambda _{k}v_{k}$ 。

現在，設 P 是由這些特徵向量作為縱列的矩陣:

P={\begin{bmatrix}-1&0&-1\\-1&0&0\\2&1&2\end{bmatrix}}

則 P 對角化了 A，簡單的計算可驗證:

P^{-1}AP={\begin{bmatrix}0&-1&0\\2&0&1\\-1&1&0\end{bmatrix}}{\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{bmatrix}}{\begin{bmatrix}-1&0&-1\\-1&0&0\\2&1&2\end{bmatrix}}={\begin{bmatrix}3&0&0\\0&2&0\\0&0&1\end{bmatrix}}

注意特徵值 $\lambda _{k}$ 出現在對角矩陣中。

應用

對角化可被用來有效的計算矩陣 A 的冪，假如矩陣是可對角化的。比如我們找到了

P^{-1}AP=D\

是對角矩陣，因為矩陣的積是結合的，

{\begin{aligned}A^{k}&=(PDP^{-1})^{k}=(PDP^{-1})\cdot (PDP^{-1})\cdots (PDP^{-1})\\&=PD(P^{-1}P)D(P^{-1}P)\cdots (P^{-1}P)DP^{-1}=PD^{k}P^{-1}\end{aligned}}

而後者容易計算，因為它只涉及對角矩陣的冪。

在找到線性遞歸序列比如斐波那契數列的項的閉合形式的表達中這是非常有用的。

特定應用

例如，考慮下列矩陣:

M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}

計算 M 個各次冪揭示了一個驚人的模式:

M^{2}={\begin{bmatrix}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatrix}},\quad M^{3}={\begin{bmatrix}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatrix}},\quad M^{4}={\begin{bmatrix}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatrix}},\quad \ldots

上面的現象可以通過對角化 M 來解釋。要如此我們需要由 M 的特徵向量組成的 R² 的基。一個這樣的特徵向量基給出自

\mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix}1\\1\end{bmatrix}}=\mathbf {e} _{1}+\mathbf {e} _{2}

這裏的 e_i 指示 Rⁿ 的標準基。逆的基變更給出自

\mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u}

直接計算證實

M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v}

所以，a 和 b 是分別是對應於 u 和 v 的特徵值。根據矩陣乘法的線性，我們有

M^{n}\mathbf {u} =a^{n}\,\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\,\mathbf {v}

切換回標準基，我們有

M^{n}\mathbf {e} _{1}=M^{n}\mathbf {u} =a^{n}\mathbf {e} _{1}

M^{n}\mathbf {e} _{2}=M^{n}(\mathbf {v} -\mathbf {u} )=b^{n}\mathbf {v} -a^{n}\mathbf {u} =(b^{n}-a^{n})\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}

前面的關係用矩陣形式表達為

M^{n}={\begin{bmatrix}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatrix}}

因此解釋了上述現象。

參見

外部連結

Diagonalization. PlanetMath.

引用

Roger A. Horn and Charles R. Johnson, Matrix Analysis, Chapter 1, Cambridge University Press, 1985. ISBN 0-521-30586-1 (hardback), ISBN 0-521-38632-2 (paperback).