简单整理,思想不多。
代数余子式的正交性让我们在求矩阵的逆的时候得到了伴随矩阵:
$$ A^*A = \det(A) \cdot I $$
也就是说,我们可以如此求出 $A$ 的逆:
$$ A^{-1} = \frac{1}{\det(A)} \cdot A^* $$
或者,也可以反过来求伴随矩阵:
$$ A^* = \det(A) \cdot A^{-1} $$
那我们就可以基于此研究研究伴随矩阵的性质,比如他的行列式:
$$ \det(A^*) = \det(A)^n \cdot \det(A^{-1}) = \det(A)^{n-1} $$
套娃,伴随矩阵的伴随矩阵:
$$ (A^*)^* = \det(A^*) \cdot (A^*)^{-1} $$
不难发现 $A \cdot \frac{1}{\det(A)}$ 就是 $(A^*)^{-1}$, 代入得到:
$$ (A^*)^* = \det(A)^{n-2} \cdot A $$
是件有趣的事情。
伴随矩阵可以用来证明Cayley-Hamilton定理,尽管有点神秘:
设 $A$ 是 $n$ 阶方阵,其特征多项式为:
$$ p(\lambda) = \det(\lambda I - A) = \lambda^n + c_{n-1}\lambda^{n-1} + \dots + c_1\lambda + c_0 $$
定理断言:若将矩阵 $A$ 代入该多项式,结果为零矩阵,即:
$$ p(A) = A^n + c_{n-1}A^{n-1} + \dots + c_1A + c_0I = O $$
**证明:** 为了联系起矩阵和特征多项式,我们也许会想到伴随矩阵,对于矩阵 $M = \lambda I - A$,有:
$$ (\lambda I - A) \cdot (\lambda I - A)^* = \det(\lambda I - A) \cdot I $$
伴随矩阵显然是 $\lambda$ 不超过 $n-1$ 阶的多项式:
$$ (\lambda I - A)^* = B_{n-1}\lambda^{n-1} + B_{n-2}\lambda^{n-2} + \dots + B_1\lambda + B_0 $$
将展开式代入恒等式:
$$ (\lambda I - A)(B_{n-1}\lambda^{n-1} + B_{n-2}\lambda^{n-2} + \dots + B_0) = (\lambda^n + c_{n-1}\lambda^{n-1} + \dots + c_0)I $$
展开左侧并按 $\lambda$ 的幂次排列:
$$ B_{n-1}\lambda^n + (B_{n-2} - AB_{n-1})\lambda^{n-1} + (B_{n-3} - AB_{n-2})\lambda^{n-2} + \dots + (B_0 - AB_1)\lambda - AB_0 $$
对比左右两边相同幂次的系数矩阵:
- $\lambda^n: B_{n-1} = I$
- $\lambda^{n-1}: B_{n-2} - AB_{n-1} = c_{n-1}I$
- $\lambda^{n-2}: B_{n-3} - AB_{n-2} = c_{n-2}I$
- …
- $\lambda^1: B_0 - AB_1 = c_1I$
- $\lambda^0: -AB_0 = c_0I$
为了构造 $p(A)$,我们将上述等式依次左乘 $A^n, A^{n-1}, \dots, A, I$:
- $A^n(B_{n-1}) = A^n$
- $A^{n-1}(B_{n-2} - AB_{n-1}) = c_{n-1}A^{n-1}$
- $A^{n-2}(B_{n-3} - AB_{n-2}) = c_{n-2}A^{n-2}$
- …
- $A(B_0 - AB_1) = c_1A$
- $I(-AB_0) = c_0I$
将这 $n+1$ 个等式全部相加。你会惊喜地发现,左边所有的 $B_i$ 项都形成了消去项(例如 $A^{n-1}B_{n-2}$ 与下一项中的 $-A \cdot A^{n-2}B_{n-2}$ 抵消)。
最后左边结果为 $O$,右边恰好是 $p(A)$:
$$ O = A^n + c_{n-1}A^{n-1} + \dots + c_1A + c_0I $$
证毕。
虽然和伴随矩阵无关,我们还是给出另一种证明,稍微自然一点:
我们知道,复矩阵总可以相似于一个上三角阵,这可以归纳得到。于是我们设其相似于 $U$,那么我们只需要证明:
$$ \prod_{i=1}^n (\lambda_i I - U) = (\lambda_1 I - U)(\lambda_2 I - U)\cdots(\lambda_n I - U) = O $$
首先,显然 $n=1$ 时成立,那么假设对 $n-1$ 阶成立,我们有:
$$ \underbrace{\begin{pmatrix} 0 & x \\ \mathbf{0} & X \end{pmatrix}}_{\text{第 } 1 \text{ 个因子 }(U- \lambda_1 I) } \times \underbrace{\begin{pmatrix} \lambda_1 & y \\ 0 & O \end{pmatrix}}_{\text{其他因子的乘积 } } = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix} $$
这就证明了结论,简短美丽得多。