在之前,我们已经把线性变换分割成了不变子空间,并考虑了其上的限制映射和诱导映射,而根子空间给出的分解让限制映射有一个非常好的性质,对限制在根子空间 $Ker(A-\lambda I)^r$的映射$A$,我们构造$B=(A-\lambda I)|_W$ 有
$$ \mathcal{B}^r \alpha = ((\mathcal{A} - \lambda I)|_W)^r \alpha = (\mathcal{A} - \lambda I)^r \alpha $$
其中 $\alpha \in Ker(A-\lambda I)^r$,从而$B^r=0$ 。也就是说这是个幂零矩阵,所以我们只需要研究幂零变换,就可以知道一般变换的性质。
幂零变换 (Nilpotent Endomorphism)
设 $\mathbf{B} \in \text{Hom}(V)$。若有正整数 $t$使得$\mathbf{B}^t = 0$,则称 $\mathbf{B}$是幂零变换。使$\mathbf{B}^t = 0$成立的最小指数$t$称为$\mathbf{B}$ 的幂零指数。
幂零变换 $\mathbf{B}$的最小多项式是$x^t$。
幂零变换的循环子空间
对幂零变换,我们仍然找循环子空间。
任给 $\alpha \neq 0$,总有 $r \geq 1$,使得 $\mathbf{B}^{r-1}\alpha \neq 0, \mathbf{B}^r\alpha = 0$。
则
$$ Z(\alpha, \mathbf{B}) = \langle \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha \rangle $$
是 $\mathbf{B}$-子空间,称为由 $\alpha$ 生成的强循环子空间。
$$ \alpha, \mathbf{B}\alpha, \dots, \mathbf{B}^{r-1}\alpha $$
称为 $Z(\alpha, \mathbf{B})$ 的循环基,$\mathbf{B}^{r-1}\alpha$ 称为循环基的尾项,它在后面的证明中起到关键性作用。
我们可以证明这构成基,考虑线性组合
$$ \sum_i c_iB^i\alpha=0 $$
我们作用 $B^{r-1}$就只剩$c_0B^{r-1}\alpha=0$,只能$c_0=0$。如法炮制就得到所有系数为$0$ 。
若 $Z(\alpha, \mathbf{B}) = \langle \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha \rangle$是$r$维$\mathbf{B}$-强循环子空间,则有
$$ \mathbf{B}(\alpha \ \mathbf{B}\alpha \ \mathbf{B}^2\alpha \dots \mathbf{B}^{r-1}\alpha) $$
$$ = (\alpha \ \mathbf{B}\alpha \ \mathbf{B}^2\alpha \dots \mathbf{B}^{r-1}\alpha) \begin{bmatrix} 0 & 0 & 0 & \dots & 0 \\ 1 & 0 & 0 & \dots & 0 \\ 0 & 1 & 0 & \ddots & \vdots \\ \vdots & \vdots & \ddots & \ddots & 0 \\ 0 & 0 & \dots & 1 & 0 \end{bmatrix} $$
(矩阵为下三角形式,基向量按原序排列)
若 $Z(\alpha, \mathbf{B}) = \langle \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha \rangle$是$r$维$\mathbf{B}$-强循环子空间,则有
$$ \mathbf{B}(\mathbf{B}^{r-1}\alpha \ \mathbf{B}^{r-2}\alpha \dots \alpha) $$
$$ = (\mathbf{B}^{r-1}\alpha \ \mathbf{B}^{r-2}\alpha \dots \alpha) \begin{bmatrix} 0 & 1 & 0 & \dots & 0 \\ 0 & 0 & 1 & \dots & 0 \\ 0 & 0 & 0 & \ddots & \vdots \\ \vdots & \vdots & \vdots & \ddots & 1 \\ 0 & 0 & 0 & \dots & 0 \end{bmatrix} $$
(矩阵为上三角形式,循环基按降幂排列)

也就是说,不变子空间一定从某个幂次一直到 $r-1$ 次,中间不能断。
故 $r$维(强)循环子空间$Z(\alpha, \mathbf{B}) = \langle \alpha \ \mathbf{B}\alpha \dots \mathbf{B}^{r-1}\alpha \rangle$只有$r+1$个$\mathbf{B}$-不变子空间:
$$ Z(\alpha, \mathbf{B}) \supset Z(\mathbf{B}\alpha, \mathbf{B}) \supset Z(\mathbf{B}^2\alpha, \mathbf{B}) \supset \dots \supset Z(\mathbf{B}^{r-1}\alpha, \mathbf{B}) \supset \{0\} $$
这些循环基都有相同的尾项。
接下来,我们想要得到原来的变换,需要把一个个子空间拼起来,那自然就想到什么时候是直和。
循环子空间直和的条件
给定 $\alpha, \beta \in W$,怎样才能保证
$$ Z(\alpha, \mathbf{B}) + Z(\beta, \mathbf{B}) \text{ 是直和?} $$
即:如何保证向量组
$$ \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha $$
$$ \beta, \mathbf{B}\beta, \dots, \mathbf{B}^{s-1}\beta $$
线性无关?
引理:强循环子空间之和是直和的充要条件
结论: 强循环子空间之和是直和,当且仅当 循环基尾项线性无关。
证明思路 (Proof Sketch)
1. 布局:
若存在系数不全为零的组合使得线性组合为 $0$。将各组循环基按升幂写在不同行上,并按尾项上下对齐:
第一行:$\alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \mathbf{B}^3\alpha, \mathbf{B}^4\alpha$(假设尾项是$\mathbf{B}^4\alpha$)
第二行:$\beta, \mathbf{B}\beta, \mathbf{B}^2\beta, \mathbf{B}^3\beta$(假设尾项是$\mathbf{B}^3\beta$)
第三行:$\gamma, \mathbf{B}\gamma, \mathbf{B}^2\gamma$(假设尾项是$\mathbf{B}^2\gamma$)
2. 核心操作(作用算子 B):


$k$ 维循环基与尾项的性质
对于 $k$ 维循环基:
$$ \alpha, \mathbf{B}\alpha, \dots, \mathbf{B}^{k-1}\alpha \quad (\mathbf{B}^k \alpha = 0) $$
其尾项 $\mathbf{B}^{k-1}\alpha$ 具备双重身份:
属于像空间: $\mathbf{B}^{k-1}\alpha \in \text{Im} \mathbf{B}^{k-1}$(它是某个向量作用 $k-1$ 次算子后的结果)。
属于核空间: $\mathbf{B}^{k-1}\alpha \in \text{Ker} \mathbf{B}$(再作用一次 $\mathbf{B}$ 就归零了)。
因此,尾项位于这两个空间的交集之中:
$$ \mathbf{B}^{k-1}\alpha \in \text{Im} \mathbf{B}^{k-1} \cap \text{Ker} \mathbf{B} $$
空间序列的嵌套结构
设 $t$是算子$\mathbf{B}$的幂零指数(即$\mathbf{B}^t = 0$且$\mathbf{B}^{t-1} \neq 0$)。
我们可以定义一系列子空间 $W_k$,它们刻画了不同“长度”的循环基尾项所在的范围:
$$ W_k = \text{Im} \mathbf{B}^{k-1} \cap \text{Ker} \mathbf{B} $$
这些子空间构成了一个升序的嵌套链(Filtration):
$$ W_t = \text{Im} \mathbf{B}^{t-1} \subseteq W_{t-1} \subseteq \dots \subseteq W_2 \subseteq W_1 = \text{Ker} \mathbf{B} $$

同时,利用我们在商空间证明的
$$ \text{Im}\mathcal{A} \big/ (\text{Im}\mathcal{A} \cap \text{Ker}\mathcal{B}) \cong \text{Im}(\mathcal{BA}) $$
我们代入 $A=B^{k-1}$ 就得到
$$ dimImB^{k-1}-dim(ImB^{k-1}\cap KerB)=dimImB^k $$
也就是 $dimW^k=dimImB^{k-1}-dimImB^k$ 。这就得到了维数公式。
幂零变换的空间分解
实际上,由幂零变换我们就可以给出空间的分解,正是利用循环子空间
我们考虑基底扩张的过程,从最小的
$$ W_k = \text{Im}\mathcal{B}^{k-1} \cap \text{Ker}\mathcal{B} $$
中,我们取一组基 $\eta_{1}^{(t)}, \dots, \eta_{m_t}^{(t)}$,然后我们扩充到下一级,在$W_{t-1}$补上$\eta_{1}^{(t-1)}, \dots$;..直到 $W_1$。 此时,所有 $\eta$组成的集合是$\text{Ker}\mathcal{B}$ 的基,且彼此线性无关。
对每一个 $\eta \in W_k$,都可以找到对应的 $\alpha$满足$\mathcal{B}^{k-1}\alpha = \eta$。我们将所有这些 $\alpha$产生的循环链全部收集起来。由于特意通过“基底扩充”的方法选取$\eta$,所以所有链的尾项集合是线性无关的,因此这些循环子空间之和必然是直和。
我们需要确定这些直和在一起是否填满了整个 $V$。
计算直和空间的维数:
$$ \sum (\text{每条链的长度}) = \sum_{k=1}^t k \times (\text{长度恰好为 } k \text{ 的链的个数}) $$
长度为 $k$的链也就对应$W_k$ 里的一串,$dimW_t$ 是何意味呢,我们看看:
在 $W_t$里挑出的向量: 它们能往回追溯$t-1$步(因为在$\text{Im}\mathcal{B}^{t-1}$里),所以它们生成的是长度为$t$ 的最长链。
在 $W_{t-1}$但不在$W_t$里的向量: 它们只能往回追溯$t-2$步。它们生成的是长度为$t-1$的链。$\dim W_k$实际上是“长度$\ge k$ 的循环链”的数量。这让我们联想到期望公式,对于正整数的随机变量
$$ E(X) = \sum_{k=1}^{\infty} P(X \ge k) $$
那么当我们如法炮制把所有的 $\dim W_k$ 加起来时:
$$ \sum_{k=1}^t \dim W_k = \dim W_1 + \dim W_2 + \dots + \dim W_t $$
长度为 $1$的链,只在$\dim W_1$ 中被数了 1 次。
长度为 $2$的链,在$\dim W_1$和$\dim W_2$ 中各被数了 1 次,共 2 次。
…
长度为 $k$的链,在$\dim W_1, \dots, \dim W_k$ 中各被数了 1 次,共 $k$ 次。
所以
通过维数计算公式:
$$ \text{总维数} = \sum_{k=1}^t \dim W_k = \sum_{k=1}^t (\text{rank}(\mathcal{B}^{k-1}) - \text{rank}(\mathcal{B}^k)) $$
也就得到:
$$ \text{总维数} = \text{rank}(\mathcal{B}^0) - \text{rank}(\mathcal{B}^t) = \dim V - 0 = \dim V $$

Jordan 标准型


存在性
设 V 是有限维 K-线性空间, 𝒜 ∈ Hom V .若 𝒜 的特征多项式在域 K 上能分解成一次因式的乘积, 则存在 V 的一组基, 使得 𝒜 在此基下的矩阵为若当形矩阵.
证明:
把 $V$ 分解成
$$ V=\bigoplus_i Ker(A-\lambda_i I)^{r_i} $$
那么考虑在 $V_i=Ker(A-\lambda_i I)^{r_i}$上的限制映射$A|{V_i}=\lambda_i I|{V_i}+B_i$,则$B_i$是$V_i$上的幂零变换,由上我们知道可以把$V_i$分解成$B_i-$子空间的直和
$$ V_i=\bigoplus_j Z(\alpha_j,B_i) $$
对于 $V_{ij}=Z(\alpha_j,B_i)$,是$V_i$上的不变子空间,自然也是$A-$不变子空间,而且 $A$在这组基下的矩阵就是若当块,最后,把所有$V_{ij}$拼起来就得到全空间的直和分解,对应的$A$ 也就是若当型矩阵。

降幂排列的话,$1$ 就在右上角。
$k$ 级若当块的个数是
$$ n_k = \text{rank}(\mathcal{B}^{k-1}) - 2\text{rank}(\mathcal{B}^k) + \text{rank}(\mathcal{B}^{k+1}) $$
这是一个二阶差分,亦可以写作 $W$维数的一阶差分。实际上考虑$W$维数的一阶差分这是自然的,由于$W$代表了大于等于$k$的链,作差就得到长度恰为$k$ 的链。
或者也可以直接看做 $rank(J-\lambda I)^k$的二阶差分,实际上也就是$B$。对于$r$级的若当块$J_0$,不难发现$J_0^r=J_0^{r+1}=…=0$。所以$J^{k-1}秩-J^k秩$也就是级数大于等于$k$的若当块数量,也就对应$dimW$。再做差分也就得到恰好为$k$ 的若当块数量。



唯一性
与 $A$相似的若尔当矩阵,除了可以相差对角块的次序外,由$A$唯一确定,称为$A$ 的若尔当标准型。
首先,对对角块重排也就是乘上置换阵,当然还是相似的。
若尔当块的个数
$$ \text{rank}(J - \lambda I)^{k-1} - 2 \times \text{rank}(J - \lambda I)^k + \text{rank}(J - \lambda I)^{k+1} $$
( 当 $k=1$ 时,$(J - \lambda I)^{k-1}$需理解为单位矩阵$I$ )
这在此前我们已经详细阐述,直观的理解也就是

所以 $J_0$有多大,他就能撑住多少次的幂次,从而差分得到大于等于$k$的$J_0$,再差分就得到等于$k$ 的数目。
这实际上就直接给出了唯一性,考虑和 $A$相似的$J
$$ $UAU^{-1}=J $$
利用经典结论
$$ UA^kU^{-1}=J^k $$
得到多项式也相似,也就是
$$ U(A-\lambda I)^kU^{-1}=(J-\lambda I)^k $$
那么也就有
$$ rank(A-\lambda I)^k=rank(J-\lambda I)^k $$
从而利用若当块大小的结论,我们知道和 $A$ 相似的若尔当矩阵块的大小都一样,再利用相似知特征值一样,就锁定了若尔当标准型。
推论
矩阵相似当且仅当若尔当标准型一样(在重排意义下)。
若尔当矩阵的多项式和幂级数
利用0-若尔当矩阵的形式,我们可以把多项式写成一个漂亮的形式。

一般地,对角不是 $0$ ,$J_\lambda=\lambda I+J_0$,那么我们希望套用上面这样美丽的形式,就想到做一个泰勒展开变回$J_0
$$ $g(x)=g(\lambda)+g'(\lambda)(x-\lambda)+\frac{1}{2!}g''(\lambda)(x-\lambda)^2+...+\frac{1}{(r-1)!}g^{(r-1)}(\lambda)(x-\lambda)^{r-1}+... $$
记 $c_i$ 为泰勒展开对应的系数,也就有

这就化归了,形式仍然美丽。特别地,当 $g(J_\lambda)=0$时,只有可能所有的$c$都是$0$,此时$g(x)$只剩下对应的次数高于$r-1$ 的项了,换句话说,$(x-\lambda)^r | g(x)$ 。反面也很显然,所以这两个命题等价。

如果大的块是零矩阵,那么小的块自动已经为零,所以考虑 $J$ 的幂次是否为零,我们只需要考虑同一个特征值中最大的块。

从而其最小多项式也就是
$$ \prod_\lambda(x-\lambda)^{r_\lambda} $$
其中 $r_\lambda$是$\lambda$对应的最大的块的阶数,被称为稳定指数。利用相似,可知这也是$A$ 的最小多项式。