LOADING

加载过慢请开启缓存 浏览器默认开启

笔记7.从幂零变换的结构到Jordan标准型

在之前,我们已经把线性变换分割成了不变子空间,并考虑了其上的限制映射和诱导映射,而根子空间给出的分解让限制映射有一个非常好的性质,对限制在根子空间 $Ker(A-\lambda I)^r$的映射$A$,我们构造$B=(A-\lambda I)|_W$ 有

$$ \mathcal{B}^r \alpha = ((\mathcal{A} - \lambda I)|_W)^r \alpha = (\mathcal{A} - \lambda I)^r \alpha $$

其中 $\alpha \in Ker(A-\lambda I)^r$,从而$B^r=0$ 。也就是说这是个幂零矩阵,所以我们只需要研究幂零变换,就可以知道一般变换的性质。

幂零变换 (Nilpotent Endomorphism)

设 $\mathbf{B} \in \text{Hom}(V)$。若有正整数 $t$使得$\mathbf{B}^t = 0$,则称 $\mathbf{B}$是幂零变换。使$\mathbf{B}^t = 0$成立的最小指数$t$称为$\mathbf{B}$ 的幂零指数

幂零变换 $\mathbf{B}$的最小多项式是$x^t$。

幂零变换的循环子空间

对幂零变换,我们仍然找循环子空间。


任给 $\alpha \neq 0$,总有 $r \geq 1$,使得 $\mathbf{B}^{r-1}\alpha \neq 0, \mathbf{B}^r\alpha = 0$。

$$ Z(\alpha, \mathbf{B}) = \langle \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha \rangle $$

是 $\mathbf{B}$-子空间,称为由 $\alpha$ 生成的强循环子空间

$$ \alpha, \mathbf{B}\alpha, \dots, \mathbf{B}^{r-1}\alpha $$

称为 $Z(\alpha, \mathbf{B})$ 的循环基,$\mathbf{B}^{r-1}\alpha$ 称为循环基的尾项,它在后面的证明中起到关键性作用。
我们可以证明这构成基,考虑线性组合

$$ \sum_i c_iB^i\alpha=0 $$

我们作用 $B^{r-1}$就只剩$c_0B^{r-1}\alpha=0$,只能$c_0=0$。如法炮制就得到所有系数为$0$ 。


若 $Z(\alpha, \mathbf{B}) = \langle \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha \rangle$是$r$维$\mathbf{B}$-强循环子空间,则有

$$ \mathbf{B}(\alpha \ \mathbf{B}\alpha \ \mathbf{B}^2\alpha \dots \mathbf{B}^{r-1}\alpha) $$

$$ = (\alpha \ \mathbf{B}\alpha \ \mathbf{B}^2\alpha \dots \mathbf{B}^{r-1}\alpha) \begin{bmatrix} 0 & 0 & 0 & \dots & 0 \\ 1 & 0 & 0 & \dots & 0 \\ 0 & 1 & 0 & \ddots & \vdots \\ \vdots & \vdots & \ddots & \ddots & 0 \\ 0 & 0 & \dots & 1 & 0 \end{bmatrix} $$

(矩阵为下三角形式,基向量按原序排列)


若 $Z(\alpha, \mathbf{B}) = \langle \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha \rangle$是$r$维$\mathbf{B}$-强循环子空间,则有

$$ \mathbf{B}(\mathbf{B}^{r-1}\alpha \ \mathbf{B}^{r-2}\alpha \dots \alpha) $$

$$ = (\mathbf{B}^{r-1}\alpha \ \mathbf{B}^{r-2}\alpha \dots \alpha) \begin{bmatrix} 0 & 1 & 0 & \dots & 0 \\ 0 & 0 & 1 & \dots & 0 \\ 0 & 0 & 0 & \ddots & \vdots \\ \vdots & \vdots & \vdots & \ddots & 1 \\ 0 & 0 & 0 & \dots & 0 \end{bmatrix} $$

(矩阵为上三角形式,循环基按降幂排列)



也就是说,不变子空间一定从某个幂次一直到 $r-1$ 次,中间不能断。

故 $r$维(强)循环子空间$Z(\alpha, \mathbf{B}) = \langle \alpha \ \mathbf{B}\alpha \dots \mathbf{B}^{r-1}\alpha \rangle$只有$r+1$个$\mathbf{B}$-不变子空间:

$$ Z(\alpha, \mathbf{B}) \supset Z(\mathbf{B}\alpha, \mathbf{B}) \supset Z(\mathbf{B}^2\alpha, \mathbf{B}) \supset \dots \supset Z(\mathbf{B}^{r-1}\alpha, \mathbf{B}) \supset \{0\} $$

这些循环基都有相同的尾项
接下来,我们想要得到原来的变换,需要把一个个子空间拼起来,那自然就想到什么时候是直和。

循环子空间直和的条件

给定 $\alpha, \beta \in W$,怎样才能保证

$$ Z(\alpha, \mathbf{B}) + Z(\beta, \mathbf{B}) \text{ 是直和?} $$

即:如何保证向量组

$$ \alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \dots, \mathbf{B}^{r-1}\alpha $$

$$ \beta, \mathbf{B}\beta, \dots, \mathbf{B}^{s-1}\beta $$

线性无关


引理:强循环子空间之和是直和的充要条件

结论: 强循环子空间之和是直和,当且仅当 循环基尾项线性无关


证明思路 (Proof Sketch)

1. 布局:

若存在系数不全为零的组合使得线性组合为 $0$。将各组循环基按升幂写在不同行上,并按尾项上下对齐

  • 第一行:$\alpha, \mathbf{B}\alpha, \mathbf{B}^2\alpha, \mathbf{B}^3\alpha, \mathbf{B}^4\alpha$(假设尾项是$\mathbf{B}^4\alpha$)

  • 第二行:$\beta, \mathbf{B}\beta, \mathbf{B}^2\beta, \mathbf{B}^3\beta$(假设尾项是$\mathbf{B}^3\beta$)

  • 第三行:$\gamma, \mathbf{B}\gamma, \mathbf{B}^2\gamma$(假设尾项是$\mathbf{B}^2\gamma$)

2. 核心操作(作用算子 B):

$k$ 维循环基与尾项的性质

对于 $k$ 维循环基:

$$ \alpha, \mathbf{B}\alpha, \dots, \mathbf{B}^{k-1}\alpha \quad (\mathbf{B}^k \alpha = 0) $$

尾项 $\mathbf{B}^{k-1}\alpha$ 具备双重身份:

  1. 属于像空间: $\mathbf{B}^{k-1}\alpha \in \text{Im} \mathbf{B}^{k-1}$(它是某个向量作用 $k-1$ 次算子后的结果)。

  2. 属于核空间: $\mathbf{B}^{k-1}\alpha \in \text{Ker} \mathbf{B}$(再作用一次 $\mathbf{B}$ 就归零了)。

因此,尾项位于这两个空间的交集之中:

$$ \mathbf{B}^{k-1}\alpha \in \text{Im} \mathbf{B}^{k-1} \cap \text{Ker} \mathbf{B} $$


空间序列的嵌套结构

设 $t$是算子$\mathbf{B}$的幂零指数(即$\mathbf{B}^t = 0$且$\mathbf{B}^{t-1} \neq 0$)。

我们可以定义一系列子空间 $W_k$,它们刻画了不同“长度”的循环基尾项所在的范围:

$$ W_k = \text{Im} \mathbf{B}^{k-1} \cap \text{Ker} \mathbf{B} $$

这些子空间构成了一个升序的嵌套链(Filtration):

$$ W_t = \text{Im} \mathbf{B}^{t-1} \subseteq W_{t-1} \subseteq \dots \subseteq W_2 \subseteq W_1 = \text{Ker} \mathbf{B} $$

同时,利用我们在商空间证明的

$$ \text{Im}\mathcal{A} \big/ (\text{Im}\mathcal{A} \cap \text{Ker}\mathcal{B}) \cong \text{Im}(\mathcal{BA}) $$

我们代入 $A=B^{k-1}$ 就得到

$$ dimImB^{k-1}-dim(ImB^{k-1}\cap KerB)=dimImB^k $$

也就是 $dimW^k=dimImB^{k-1}-dimImB^k$ 。这就得到了维数公式。

幂零变换的空间分解

实际上,由幂零变换我们就可以给出空间的分解,正是利用循环子空间
我们考虑基底扩张的过程,从最小的

$$ W_k = \text{Im}\mathcal{B}^{k-1} \cap \text{Ker}\mathcal{B} $$

中,我们取一组基 $\eta_{1}^{(t)}, \dots, \eta_{m_t}^{(t)}$,然后我们扩充到下一级,在$W_{t-1}$补上$\eta_{1}^{(t-1)}, \dots$;..直到 $W_1$。 此时,所有 $\eta$组成的集合是$\text{Ker}\mathcal{B}$ 的基,且彼此线性无关。

对每一个 $\eta \in W_k$,都可以找到对应的 $\alpha$满足$\mathcal{B}^{k-1}\alpha = \eta$。我们将所有这些 $\alpha$产生的循环链全部收集起来。由于特意通过“基底扩充”的方法选取$\eta$,所以所有链的尾项集合是线性无关的,因此这些循环子空间之和必然是直和
我们需要确定这些直和在一起是否填满了整个 $V$。

计算直和空间的维数:

$$ \sum (\text{每条链的长度}) = \sum_{k=1}^t k \times (\text{长度恰好为 } k \text{ 的链的个数}) $$

长度为 $k$的链也就对应$W_k$ 里的一串,$dimW_t$ 是何意味呢,我们看看:

  • 在 $W_t$里挑出的向量: 它们能往回追溯$t-1$步(因为在$\text{Im}\mathcal{B}^{t-1}$里),所以它们生成的是长度为$t$ 的最长链

  • 在 $W_{t-1}$但不在$W_t$里的向量: 它们只能往回追溯$t-2$步。它们生成的是长度为$t-1$的链。$\dim W_k$实际上是“长度$\ge k$ 的循环链”的数量。这让我们联想到期望公式,对于正整数的随机变量

$$ E(X) = \sum_{k=1}^{\infty} P(X \ge k) $$

那么当我们如法炮制把所有的 $\dim W_k$ 加起来时:

$$ \sum_{k=1}^t \dim W_k = \dim W_1 + \dim W_2 + \dots + \dim W_t $$

  • 长度为 $1$的链,只在$\dim W_1$ 中被数了 1 次

  • 长度为 $2$的链,在$\dim W_1$和$\dim W_2$ 中各被数了 1 次,共 2 次

  • 长度为 $k$的链,在$\dim W_1, \dots, \dim W_k$ 中各被数了 1 次,共 $k$ 次

所以
通过维数计算公式:

$$ \text{总维数} = \sum_{k=1}^t \dim W_k = \sum_{k=1}^t (\text{rank}(\mathcal{B}^{k-1}) - \text{rank}(\mathcal{B}^k)) $$

也就得到:

$$ \text{总维数} = \text{rank}(\mathcal{B}^0) - \text{rank}(\mathcal{B}^t) = \dim V - 0 = \dim V $$

Jordan 标准型

存在性

设 V 是有限维 K-线性空间, 𝒜 ∈ Hom V .若 𝒜 的特征多项式在域 K 上能分解成一次因式的乘积, 则存在 V 的一组基, 使得 𝒜 在此基下的矩阵为若当形矩阵.

证明:

把 $V$ 分解成

$$ V=\bigoplus_i Ker(A-\lambda_i I)^{r_i} $$

那么考虑在 $V_i=Ker(A-\lambda_i I)^{r_i}$上的限制映射$A|{V_i}=\lambda_i I|{V_i}+B_i$,则$B_i$是$V_i$上的幂零变换,由上我们知道可以把$V_i$分解成$B_i-$子空间的直和

$$ V_i=\bigoplus_j Z(\alpha_j,B_i) $$

对于 $V_{ij}=Z(\alpha_j,B_i)$,是$V_i$上的不变子空间,自然也是$A-$不变子空间,而且 $A$在这组基下的矩阵就是若当块,最后,把所有$V_{ij}$拼起来就得到全空间的直和分解,对应的$A$ 也就是若当型矩阵。

降幂排列的话,$1$ 就在右上角。

$k$ 级若当块的个数是

$$ n_k = \text{rank}(\mathcal{B}^{k-1}) - 2\text{rank}(\mathcal{B}^k) + \text{rank}(\mathcal{B}^{k+1}) $$

这是一个二阶差分,亦可以写作 $W$维数的一阶差分。实际上考虑$W$维数的一阶差分这是自然的,由于$W$代表了大于等于$k$的链,作差就得到长度恰为$k$ 的链。

或者也可以直接看做 $rank(J-\lambda I)^k$的二阶差分,实际上也就是$B$。对于$r$级的若当块$J_0$,不难发现$J_0^r=J_0^{r+1}=…=0$。所以$J^{k-1}秩-J^k秩$也就是级数大于等于$k$的若当块数量,也就对应$dimW$。再做差分也就得到恰好为$k$ 的若当块数量。


唯一性

与 $A$相似的若尔当矩阵,除了可以相差对角块的次序外,由$A$唯一确定,称为$A$ 的若尔当标准型。

首先,对对角块重排也就是乘上置换阵,当然还是相似的。

若尔当块的个数

$$ \text{rank}(J - \lambda I)^{k-1} - 2 \times \text{rank}(J - \lambda I)^k + \text{rank}(J - \lambda I)^{k+1} $$

( 当 $k=1$ 时,$(J - \lambda I)^{k-1}$需理解为单位矩阵$I$ )

这在此前我们已经详细阐述,直观的理解也就是

所以 $J_0$有多大,他就能撑住多少次的幂次,从而差分得到大于等于$k$的$J_0$,再差分就得到等于$k$ 的数目。

这实际上就直接给出了唯一性,考虑和 $A$相似的$J

$$ $UAU^{-1}=J $$

利用经典结论

$$ UA^kU^{-1}=J^k $$

得到多项式也相似,也就是

$$ U(A-\lambda I)^kU^{-1}=(J-\lambda I)^k $$

那么也就有

$$ rank(A-\lambda I)^k=rank(J-\lambda I)^k $$

从而利用若当块大小的结论,我们知道和 $A$ 相似的若尔当矩阵块的大小都一样,再利用相似知特征值一样,就锁定了若尔当标准型。

推论

矩阵相似当且仅当若尔当标准型一样(在重排意义下)。

若尔当矩阵的多项式和幂级数

利用0-若尔当矩阵的形式,我们可以把多项式写成一个漂亮的形式。

一般地,对角不是 $0$ ,$J_\lambda=\lambda I+J_0$,那么我们希望套用上面这样美丽的形式,就想到做一个泰勒展开变回$J_0

$$ $g(x)=g(\lambda)+g'(\lambda)(x-\lambda)+\frac{1}{2!}g''(\lambda)(x-\lambda)^2+...+\frac{1}{(r-1)!}g^{(r-1)}(\lambda)(x-\lambda)^{r-1}+... $$

记 $c_i$ 为泰勒展开对应的系数,也就有

这就化归了,形式仍然美丽。特别地,当 $g(J_\lambda)=0$时,只有可能所有的$c$都是$0$,此时$g(x)$只剩下对应的次数高于$r-1$ 的项了,换句话说,$(x-\lambda)^r | g(x)$ 。反面也很显然,所以这两个命题等价。

如果大的块是零矩阵,那么小的块自动已经为零,所以考虑 $J$ 的幂次是否为零,我们只需要考虑同一个特征值中最大的块。

从而其最小多项式也就是

$$ \prod_\lambda(x-\lambda)^{r_\lambda} $$

其中 $r_\lambda$是$\lambda$对应的最大的块的阶数,被称为稳定指数。利用相似,可知这也是$A$ 的最小多项式。