线代 #数学#线代

笔记7.从幂零变换的结构到Jordan标准型

Shane Lorien

在之前,我们已经把线性变换分割成了不变子空间,并考虑了其上的限制映射和诱导映射,而根子空间给出的分解让限制映射有一个非常好的性质,对限制在根子空间 的映射 ,我们构造

其中 ,从而 。也就是说这是个幂零矩阵,所以我们只需要研究幂零变换,就可以知道一般变换的性质。

幂零变换 (Nilpotent Endomorphism)

。若有正整数 使得 ,则称 幂零变换。使 成立的最小指数 称为 幂零指数

幂零变换 的最小多项式是

幂零变换的循环子空间

对幂零变换,我们仍然找循环子空间。


任给 ,总有 ,使得

-子空间,称为由 生成的强循环子空间

称为 循环基 称为循环基的尾项,它在后面的证明中起到关键性作用。 我们可以证明这构成基,考虑线性组合

我们作用 就只剩 ,只能 。如法炮制就得到所有系数为


-强循环子空间,则有

(矩阵为下三角形式,基向量按原序排列)


-强循环子空间,则有

(矩阵为上三角形式,循环基按降幂排列)


也就是说,不变子空间一定从某个幂次一直到 次,中间不能断。

维(强)循环子空间 只有 -不变子空间:

这些循环基都有相同的尾项。 接下来,我们想要得到原来的变换,需要把一个个子空间拼起来,那自然就想到什么时候是直和。

循环子空间直和的条件

给定 ,怎样才能保证

即:如何保证向量组

线性无关


引理:强循环子空间之和是直和的充要条件

结论: 强循环子空间之和是直和,当且仅当 循环基尾项线性无关


证明思路 (Proof Sketch)

1. 布局:

若存在系数不全为零的组合使得线性组合为 。将各组循环基按升幂写在不同行上,并按尾项上下对齐

  • 第一行:(假设尾项是

  • 第二行:(假设尾项是

  • 第三行:(假设尾项是

2. 核心操作(作用算子 B):

维循环基与尾项的性质

对于 维循环基:

尾项 具备双重身份:

  1. 属于像空间: (它是某个向量作用 次算子后的结果)。

  2. 属于核空间: (再作用一次 就归零了)。

因此,尾项位于这两个空间的交集之中:


空间序列的嵌套结构

是算子 幂零指数(即 )。

我们可以定义一系列子空间 ,它们刻画了不同“长度”的循环基尾项所在的范围:

这些子空间构成了一个升序的嵌套链(Filtration):

同时,利用我们在商空间证明的

我们代入 就得到

也就是 。这就得到了维数公式。

幂零变换的空间分解

实际上,由幂零变换我们就可以给出空间的分解,正是利用循环子空间 我们考虑基底扩张的过程,从最小的

中,我们取一组基 ,然后我们扩充到下一级,在 补上 ;..直到 此时,所有 组成的集合是 的基,且彼此线性无关。

对每一个 ,都可以找到对应的 满足 。我们将所有这些 产生的循环链全部收集起来。由于特意通过“基底扩充”的方法选取 ,所以所有链的尾项集合是线性无关的,因此这些循环子空间之和必然是直和我们需要确定这些直和在一起是否填满了整个

计算直和空间的维数:

长度为 的链也就对应 里的一串, 是何意味呢,我们看看:

  • 里挑出的向量: 它们能往回追溯 步(因为在 里),所以它们生成的是长度为 最长链

  • 但不在 里的向量: 它们只能往回追溯 步。它们生成的是长度为 的链。 实际上是“长度 的循环链”的数量。这让我们联想到期望公式,对于正整数的随机变量

那么当我们如法炮制把所有的 加起来时:

  • 长度为 的链,只在 中被数了 1 次

  • 长度为 的链,在 中各被数了 1 次,共 2 次

  • 长度为 的链,在 中各被数了 1 次,共

所以 通过维数计算公式:

也就得到:

Jordan 标准型

存在性

设 V 是有限维 K-线性空间, 𝒜 ∈ Hom V .若 𝒜 的特征多项式在域 K 上能分解成一次因式的乘积, 则存在 V 的一组基, 使得 𝒜 在此基下的矩阵为若当形矩阵.

证明:

分解成

那么考虑在 上的限制映射 ,则 上的幂零变换,由上我们知道可以把 分解成 子空间的直和

对于 ,是 上的不变子空间,自然也是 不变子空间,而且 在这组基下的矩阵就是若当块,最后,把所有 拼起来就得到全空间的直和分解,对应的 也就是若当型矩阵。

降幂排列的话, 就在右上角。

级若当块的个数是

这是一个二阶差分,亦可以写作 维数的一阶差分。实际上考虑 维数的一阶差分这是自然的,由于 代表了大于等于 的链,作差就得到长度恰为 的链。

或者也可以直接看做 的二阶差分,实际上也就是 。对于 级的若当块 ,不难发现 。所以 也就是级数大于等于 的若当块数量,也就对应 。再做差分也就得到恰好为 的若当块数量。

唯一性

相似的若尔当矩阵,除了可以相差对角块的次序外,由 唯一确定,称为 的若尔当标准型。

首先,对对角块重排也就是乘上置换阵,当然还是相似的。

若尔当块的个数

( 当 时, 需理解为单位矩阵

这在此前我们已经详细阐述,直观的理解也就是

所以 有多大,他就能撑住多少次的幂次,从而差分得到大于等于 ,再差分就得到等于 的数目。

这实际上就直接给出了唯一性,考虑和 相似的 $ J

利用经典结论

得到多项式也相似,也就是

那么也就有

从而利用若当块大小的结论,我们知道和 相似的若尔当矩阵块的大小都一样,再利用相似知特征值一样,就锁定了若尔当标准型。

推论

矩阵相似当且仅当若尔当标准型一样(在重排意义下)。

若尔当矩阵的多项式和幂级数

利用0-若尔当矩阵的形式,我们可以把多项式写成一个漂亮的形式。

一般地,对角不是 ,那么我们希望套用上面这样美丽的形式,就想到做一个泰勒展开变回 $ J_0

为泰勒展开对应的系数,也就有

这就化归了,形式仍然美丽。特别地,当 时,只有可能所有的 都是 ,此时 只剩下对应的次数高于 的项了,换句话说, 。反面也很显然,所以这两个命题等价。

如果大的块是零矩阵,那么小的块自动已经为零,所以考虑 的幂次是否为零,我们只需要考虑同一个特征值中最大的块。

从而其最小多项式也就是

其中 对应的最大的块的阶数,被称为稳定指数。利用相似,可知这也是 的最小多项式。