数学随笔10

2026/1/25 数学随笔数学

据Gemini说，这种方法叫稠密性论证。

核心范式：

「先在一个‘好’的稠密子集上证明 → 再用连续性/极限推广到一般情形」

可逆方阵性质推广至不可逆方阵

首先，对于任意方阵 $A$，我们考虑$A+\lambda I$，由于$det(A+\lambda I)$是$\lambda$至多$n$次的多项式，所以至多有$n$个零点，也就是说，至多存在$n$个$\lambda$使得$det(A+\lambda I)$不可逆，从而有无数个$\lambda$使得其可逆，缩小之，可取最小的根$\lambda_m$，只要$\delta < \lambda_m$，则有$\forall x < \delta,A+xI$ 可逆。

假设所有的可逆方阵都拥有性质 $\mathcal{A}$，如果$\mathcal{A}$在矩阵空间连续，那么对于一个不可逆方阵，我们考虑加上一个小扰动$xI$让其变得可逆，然后令$x \to 0$，就得到其亦满足性质 $\mathcal{A}$ 。
但对于类似秩的性质，这种手法便难以成功，该性质不连续，可能出现跃变。

可对角化矩阵性质推广至不可对角化矩阵

稠密性引理 (Density Lemma)：

在矩阵空间 $\mathbb{C}^{n \times n}$中，特征值互异的矩阵（可对角化矩阵） 构成的集合$D$ 是稠密的。

这意味着对于任意矩阵 $A$，都存在序列 ${A_k} \subset D$ 使得：

$$ \lim_{k \to \infty} A_k = A $$

引理证明如下
等价命题：

设 $\mathcal{D} = { M \in \mathbb{C}^{n \times n} \mid M \text{ 拥有 } n \text{ 个互异的特征值} }$。则对于任意 $A \in \mathbb{C}^{n \times n}$，在其任意邻域内均存在 $A_\epsilon \in \mathcal{D}$。

证明：

1. 构造判别式多项式

对于任意矩阵 $M$，其特征多项式为 $p_M(\lambda) = \det(\lambda I - M)$。定义 $M$ 的判别式 (Discriminant) 为：

$$ \Delta(M) = \prod_{1 \le i < j \le n} (\lambda_i - \lambda_j)^2 $$

其中 $\lambda_1, \dots, \lambda_n$是$M$ 的特征值。

根据对称多项式基本定理，$\Delta(M)$可以表示为$p_M(\lambda)$ 系数的多项式。
由于 $p_M(\lambda)$的系数是$M$中元素$m_{ij}$的多项式，故$\Delta(M)$是一个关于$m_{ij}$ 的 复多项式函数：$\Delta: \mathbb{C}^{n \times n} \to \mathbb{C}$。

2. 判定准则

由判别式的定义可知：

$$ M \in \mathcal{D} \iff \Delta(M) \neq 0 $$

反之，$M$具有重根当且仅当$\Delta(M) = 0$。

3. 构造扰动直线

取一个特征值互异的对角矩阵 $E = \text{diag}(1, 2, \dots, n) \in \mathcal{D}$。对于给定的矩阵 $A$，定义复变量 $\epsilon$ 的多项式函数：

$$ g(\epsilon) = \Delta(A + \epsilon E) $$

当 $\epsilon$足够大时，矩阵$A/\epsilon + E$趋近于$E$。由于 $E$的特征值互异，由特征值的连续性可知，存在某个$\epsilon_0$使得$A + \epsilon_0 E \in \mathcal{D}$。
因此，$g(\epsilon_0) \neq 0$，这意味着 $g(\epsilon)$ 是一个非恒为零的多项式。

4. 孤立零点与稠密性

根据复分析或代数学性质，非恒为零的多项式 $g(\epsilon)$在复平面$\mathbb{C}$ 上只有有限个孤立零点。

因此，在 $\epsilon = 0$的任意开邻域$U = { \epsilon \mid |\epsilon| < \delta }$内，必然存在无穷多个$\epsilon^$使得$g(\epsilon^) \neq 0$。
取序列 $\epsilon_k \to 0$且满足$g(\epsilon_k) \neq 0$，则构造序列 $A_k = A + \epsilon_k E$。

结论：

由于 $g(\epsilon_k) \neq 0 \implies A_k \in \mathcal{D}$，且 $\lim_{k \to \infty} A_k = A$，证得 $\mathcal{D}$在$\mathbb{C}^{n \times n}$中稠密。由于$\mathcal{D}$ 中的矩阵必可对角化，故可对角化矩阵集合亦稠密。

证毕。

证明：Cayley-Hamilton 定理（连续性方法）

定理陈述：

设 $A \in \mathbb{C}^{n \times n}$，其特征多项式为 $p_A(\lambda) = \det(\lambda I - A)$，则有 $p_A(A) = O$。

**1. 根据稠密性原理，对于任意矩阵 $A$，都存在序列 ${A_k} \subset D$ 使得：

$$ \lim_{k \to \infty} A_k = A $$

2. 针对 $A \in D$ 的证明

若 $A$特征值互异，则$A$可对角化为$A = P \Lambda P^{-1}$，其中 $\Lambda = \text{diag}(\lambda_1, \dots, \lambda_n)$。

$$ p_A(A) = P p_A(\Lambda) P^{-1} = P \text{diag}(p_A(\lambda_1), \dots, p_A(\lambda_n)) P^{-1} $$

由于 $\lambda_i$是$p_A(\lambda)$的根，故$p_A(\lambda_i) = 0$，从而 $p_A(A) = O$。

3. 连续性扩张 (Continuity Argument)

定义映射 $f: \mathbb{C}^{n \times n} \to \mathbb{C}^{n \times n}$ 为：

$$ f(M) = p_M(M) $$

连续性： $p_M(\lambda)$的系数是$M$元素的行列式多项式，而$M$ 的幂次也是连续的。因此，$f(M)$是关于$M$ 元素的连续函数。
极限推导：

$$ f(A) = f(\lim_{k \to \infty} A_k) = \lim_{k \to \infty} f(A_k) $$

由于 $A_k \in D$，根据步骤 2 得到 $f(A_k) = O$。

$$ \therefore f(A) = \lim_{k \to \infty} O = O $$

证毕。

💡 笔记小贴士：

为什么要在 $\mathbb{C}$而不是$\mathbb{R}$中证明？ 因为在实数域$\mathbb{R}$ 上，特征值可能不存在（变成复数），会导致“稠密性”讨论变复杂。在复数域下，任何矩阵都至少有特征值，处理起来最自然。

正定矩阵性质推广到半正定矩阵

完全类似上方，具体可参照 [[数学随笔9#（半）正定矩阵的行列式约束]]，对正定矩阵证明后，半正定矩阵自然也满足该性质。

秩一扰动

类似上方，我们将矩阵 $A$加上一个秩一矩阵$uv^T$即有$A+uv^T$。
参考[[数学随笔2#Woodbury 恒等式]]，我们有

$$ \det(A + uv^T) = (1 + v^T A^{-1} u) \det(A) $$

以及

$$ (A + uv^T)^{-1} = A^{-1} - \frac{A^{-1}uv^T A^{-1}}{1 + v^T A^{-1}u} $$

我忘了在哪见到的，也忘了有什么应用，但都是扰动，就扔进来吧（

柯西交错定理 (Cauchy’s Interlacing Theorem)

即 $n-1$阶主子阵$A$的特征值$\mu_j$严格交错地分布在$n$阶对称矩阵$S$的特征值$\lambda_i$ 之间。

1. 构造矩阵与特征多项式

设 $S$是$n$ 阶对称矩阵，将其写成分块形式：

$$ S = \begin{bmatrix} A & \mathbf{b} \\ \mathbf{b}^T & c \end{bmatrix} $$

其中 $A$是$(n-1) \times (n-1)$ 的对称主子阵，$c$ 是标量，$\mathbf{b}$是$n-1$维列向量。$S$的特征多项式定义为$P_S(\lambda) = \det(S - \lambda I)$。利用分块矩阵的行列式性质（Schur补）：

$$ P_S(\lambda) = \det(A - \lambda I) \cdot \left( (c - \lambda) - \mathbf{b}^T (A - \lambda I)^{-1} \mathbf{b} \right) $$

2. 利用谱分解展开二次型

设 $A$的特征值为$\mu_1 \leq \mu_2 \leq \dots \leq \mu_{n-1}$，对应的单位正交特征向量为 $v_1, v_2, \dots, v_{n-1}$。

如前所述，将 $(A - \lambda I)^{-1}$ 进行谱展开：

$$ \mathbf{b}^T (A - \lambda I)^{-1} \mathbf{b} = \sum_{j=1}^{n-1} \frac{(v_j^T \mathbf{b})^2}{\mu_j - \lambda} $$

令 $\beta_j^2 = (v_j^T \mathbf{b})^2$（这是非负常数），代入原多项式：

$$ P_S(\lambda) = P_A(\lambda) \left( c - \lambda - \sum_{j=1}^{n-1} \frac{\beta_j^2}{\mu_j - \lambda} \right) $$

3. 分析符号变化（核心证明）

为了简化讨论，假设 $\beta_j \neq 0$且$\mu_j$ 各不相同（一般情况可通过极限逼近说明）。

考虑函数 $f(\lambda) = c - \lambda - \sum_{j=1}^{n-1} \frac{\beta_j^2}{\mu_j - \lambda}$。

极点处的跳变：当 $\lambda$从左侧趋近于$\mu_i$ 时（$\lambda \to \mu_i^-$），项 $\frac{\beta_i^2}{\mu_i - \lambda} \to +\infty$，因此 $f(\lambda) \to -\infty$。
极点处的跳变：当 $\lambda$从右侧趋近于$\mu_i$ 时（$\lambda \to \mu_i^+$），项 $\frac{\beta_i^2}{\mu_i - \lambda} \to -\infty$，因此 $f(\lambda) \to +\infty$。

在每一个开区间 $(\mu_i, \mu_{i+1})$ 内：

$f(\lambda)$从$+\infty$连续变化到$-\infty$。
根据连续性，$f(\lambda)$ 在此区间内必然至少有一个根。
因为 $P_S(\lambda) = P_A(\lambda) f(\lambda)$，且在该区间内 $P_A(\lambda) \neq 0$，所以 $f(\lambda)$的根就是$P_S(\lambda)$的根，即$S$的特征值$\lambda_{i+1}$。

4. 边界分析

当 $\lambda \to -\infty$ 时，$f(\lambda) \to +\infty$，而在第一个极点左侧 $f(\mu_1^-) \to -\infty$，所以在 $(-\infty, \mu_1)$必有一个根$\lambda_1$。
当 $\lambda \to +\infty$ 时，$f(\lambda) \to -\infty$，而在最后一个极点右侧 $f(\mu_{n-1}^+) \to +\infty$，所以在 $(\mu_{n-1}, +\infty)$必有一个根$\lambda_n$。

5. 结论

综合以上所有区间的零点分布，我们得到：

$$ \lambda_1 < \mu_1 < \lambda_2 < \mu_2 < \dots < \mu_{n-1} < \lambda_n $$

这完整证明了 $A$的特征值严格交错地分布在$S$ 的特征值之间。

LOADING