据Gemini说,这种方法叫稠密性论证。
核心范式:
「先在一个‘好’的稠密子集上证明 → 再用连续性/极限推广到一般情形」
可逆方阵性质推广至不可逆方阵
首先,对于任意方阵 $A$,我们考虑$A+\lambda I$,由于$det(A+\lambda I)$是$\lambda$至多$n$次的多项式,所以至多有$n$个零点,也就是说,至多存在$n$个$\lambda$使得$det(A+\lambda I)$不可逆,从而有无数个$\lambda$使得其可逆,缩小之,可取最小的根$\lambda_m$,只要$\delta < \lambda_m$,则有$\forall x < \delta,A+xI$ 可逆。
假设所有的可逆方阵都拥有性质 $\mathcal{A}$,如果$\mathcal{A}$在矩阵空间连续,那么对于一个不可逆方阵,我们考虑加上一个小扰动$xI$让其变得可逆,然后令$x \to 0$,就得到其亦满足性质 $\mathcal{A}$ 。
但对于类似秩的性质,这种手法便难以成功,该性质不连续,可能出现跃变。
可对角化矩阵性质推广至不可对角化矩阵
稠密性引理 (Density Lemma):
在矩阵空间 $\mathbb{C}^{n \times n}$中,特征值互异的矩阵(可对角化矩阵) 构成的集合$D$ 是稠密的。
这意味着对于任意矩阵 $A$,都存在序列 ${A_k} \subset D$ 使得:
$$ \lim_{k \to \infty} A_k = A $$
引理证明如下
等价命题:
设 $\mathcal{D} = { M \in \mathbb{C}^{n \times n} \mid M \text{ 拥有 } n \text{ 个互异的特征值} }$。则对于任意 $A \in \mathbb{C}^{n \times n}$,在其任意邻域内均存在 $A_\epsilon \in \mathcal{D}$。
证明:
1. 构造判别式多项式
对于任意矩阵 $M$,其特征多项式为 $p_M(\lambda) = \det(\lambda I - M)$。定义 $M$ 的判别式 (Discriminant) 为:
$$ \Delta(M) = \prod_{1 \le i < j \le n} (\lambda_i - \lambda_j)^2 $$
其中 $\lambda_1, \dots, \lambda_n$是$M$ 的特征值。
根据对称多项式基本定理,$\Delta(M)$可以表示为$p_M(\lambda)$ 系数的多项式。
由于 $p_M(\lambda)$的系数是$M$中元素$m_{ij}$的多项式,故$\Delta(M)$是一个关于$m_{ij}$ 的 复多项式函数:$\Delta: \mathbb{C}^{n \times n} \to \mathbb{C}$。
2. 判定准则
由判别式的定义可知:
$$ M \in \mathcal{D} \iff \Delta(M) \neq 0 $$
反之,$M$具有重根当且仅当$\Delta(M) = 0$。
3. 构造扰动直线
取一个特征值互异的对角矩阵 $E = \text{diag}(1, 2, \dots, n) \in \mathcal{D}$。对于给定的矩阵 $A$,定义复变量 $\epsilon$ 的多项式函数:
$$ g(\epsilon) = \Delta(A + \epsilon E) $$
当 $\epsilon$足够大时,矩阵$A/\epsilon + E$趋近于$E$。由于 $E$的特征值互异,由特征值的连续性可知,存在某个$\epsilon_0$使得$A + \epsilon_0 E \in \mathcal{D}$。
因此,$g(\epsilon_0) \neq 0$,这意味着 $g(\epsilon)$ 是一个非恒为零的多项式。
4. 孤立零点与稠密性
根据复分析或代数学性质,非恒为零的多项式 $g(\epsilon)$在复平面$\mathbb{C}$ 上只有有限个孤立零点。
因此,在 $\epsilon = 0$的任意开邻域$U = { \epsilon \mid |\epsilon| < \delta }$内,必然存在无穷多个$\epsilon^$使得$g(\epsilon^) \neq 0$。
取序列 $\epsilon_k \to 0$且满足$g(\epsilon_k) \neq 0$,则构造序列 $A_k = A + \epsilon_k E$。
结论:
由于 $g(\epsilon_k) \neq 0 \implies A_k \in \mathcal{D}$,且 $\lim_{k \to \infty} A_k = A$,证得 $\mathcal{D}$在$\mathbb{C}^{n \times n}$中稠密。由于$\mathcal{D}$ 中的矩阵必可对角化,故可对角化矩阵集合亦稠密。
证毕。
证明:Cayley-Hamilton 定理(连续性方法)
定理陈述:
设 $A \in \mathbb{C}^{n \times n}$,其特征多项式为 $p_A(\lambda) = \det(\lambda I - A)$,则有 $p_A(A) = O$。
**1. 根据稠密性原理,对于任意矩阵 $A$,都存在序列 ${A_k} \subset D$ 使得:
$$ \lim_{k \to \infty} A_k = A $$
2. 针对 $A \in D$ 的证明
若 $A$特征值互异,则$A$可对角化为$A = P \Lambda P^{-1}$,其中 $\Lambda = \text{diag}(\lambda_1, \dots, \lambda_n)$。
$$ p_A(A) = P p_A(\Lambda) P^{-1} = P \text{diag}(p_A(\lambda_1), \dots, p_A(\lambda_n)) P^{-1} $$
由于 $\lambda_i$是$p_A(\lambda)$的根,故$p_A(\lambda_i) = 0$,从而 $p_A(A) = O$。
3. 连续性扩张 (Continuity Argument)
定义映射 $f: \mathbb{C}^{n \times n} \to \mathbb{C}^{n \times n}$ 为:
$$ f(M) = p_M(M) $$
连续性: $p_M(\lambda)$的系数是$M$元素的行列式多项式,而$M$ 的幂次也是连续的。因此,$f(M)$是关于$M$ 元素的连续函数。
极限推导:
$$ f(A) = f(\lim_{k \to \infty} A_k) = \lim_{k \to \infty} f(A_k) $$
由于 $A_k \in D$,根据步骤 2 得到 $f(A_k) = O$。
$$ \therefore f(A) = \lim_{k \to \infty} O = O $$
证毕。
💡 笔记小贴士:
- 为什么要在 $\mathbb{C}$而不是$\mathbb{R}$中证明? 因为在实数域$\mathbb{R}$ 上,特征值可能不存在(变成复数),会导致“稠密性”讨论变复杂。在复数域下,任何矩阵都至少有特征值,处理起来最自然。
正定矩阵性质推广到半正定矩阵
完全类似上方,具体可参照 [[数学随笔9#(半)正定矩阵的行列式约束]],对正定矩阵证明后,半正定矩阵自然也满足该性质。
秩一扰动
类似上方,我们将矩阵 $A$加上一个秩一矩阵$uv^T$即有$A+uv^T$。
参考[[数学随笔2#Woodbury 恒等式]],我们有
$$ \det(A + uv^T) = (1 + v^T A^{-1} u) \det(A) $$
以及
$$ (A + uv^T)^{-1} = A^{-1} - \frac{A^{-1}uv^T A^{-1}}{1 + v^T A^{-1}u} $$
我忘了在哪见到的,也忘了有什么应用,但都是扰动,就扔进来吧(
柯西交错定理 (Cauchy’s Interlacing Theorem)
即 $n-1$阶主子阵$A$的特征值$\mu_j$严格交错地分布在$n$阶对称矩阵$S$的特征值$\lambda_i$ 之间。
1. 构造矩阵与特征多项式
设 $S$是$n$ 阶对称矩阵,将其写成分块形式:
$$ S = \begin{bmatrix} A & \mathbf{b} \\ \mathbf{b}^T & c \end{bmatrix} $$
其中 $A$是$(n-1) \times (n-1)$ 的对称主子阵,$c$ 是标量,$\mathbf{b}$是$n-1$维列向量。$S$的特征多项式定义为$P_S(\lambda) = \det(S - \lambda I)$。利用分块矩阵的行列式性质(Schur补):
$$ P_S(\lambda) = \det(A - \lambda I) \cdot \left( (c - \lambda) - \mathbf{b}^T (A - \lambda I)^{-1} \mathbf{b} \right) $$
2. 利用谱分解展开二次型
设 $A$的特征值为$\mu_1 \leq \mu_2 \leq \dots \leq \mu_{n-1}$,对应的单位正交特征向量为 $v_1, v_2, \dots, v_{n-1}$。
如前所述,将 $(A - \lambda I)^{-1}$ 进行谱展开:
$$ \mathbf{b}^T (A - \lambda I)^{-1} \mathbf{b} = \sum_{j=1}^{n-1} \frac{(v_j^T \mathbf{b})^2}{\mu_j - \lambda} $$
令 $\beta_j^2 = (v_j^T \mathbf{b})^2$(这是非负常数),代入原多项式:
$$ P_S(\lambda) = P_A(\lambda) \left( c - \lambda - \sum_{j=1}^{n-1} \frac{\beta_j^2}{\mu_j - \lambda} \right) $$
3. 分析符号变化(核心证明)
为了简化讨论,假设 $\beta_j \neq 0$且$\mu_j$ 各不相同(一般情况可通过极限逼近说明)。
考虑函数 $f(\lambda) = c - \lambda - \sum_{j=1}^{n-1} \frac{\beta_j^2}{\mu_j - \lambda}$。
极点处的跳变:当 $\lambda$从左侧趋近于$\mu_i$ 时($\lambda \to \mu_i^-$),项 $\frac{\beta_i^2}{\mu_i - \lambda} \to +\infty$,因此 $f(\lambda) \to -\infty$。
极点处的跳变:当 $\lambda$从右侧趋近于$\mu_i$ 时($\lambda \to \mu_i^+$),项 $\frac{\beta_i^2}{\mu_i - \lambda} \to -\infty$,因此 $f(\lambda) \to +\infty$。
在每一个开区间 $(\mu_i, \mu_{i+1})$ 内:
$f(\lambda)$从$+\infty$连续变化到$-\infty$。
根据连续性,$f(\lambda)$ 在此区间内必然至少有一个根。
因为 $P_S(\lambda) = P_A(\lambda) f(\lambda)$,且在该区间内 $P_A(\lambda) \neq 0$,所以 $f(\lambda)$的根就是$P_S(\lambda)$的根,即$S$的特征值$\lambda_{i+1}$。
4. 边界分析
当 $\lambda \to -\infty$ 时,$f(\lambda) \to +\infty$,而在第一个极点左侧 $f(\mu_1^-) \to -\infty$,所以在 $(-\infty, \mu_1)$必有一个根$\lambda_1$。
当 $\lambda \to +\infty$ 时,$f(\lambda) \to -\infty$,而在最后一个极点右侧 $f(\mu_{n-1}^+) \to +\infty$,所以在 $(\mu_{n-1}, +\infty)$必有一个根$\lambda_n$。
5. 结论
综合以上所有区间的零点分布,我们得到:
$$ \lambda_1 < \mu_1 < \lambda_2 < \mu_2 < \dots < \mu_{n-1} < \lambda_n $$
这完整证明了 $A$的特征值严格交错地分布在$S$ 的特征值之间。