据 Gemini 说,这种方法叫稠密性论证。
核心范式:
「先在一个‘好’的稠密子集上证明 → 再用连续性/极限推广到一般情形」
可逆方阵性质推广至不可逆方阵
首先,对于任意方阵 $A$ ,我们考虑 $A+\lambda I$。由于 $\det(A+\lambda I)$ 是 $\lambda$ 至多 $n$ 次的多项式,所以至多有 $n$ 个零点。
这意味着至多存在 $n$ 个 $\lambda$ 使得 $\det(A+\lambda I) = 0$(即不可逆),从而有无数个 $\lambda$ 使得其可逆。缩小取值范围,可取最小的非零根 $\lambda_m$,只要 $\delta < \lambda_m$,则有 $\forall x \in (0, \delta), A+xI$ 可逆。
假设所有的可逆方阵都拥有性质 $\mathcal{A}$,如果 $\mathcal{A}$ 在矩阵空间连续,那么对于一个不可逆方阵,我们考虑加上一个小扰动 $xI$ 让其变得可逆,然后令 $x \to 0$,就得到其亦满足性质 $\mathcal{A}$。
注意: 但对于类似“秩”的性质,这种手法便难以成功,因为该性质不连续,可能出现跃变。
可对角化矩阵性质推广至不可对角化矩阵
稠密性引理 (Density Lemma):
在矩阵空间 $\mathbb{C}^{n \times n}$ 中,特征值互异的矩阵(必可对角化矩阵) 构成的集合 $\mathcal{D}$ 是稠密的。这意味着对于任意矩阵 $A$,都存在序列 ${A_k} \subset \mathcal{D}$ 使得:
$$ \lim_{k \to \infty} A_k = A $$
引理证明
等价命题:
设 $\mathcal{D} = { M \in \mathbb{C}^{n \times n} \mid M \text{ 拥有 } n \text{ 个互异的特征值} }$。则对于任意 $A \in \mathbb{C}^{n \times n}$,在其任意邻域内均存在 $A_\epsilon \in \mathcal{D}$。
1. 构造判别式多项式
对于任意矩阵 $M$,其特征多项式为 $p_M(\lambda) = \det(\lambda I - M)$。定义 $M$ 的判别式 (Discriminant) 为:
$$ \Delta(M) = \prod_{1 \le i < j \le n} (\lambda_i - \lambda_j)^2 $$
其中 $\lambda_1, \dots, \lambda_n$ 是 $M$ 的特征值。
- 根据对称多项式基本定理,$\Delta(M)$ 可以表示为 $p_M(\lambda)$ 系数的多项式。
- 由于 $p_M(\lambda)$ 的系数是 $M$ 中元素 $m_{ij}$ 的多项式,故 $\Delta(M)$ 是一个关于 $m_{ij}$ 的复多项式函数。
2. 判定准则
由判别式的定义可知:
$$ M \in \mathcal{D} \iff \Delta(M) \neq 0 $$
反之,$M$ 具有重根当且仅当 $\Delta(M) = 0$。3. 构造扰动直线
取一个特征值互异的对角矩阵 $E = \text{diag}(1, 2, \dots, n) \in \mathcal{D}$。对于给定的矩阵 $A$,定义复变量 $\epsilon$ 的多项式函数:
$$ g(\epsilon) = \Delta(A + \epsilon E) $$
- 当 $\epsilon$ 足够大时,矩阵 $A/\epsilon + E$ 趋近于 $E$。由于 $E$ 的特征值互异,由特征值的连续性可知,存在某个 $\epsilon_0$ 使得 $A + \epsilon_0 E \in \mathcal{D}$。 - 因此,$g(\epsilon_0) \neq 0$,这意味着 $g(\epsilon)$ 是一个**非恒为零**的多项式。4. 孤立零点与稠密性
根据复分析性质,非恒为零的多项式 $g(\epsilon)$ 在复平面上只有有限个孤立零点。
- 因此,在 $\epsilon = 0$ 的任意开邻域内,必然存在无穷多个 $\epsilon$ 使得 $g(\epsilon) \neq 0$。
- 取序列 $\epsilon_k \to 0$ 且满足 $g(\epsilon_k) \neq 0$,则构造序列 $A_k = A + \epsilon_k E$。
结论:
由于 $g(\epsilon_k) \neq 0 \implies A_k \in \mathcal{D}$,且 $\lim_{k \to \infty} A_k = A$,证得 $\mathcal{D}$ 在 $\mathbb{C}^{n \times n}$ 中稠密。
证明:Cayley-Hamilton 定理(连续性方法)
定理陈述:
设 $A \in \mathbb{C}^{n \times n}$,其特征多项式为 $p_A(\lambda) = \det(\lambda I - A)$,则有 $p_A(A) = O$。
1. 稠密性基础
对于任意矩阵 $A$,都存在序列 ${A_k} \subset \mathcal{D}$ 使得 $\lim_{k \to \infty} A_k = A$。
2. 针对 $A \in \mathcal{D}$ 的证明
若 $A$ 特征值互异,则 $A$ 可对角化为 $A = P \Lambda P^{-1}$。
$$ \begin{aligned} p_A(A) &= P p_A(\Lambda) P^{-1} \\ &= P \text{diag}(p_A(\lambda_1), \dots, p_A(\lambda_n)) P^{-1} \end{aligned} $$
由于 $\lambda_i$ 是 $p_A(\lambda)$ 的根,故 $p_A(\lambda_i) = 0$,从而 $p_A(A) = O$。3. 连续性扩张
定义映射 $f(M) = p_M(M)$。
- 连续性:$p_M(\lambda)$ 的系数是 $M$ 元素的行列式多项式,矩阵幂次也是连续的,故 $f(M)$ 是连续函数。
- 极限推导:
$$ \begin{aligned} f(A) &= f(\lim_{k \to \infty} A_k) \\ &= \lim_{k \to \infty} f(A_k) \\ &= \lim_{k \to \infty} O = O \end{aligned} $$
**证毕。**正定矩阵性质推广到半正定矩阵
对正定矩阵证明后,通过给半正定矩阵加上 $\epsilon I$($\epsilon \to 0^+$)使其变为正定矩阵,再利用连续性,半正定矩阵自然也满足相关性质。
秩一扰动
我们将矩阵 $A$ 加上一个秩一矩阵 $uv^T$ 即有 $A+uv^T$。根据 Woodbury 恒等式:
$$ \det(A + uv^T) = (1 + v^T A^{-1} u) \det(A) $$
以及
$$ (A + uv^T)^{-1} = A^{-1} - \frac{A^{-1}uv^T A^{-1}}{1 + v^T A^{-1}u} $$
忘了这个在哪出现以及应用了,AI给出的应用我都没印象,就不写了,鉴于和扰动有关,就扔在这里了(
柯西交错定理 (Cauchy’s Interlacing Theorem)
即 $n-1$ 阶主子阵 $A$ 的特征值 $\mu_j$ 严格交错地分布在 $n$ 阶对称矩阵 $S$ 的特征值 $\lambda_i$ 之间。
1. 构造矩阵与特征多项式
设 $S$ 是 $n$ 阶对称矩阵:
$$ S = \begin{bmatrix} A & \mathbf{b} \\ \mathbf{b}^T & c \end{bmatrix} $$
利用 Schur 补展开特征多项式 $P_S(\lambda) = \det(S - \lambda I)$:$$ P_S(\lambda) = \det(A - \lambda I) \cdot \left( (c - \lambda) - \mathbf{b}^T (A - \lambda I)^{-1} \mathbf{b} \right) $$
2. 利用谱分解展开二次型
设 $A$ 的特征值为 $\mu_1 \leq \dots \leq \mu_{n-1}$,单位正交特征向量为 $v_j$。对 $(A - \lambda I)^{-1}$ 进行谱展开,令 $\beta_j^2 = (v_j^T \mathbf{b})^2$:
$$ P_S(\lambda) = P_A(\lambda) \left( c - \lambda - \sum_{j=1}^{n-1} \frac{\beta_j^2}{\mu_j - \lambda} \right) $$
3. 分析符号变化(核心证明)
考虑函数 $f(\lambda) = c - \lambda - \sum_{j=1}^{n-1} \frac{\beta_j^2}{\mu_j - \lambda}$。
- 极点跳变:
- 当 $\lambda \to \mu_i^-$ 时,$f(\lambda) \to -\infty$。
- 当 $\lambda \to \mu_i^+$ 时,$f(\lambda) \to +\infty$。
- 根的分布:在每一个开区间 $(\mu_i, \mu_{i+1})$ 内,$f(\lambda)$ 从 $+\infty$ 连续变化到 $-\infty$,由零点存在定理,区间内必有 $S$ 的一个特征值。
4. 结论
综合各区间及边界分析($\lambda \to \pm\infty$):
$$ \lambda_1 < \mu_1 < \lambda_2 < \mu_2 < \dots < \mu_{n-1} < \lambda_n $$
证得 $A$ 的特征值严格交错地分布在 $S$ 的特征值之间。