LOADING

加载过慢请开启缓存 浏览器默认开启

Logic の 博客

一小块凝固的时间

笔记4.矩阵空间与向量空间的同构

线代 2026/4/13

对一个向量,我们把它看做 $n$个坐标,构建从向量到$n$ 个坐标的同构。
矩阵实际上也就是向量的堆叠,那类似的我们把它看做 $n$ 个向量,也可以构建同构。

矩阵的展开 (Matrix Vectorization)

  • 列展开 $\text{cs}(A)$:将 $m \times n$矩阵$A$的元素自左向右、一列一列地排列成一个$mn$ 维列向量。

    • 示例:若 $A = \begin{pmatrix} 1 & 4 \ 2 & 5 \ 3 & 6 \end{pmatrix}$,则 $\text{cs}(A) = [1, 2, 3, 4, 5, 6]^T$。
  • 行展开 $\text{rs}(A)$:类似地,将矩阵按行顺序排列成一个行向量。

    • 示例:对于上述矩阵,$rs(A) = [1, 4, 2, 5, 3, 6]$。

这显然是同构,也就是说,我们完全可以把矩阵看成一个超级向量。


Kronecker 积 (Kronecker Product)

定义

设矩阵 $A = [a_{ij}] \in M_{m,n}(K)$,矩阵 $B \in M_{p,q}(K)$。它们的 Kronecker 积(也称张量积)记为 $A \otimes B$,是一个 $mp \times nq$ 的分块矩阵:

$$ A \otimes B = \begin{pmatrix} a_{11}B & \dots & a_{1n}B \\ \vdots & \ddots & \vdots \\ a_{m1}B & \dots & a_{mn}B \end{pmatrix} $$

即用 $A$的每个元素$a_{ij}$乘以矩阵$B$ 得到的分块矩阵。

关键性质

  • 非交换性:一般情况下,$A \otimes B \neq B \otimes A$。

  • 结合律:$(A \otimes B) \otimes C = A \otimes (B \otimes C)$。

  • 特殊情形:当 $A$为列向量且$C$为行向量时(或反之),在特定维度下可能满足$A \otimes C = C \otimes A = AC$。


运算示例

基础计算

若 $A = \begin{pmatrix} 1 & 2 & 3 \ 4 & 5 & 6 \end{pmatrix}$,$B = \begin{pmatrix} a & b \ c & d \end{pmatrix}$,则:

$$ A \otimes B = \begin{pmatrix} B & 2B & 3B \\ 4B & 5B & 6B \end{pmatrix} = \begin{pmatrix} a & b & 2a & 2b & 3a & 3b \\ c & d & 2c & 2d & 3c & 3d \\ 4a & 4b & 5a & 5b & 6a & 6b \\ 4c & 4d & 5c & 5d & 6c & 6d \end{pmatrix} $$

向量间的积

若 $A = [1, 2, 3]^T$,$B = [a, b]^T$,则:

  • $A \otimes B = [a, b, 2a, 2b, 3a, 3b]^T$-$B \otimes A = [a, 2a, 3a, b, 2b, 3b]^T$

    (此处直观展示了顺序不同导致的结果差异)


4. 混合乘积公式 (Mixed-Product Property)

这是 Kronecker 积最重要的性质之一,联系了普通矩阵乘法与张量积:

$$ (A \otimes B)(C \otimes D) = (AC) \otimes (BD) $$

  • 前提条件:矩阵乘法 $AC$和$BD$必须有意义(即$A$的列数等于$C$ 的行数,$B$的列数等于$D$ 的行数)。

  • 推导逻辑:通过分块矩阵乘法规律可以证明,左侧展开后的子块项 $\sum a_{ik} c_{kj} B D$正好对应右侧$(AC) \otimes (BD)$ 的构造。

Kronecker 积的核心性质

  • 结合律:$(A \otimes B) \otimes C = A \otimes (B \otimes C)$

  • 混合乘积公式:$(A \otimes B)(C \otimes D) = AC \otimes BD$

  • 逆矩阵:$(A \otimes B)^{-1} = A^{-1} \otimes B^{-1}$

  • 转置:$(A \otimes B)^T = A^T \otimes B^T$- 正交性保持:若$A, B$是正交矩阵,则$A \otimes B$ 也是正交矩阵。


代数特征(秩、行列式、特征值)

  1. :$\text{rank}(A \otimes B) = \text{rank}(A) \cdot \text{rank}(B)$2. 行列式:设$A$为$m$ 阶方阵,$B$为$n$阶方阵,则$|A \otimes B| = |A|^n |B|^m$

  2. 特征值

    • 设 $A$的特征值为$\lambda_i$,$B$的特征值为$\mu_j$。

    • $A \otimes B$的特征值为$\lambda_i \mu_j$。

    • Kronecker 和 $A \otimes I_n + I_m \otimes B$的特征值为$\lambda_i + \mu_j$。


特殊实例:Hadamard 矩阵的构造

利用 Kronecker 积可以递归构造特殊的正交矩阵(如 Hadamard 矩阵):

  • $A_2 = \frac{1}{\sqrt{2}} \begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix}$-$A_4 = A_2 \otimes A_2 = \frac{1}{2} \begin{pmatrix} A_2 & A_2 \ A_2 & -A_2 \end{pmatrix}$-$A_8 = A_2 \otimes A_4$ … 以此类推。

矩阵列展开的核心定理

这是连接矩阵方程与线性方程组的桥梁:

定理:$\text{cs}(AXB) = (B^T \otimes A) \text{cs}(X)$

证明逻辑拆解:

  1. 左乘变换:$\text{cs}(AX) = (I_n \otimes A) \text{cs}(X)$。这说明 $A$对$X$ 的左乘对应于列展开后的块对角阵相乘。

  2. 右乘变换:$\text{cs}(XB) = (B^T \otimes I_m) \text{cs}(X)$。注意此处 $B$ 需要转置。

  3. 合成结论:通过结合律 $\text{cs}(A(XB)) = (I_n \otimes A) \text{cs}(XB) = (I_n \otimes A)(B^T \otimes I_m) \text{cs}(X)$,利用混合乘积公式化简为 $(B^T \otimes A) \text{cs}(X)$。


线性变换的矩阵表示

设 $\mathcal{A}: X \mapsto AXB$是矩阵空间$M_{m,n}(K)$ 上的线性变换:

  • 在标准基 $E_{1,1}, E_{2,1}, \dots, E_{m,n}$(即按列展开排序)下,该线性变换对应的矩阵正是 $B^T \otimes A$

  • 直观理解

    • $A$作用于$X$ 的行变换

    • $B$作用于$X$ 的列变换


线性矩阵方程的向量化求解

基于前文的列展开性质,可以将复杂的矩阵方程转化为标准的线性方程组形式。

  • 推论:$X \in M_{m,n}(K)$是矩阵方程$\sum_{j=1}^{s} A_j X B_j = C$的解,当且仅当其列展开$\text{cs}(X)$ 满足:

$$ \left( \sum_{j=1}^{s} B_j^T \otimes A_j \right) \text{cs}(X) = \text{cs}(C) $$

其中 $A_j, B_j$分别为$m, n$ 级方阵,$C \in M_{m,n}(K)$。

  • 本质:这利用了 Kronecker 积将矩阵算子“拉直”为算子矩阵,使得我们能用经典的线性代数工具(如高斯消元法)来处理矩阵方程。

张量积空间 (Tensor Product Space)

将张量积从矩阵运算上升到线性空间的构造。

  • 定义:设 $U = R^m, V = R^n$ 是两个线性空间,集合

$$ T = \left\{ \sum_{i=1}^{k} \alpha_i \otimes \beta_i \mid \alpha_i \in U, \beta_i \in V, k \geq 1 \right\} $$

构成一个线性空间,称为 $U$与$V$的张量积空间,记为$U \otimes V$。

  • 基与维数

    • 若 $\alpha_1, \dots, \alpha_m$是$U$ 的基,$\beta_1, \dots, \beta_n$是$V$ 的基。

    • 则所有可能的组合 ${\alpha_i \otimes \beta_j}$构成$U \otimes V$ 的一组基。

    • 结论:$U \otimes V \cong R^{mn}$,即张量积空间的维数是原空间维数的乘积。


线性变换的张量积

这是张量积在算子层面的推广。

  • 定义:设 $\mathcal{A} \in \text{Hom}(U), \mathcal{B} \in \text{Hom}(V)$,定义线性变换 $\mathcal{A} \otimes \mathcal{B}: U \otimes V \to U \otimes V$ 为:

$$ \mathcal{A} \otimes \mathcal{B} (\alpha \otimes \beta) = (\mathcal{A}\alpha) \otimes (\mathcal{B}\beta) $$

该变换称为变换 $\mathcal{A}$与$\mathcal{B}$ 的张量积。

  • 矩阵表示

    若 $\mathcal{A}$在基${\alpha_i}$下的矩阵为$A$,$\mathcal{B}$在基${\beta_j}$下的矩阵为$B$,则线性变换 $\mathcal{A} \otimes \mathcal{B}$在$U \otimes V$的基${\alpha_i \otimes \beta_j}$ 下的矩阵恰好就是 $A \otimes B$

这些东西实际上是可以简化结构,让我们更清楚地看到矩阵的,例如我们可以看一些问题:


题目:矩阵方程解空间的性质证明

设 $A, B$分别是$m, n$级方阵,且$\text{rank}(A) = r$,$\text{rank}(B) = s$。证明:

$$ W = \{ X \in M_{m,n}(K) \mid AXB = 0 \} $$

是矩阵空间 $M_{m,n}(K)$的子空间,且$\dim W = mn - rs$。


1. 证明 $W$ 是子空间

根据子空间的定义,需验证对加法和数乘的封闭性:

  • 加法封闭性:设 $X, Y \in W$,则有 $AXB = 0$且$AYB = 0$。

$$ A(X + Y)B = AXB + AYB = 0 + 0 = 0 $$

故 $X + Y \in W$。

  • 数乘封闭性:设 $X \in W, k \in K$,则:

$$ A(kX)B = k(AXB) = k \cdot 0 = 0 $$

故 $kX \in W$。

由此可知,$W$是$M_{m,n}(K)$ 的子空间。

2. 证明 $\dim W = mn - rs$

这里使用了**列展开(Vectorization)**和 Kronecker 积 的性质将矩阵问题转化为线性方程组问题。

(1) 方程转化

利用恒等式 $\text{cs}(AXB) = (B^T \otimes A) \text{cs}(X)$,原矩阵方程 $AXB = 0$ 等价于线性方程组:

$$ (B^T \otimes A) \cdot \text{cs}(X) = \mathbf{0} $$

其中,$\text{cs}(X)$是一个$mn$维的列向量,系数矩阵为$M = B^T \otimes A$,其规模为 $mn \times mn$。

(2) 确定系数矩阵的秩

根据 Kronecker 积关于秩的性质:

$$ \text{rank}(B^T \otimes A) = \text{rank}(B^T) \cdot \text{rank}(A) $$

由于矩阵转置不改变秩,且已知 $\text{rank}(A) = r, \text{rank}(B) = s$,则:

$$ \text{rank}(B^T \otimes A) = s \cdot r = rs $$

(3) 利用维数公式

子空间 $W$ 的维数等价于上述齐次线性方程组解空间的维数。根据线性方程组解空间的维数公式($n$ 维空间减去系数矩阵的秩):

$$ \dim W = \dim (\text{解空间}) = mn - \text{rank}(B^T \otimes A) = mn - rs $$

证毕。

题目:矩阵变换 $\mathcal{S}$ 的特征值与对角化证明

设 $A, B$分别是$m, n$阶复矩阵,其特征值分别为${\lambda_1, \dots, \lambda_m}$与${\mu_1, \dots, \mu_n}$。

定义映射 $\mathcal{S}: M_{m,n}(\mathbb{C}) \to M_{m,n}(\mathbb{C})$:

$$ \mathcal{S}(X) = AX - XB + AXB^2 $$


1. 证明 $\mathcal{S}$ 是线性变换

根据线性变换的定义,需满足加法与数乘的齐次性:

  • 线性度验证:利用矩阵乘法的分配律与结合律:

$$ \mathcal{S}(k_1 X + k_2 Y) = A(k_1 X + k_2 Y) - (k_1 X + k_2 Y)B + A(k_1 X + k_2 Y)B^2 $$

$$ = k_1(AX - XB + AXB^2) + k_2(AY - YB + AYB^2) = k_1 \mathcal{S}(X) + k_2 \mathcal{S}(Y) $$

故 $\mathcal{S}$是$M_{m,n}(\mathbb{C})$ 上的线性变换。


2. 求变换 $\mathcal{S}$ 的所有特征值

利用列展开(Vectorization),我们将 $\mathcal{S}(X)$ 转换为向量形式:

$$ \text{cs}(\mathcal{S}(X)) = \text{cs}(AXI_n - I_m XB + AXB^2) $$

根据公式 $\text{cs}(AXB) = (B^T \otimes A) \text{cs}(X)$,提取 $\text{cs}(X)$得到变换矩阵$M$:

$$ M = (I_n \otimes A) - (B^T \otimes I_m) + ((B^2)^T \otimes A) $$

  • 特征值计算

    已知 $A$的特征值为$\lambda_i$,$B$(及 $B^T$)的特征值为 $\mu_j$。

    根据 Kronecker 积的性质,特征值的对应关系为:

    • $I_n \otimes A$的特征值为$1 \cdot \lambda_i = \lambda_i$-$B^T \otimes I_m$的特征值为$\mu_j \cdot 1 = \mu_j$-$(B^T)^2 \otimes A$的特征值为$\mu_j^2 \cdot \lambda_i$由于这些项在同一组基(由$A$和$B^T$的特征向量构成的张量积基)下可以同时三角化,因此变换$\mathcal{S}$ 的特征值为:

$$ \lambda'_{ij} = \lambda_i - \mu_j + \lambda_i \mu_j^2, \quad (i=1,\dots,m; \ j=1,\dots,n) $$


3. 对角化证明与特征向量

证明:

  1. 前提条件:已知 $A$和$B$可对角化。这意味着$A$有$m$个线性无关的特征向量$\alpha_i$, $B^T$有$n$个线性无关的特征向量$\gamma_j$(注意 $B$可对角化则$B^T$ 亦然,且特征值相同)。

  2. 构造变换 $\mathcal{S}$ 的特征向量

    在张量积空间 $M_{m,n}(\mathbb{C})$中,变换$\mathcal{S}$ 的特征向量对应的“矩阵形式”为:

$$ X_{ij} = \alpha_i \beta_j^H \quad (\text{或更简单地记为 } \alpha_i \text{ 与 } B \text{ 的左特征向量的积}) $$

更严谨地说,若 $A\alpha_i = \lambda_i \alpha_i$,且 $\beta_j$是$B$的特征向量(满足$B\beta_j = \mu_j \beta_j$并不直观,这里通常看作$X \beta_j$ 的映射关系)。

  1. 结论

    由于我们能构造出 $m \times n$个形如$E_{ij} = \alpha_i \otimes \gamma_j$的线性无关特征向量,而空间$M_{m,n}(\mathbb{C})$的维数恰好也是$mn$,特征向量集构成了空间的一组基。

    故 $\mathcal{S}$ 可对角化。

  • $\mathcal{S}$ 的特征向量(矩阵形式)

    即满足 $\mathcal{S}(X) = \lambda’_{ij} X$的矩阵。若$A \alpha_i = \lambda_i \alpha_i$且$\beta_j^T B = \mu_j \beta_j^T$(即 $\beta_j^T$是$B$ 的左特征向量),则:

$$ X_{ij} = \alpha_i \beta_j^T $$

阅读全文

笔记3.线性空间

线代 2026/4/13

尽管可能显得欠缺一定的连续性,先论述线性空间是合理的,尔后再从多项式延展到空间分解才更为自然,或许不妨看做两个分支,从线性空间和多项式环合并而导回线性代数的主分支。

仍然给出一坨定义:

线性空间的结构

线性空间的定义与公理体系

线性空间是一个非空集合 $V$(其中的元素称为抽象向量),建立在数域 $K$ 之上,并定义了两种运算:加法数乘

核心运算与封闭性

  1. 加法 (Vector Addition)

    • 定义:$V \times V \to V$

    • 映射:$(\alpha, \beta) \mapsto \alpha + \beta$- 本质:集合$V$ 对加法运算封闭。

  2. 数乘 (Scalar Multiplication)

    • 定义:$K \times V \to V$

    • 映射:$(k, \alpha) \mapsto k\alpha$- 本质:数域$K$中的标量与向量结合,结果仍留在$V$ 中。


八条公理 (The 8 Axioms)

这八条准则共同构成了线性空间的骨架。前四条确立了 $V$ 在加法下的交换群(阿贝尔群)地位,后四条规定了数乘与加法的兼容性。

1. 加法性质(交换群)

  • (1) 交换律: $\alpha + \beta = \beta + \alpha$- (2) 结合律:$\alpha + (\beta + \gamma) = (\alpha + \beta) + \gamma$- (3) 存在单位元(零元素): 存在元素$0 \in V$,使得 $0 + \alpha = \alpha + 0 = \alpha, \forall \alpha \in V$- (4) 存在逆元(负元素): 对任何$\alpha$,都有 $-\alpha \in V$,使得 $\alpha + (-\alpha) = (-\alpha) + \alpha = 0$

    推论: 零元素与负元素在给定空间中是唯一的。

2. 数乘性质

对 $\forall \alpha, \beta \in V$以及$\forall k, l \in K$:

  • (5) 数乘单位元: $1 \cdot \alpha = \alpha$- (6) 数乘结合律:$k(l\alpha) = (kl)\alpha$- (7) 左分配律:$(k + l)\alpha = k\alpha + l\alpha$- (8) 右分配律:$k(\alpha + \beta) = k\alpha + k\beta$

$V$是能与$K$ 作数乘的交换群。

与环的对比

如果把代数结构比作某种构建规则,线性空间强调的是层次间的互动,而环强调的是内部的自我演化

  • 环(Ring) 是一个 “自给自足” 的单集结构。它在一个集合 $R$ 上定义了两种二元运算:加法和乘法。所有的操作($a+b$或$a \cdot b$)都发生在 $R$ 内部。你可以把它想象成一个封闭的黑盒,里面的元素通过两种规则自我碰撞。

  • 线性空间(Vector Space) 是一个 “双集联动” 的结构。它涉及两个集合:一个向量集 $V$和一个数域$K$(标量)。加法是 $V$内部的互动,但乘法(数乘)是跨界的——由域$K$中的“外部力量”作用于$V$ 中的元素。

这部分讲义将讨论的重心从线性空间的“定义”转向了它的结构度量。如果说公理是空间的“宪法”,那么基(Basis)维数(Dimension) 就是它的“骨架”与“尺度”。


类似我们熟悉的向量组的讨论,线性空间也可以完全类似地定义基、维数等,事实上我们将看到线性映射和矩阵是同构的。

基、维数与同构

向量组的秩与极大无关组

  • 极大无关组:向量组可以有许多不同的极大无关组,但它们包含的向量个数必然相同。

  • 秩(Rank):极大无关组所含向量的个数称为该向量组的秩。

基底与维数

对于线性空间 $V$的子集$S$:

  1. 线性表出:若 $V$中每个向量都能表示为$S$中有限个向量的线性组合,称$S$能线性表出$V$。

  2. 线性无关:若 $S$的任意有限子集都线性无关,则称$S$ 线性无关。

基底(Basis)的定义

若子集 $S$ 同时满足:

  1. $S$ 线性无关;

  2. $S$能线性表出$V$;

    则称 $S$是$V$ 的一组

  • 维数(Dimension)

    • 若 $S$是有限集,则称$V$ 为有限维线性空间

    • $V$的任意两组基包含的向量个数相同,这个常数称为$V$的维数,记为$\dim V$。

    • 规定零空间 ${0}$的维数为$0$。


引理与推论

  • 引理:设 $\alpha_1, \dots, \alpha_s$线性无关,则$\alpha_1, \dots, \alpha_s, \beta$线性相关$\iff \beta$能被$\alpha_1, \dots, \alpha_s$ 线性表出。

  • 扩充定理(推论):在有限维线性空间 $V$中,任何线性无关的向量组$\alpha_1, \dots, \alpha_s$都能扩充为$V$ 的一组基。


基底的判定定理

设 $S$是有限维线性空间$V$的子集,以下三个条件中只要有两个成立,则三个条件都成立(即$S$构成$V$ 的基):

  1. $S$ 线性无关;

  2. $S$能线性表出$V$;

  3. $|S| = \dim V$(向量个数等于空间维数)。


坐标同构 $V \cong K^n$一旦在线性空间$V$中取定了一组基$\alpha_1, \alpha_2, \dots, \alpha_n$,那么 $V$中的每一个元素$\alpha$ 都可以唯一地表示为:

$$ \alpha = k_1\alpha_1 + k_2\alpha_2 + \dots + k_n\alpha_n $$

  • 坐标:列向量 $[k_1, k_2, \dots, k_n]^T \in K^n$称为$\alpha$ 在该基下的坐标。

  • 本质:这种一一对应关系保持了加法和数乘运算。这意味着,任何 $n$维线性空间在代数结构上都与$K^n$ 是一模一样的(同构)

关于基、换基等操作,可以在数学随笔3.基底思想阅读。


子空间的运算

线性子空间的定义

若线性空间 $V$的子集$W$满足以下三条性质,则称$W$是$V$ 的子空间

  1. 非空性/包含零向量:$0 \in W$2. 加法封闭性:若$\alpha, \beta \in W$,则 $\alpha + \beta \in W$3. 数乘封闭性:若$k \in K, \beta \in W$,则 $k\beta \in W$

本质:$W$在$V$ 原有的运算下也构成一个完备的线性空间,自动满足八条公理。


子空间的性质与构造

  • 定理(基扩张与维数)

    • 子空间 $W$的基都能扩充成全空间$V$ 的基。

    • 维数不等式:$\dim W \le \dim V$。

    • 等号成立条件:$\dim W = \dim V \iff W = V$。

  • 给出子空间的几种方式

    1. 生成元方式:由一组向量生成的张成空间 $W = \langle \alpha_1, \dots, \alpha_s \rangle$。

    2. 解空间方式:作为齐次线性方程组 $Ax = 0$ 的解集。

    3. 运算构造方式:通过交、和、正交补(内积空间中)等运算得到。


子空间的运算:交与和

1. 子空间的交 (Intersection)

  • 定理:若 $V_1, V_2$是$V$的子空间,则其交集$V_1 \cap V_2$也是$V$ 的子空间。

  • 注意:并集 $V_1 \cup V_2$一般不是子空间,除非其中一个包含另一个(即$V_1 \supseteq V_2$或$V_1 \subseteq V_2$)。

2. 子空间的和 (Sum)

  • 定义:若 $V_1, V_2$是$V$的子空间,集合${ \alpha_1 + \alpha_2 \mid \alpha_1 \in V_1, \alpha_2 \in V_2 }$称为$V_1$与$V_2$ 的和,记为 $V_1 + V_2$

  • 性质:$V_1 + V_2$也是$V$ 的子空间。

  • 生成元表示

    若 $V_1 = \langle \alpha_1, \dots, \alpha_r \rangle$,$V_2 = \langle \beta_1, \dots, \beta_s \rangle$,

    则 $V_1 + V_2 = \langle \alpha_1, \dots, \alpha_r, \beta_1, \dots, \beta_s \rangle$。

相比于并,和更能体现线性空间的味道,例如两条直线的并是两条直线作为一个整体,但是和则是铺成一个平面,带有了线性运算。同时,和可以直接构造子空间,并则不太容易。

维数公式

一、 定理内容

若 $V_1, V_2$是线性空间$V$ 的子空间,则它们的和空间与交空间的维数满足以下关系:

$$ \dim(V_1 + V_2) + \dim(V_1 \cap V_2) = \dim V_1 + \dim V_2 $$

直观理解:两个空间的合并维数,等于各自维数之和减去重复计算的交集部分维数。这与集合论中的容斥原理极其相似。


二、 证明概要

证明的核心在于通过基的扩充构造出一组能张成 $V_1 + V_2$ 的线性无关组。实际上在数学随笔3之基底思想已经干过完全一样的证明了。

  1. 取交空间的基:设 $V_1 \cap V_2$的一组基为$\alpha_1, \dots, \alpha_r$。此时 $\dim(V_1 \cap V_2) = r$。

  2. 向两侧扩充

    • 将其扩充为 $V_1$ 的基:$\alpha_1, \dots, \alpha_r, \beta_1, \dots, \beta_m$。则 $\dim V_1 = r + m$。

    • 将其扩充为 $V_2$ 的基:$\alpha_1, \dots, \alpha_r, \gamma_1, \dots, \gamma_s$。则 $\dim V_2 = r + s$。

  3. 构造和空间的基:证明 $\beta_1, \dots, \beta_m, \alpha_1, \dots, \alpha_r, \gamma_1, \dots, \gamma_s$线性无关且张成$V_1 + V_2$。

    • 若线性组合为零:$k_1\beta_1 + \dots + l_1\gamma_1 + \dots = 0$。

    • 变形得:$k_i\beta_i$的组合属于$V_2$,因此必然落在交集 $V_1 \cap V_2$ 中。

    • 利用交空间的基表出并结合线性无关性,推出所有系数全为 $0$。

  4. 结论:$\dim(V_1 + V_2) = m + r + s$。

    • 代入等式:$(m + r + s) + r = (r + m) + (r + s)$,公式成立。

线性无关、直和与唯一性表示

一、 线性无关 $\iff$ 表出唯一

对于向量组 $\alpha_1, \dots, \alpha_s$:

  • 核心逻辑:如果该向量组表示零向量的方式是唯一的,那么它表示任何能表出的向量的方式都是唯一的。

若满足表达零向量唯一,则设有两种方法表示 $\beta$ ,作差就得到两种方法的系数必须一样,那也就实际上只有一种方法。


二、 子空间的直和 (Direct Sum)

当我们将讨论的对象从“单个向量”提升到“子空间”时,唯一性依然是判定结构的核心。

1. 表示方式的定义

设 $V_1, \dots, V_s$是$V$的子空间。对于和空间$V_1 + \dots + V_s$中的任意向量$\beta$,其表示方式为:

$$ \beta = \alpha_1 + \alpha_2 + \dots + \alpha_s, \quad (\alpha_i \in V_i) $$

有序组 $(\alpha_1, \dots, \alpha_s)$称为$\beta$ 的一种表示。

2. 直和的判定:零向量的唯一性
  • 定理:表示零向量的方式唯一 $\iff$ 表示任何向量的方式都唯一。

  • 直和的定义:若 $V_1 + \dots + V_s$ 中任何元素的表示方式都唯一,则称该和为直和,记为:

$$ V_1 \oplus V_2 \oplus \dots \oplus V_s $$

  • 推导过程

    • 如果表示零向量的方式不唯一(存在非零向量之和为 $0$),则通过加法叠加,任何向量的表示都会有无数种组合。

    • 反之,若表示 $0$的方式唯一(即$\sum \alpha_i = 0 \implies \alpha_i = 0$),则由 $\beta$ 的两种表示作差,立得两种表示完全一致。

直和的本质是子空间之间“不重叠”(除零向量外)。

  • 非直和情形:若 $V_1 \cap V_2 \neq {0}$,则存在非零向量 $\alpha \in V_1 \cap V_2$。此时零向量可以有非平凡表示:$0 = \alpha + (-\alpha)$。几何上表现为两个平面(或线)交于一条线。

  • 直和情形:若 $V_1 \cap V_2 = {0}$,则 $\alpha_1 + \alpha_2 = 0 \implies \alpha_1 = -\alpha_2 \in V_1 \cap V_2 = {0}$。这意味着分解方式唯一。几何上表现为两个空间仅交于原点。

当涉及多个子空间 $V_1, \dots, V_s$ 时,两两交为零是不够的,必须满足更强的条件。

定理:

$V_1 + \dots + V_s$是直和,当且仅当对每一个$k$ ($1 \le k \le s$),第 $k$ 个子空间与它前面所有子空间之和的交集仅含零向量:

$$ V_k \cap (V_1 + \dots + V_{k-1}) = \{0\} $$

  • 证明要点

    • 充分性:设 $\sum \alpha_i = 0$。取最后一个非零向量 $\alpha_k$,则 $\alpha_k = -(\alpha_1 + \dots + \alpha_{k-1})$。这导致 $\alpha_k$落在$V_k$ 与前面子空间和的交集中,与条件矛盾。

    • 必要性:若交集不为零,则存在非零向量能被前面的向量组表出,导致零向量的表示不唯一。


三、 等价命题定理

以下命题对于判定子空间是否构成直和是等价的:

  • 表示唯一性:$V_1 + \dots + V_s$是直和(即表示$0$ 的方式唯一)。

  • 基的保持性:分别取子空间 $V_1, \dots, V_s$ 的基,将这些基向量合并后,得到的向量组在全空间中依然线性无关

    • 换句话说,这些基向量合并后构成了和空间 $V_1 \oplus \dots \oplus V_s$ 的一组基.。
  • 维数和:$dim(V_1+…+V_s)=dim(V_1)+…+dim(V_s)$当$\dim(V_1 \cap V_2) = 0$(即 $V_1 \cap V_2 = {0}$)时,维数公式简化为:

$$ \dim(V_1 + V_2) = \dim V_1 + \dim V_2 $$

此时的和称为直和,记作 $V_1 \oplus V_2$。这意味着和空间中的每一个向量都可以唯一地表示为 $V_1$和$V_2$ 中向量的和。

我们看一个定理,这实际上在数学随笔之范德蒙德行列式的意外出现有提到过,讨论的就是直和。

定理:

设 $V_1, V_2, \dots, V_s$是方阵$A$对应于不同特征值$\lambda_1, \lambda_2, \dots, \lambda_s$ 的特征子空间,则它们的和是直和

  • 证明思路(范德蒙德法)

    1. 设 $\alpha_1 + \alpha_2 + \dots + \alpha_s = 0$,其中 $\alpha_i \in V_i$。

    2. 利用 $A$左乘该式$s-1$次,根据$A\alpha_i = \lambda_i \alpha_i$,得到一系列线性方程:

$$ \begin{cases} \alpha_1 + \dots + \alpha_s = 0 \\ \lambda_1 \alpha_1 + \dots + \lambda_s \alpha_s = 0 \\ \vdots \\ \lambda_1^{s-1} \alpha_1 + \dots + \lambda_s^{s-1} \alpha_s = 0 \end{cases} $$

  1. 由于特征值 $\lambda_i$两两不同,对应的范德蒙德行列式不为零,从而推导出每个分量$\alpha_i$必须全为$0$。

还可以更进一步,考虑所谓广义特征子空间。

广义特征子空间的直和与多项式分解

一、 广义特征子空间的直和性

定理

设 $\lambda_1, \dots, \lambda_s \in K$是矩阵$A \in M_n(K)$ 的互异特征值,$r_1, \dots, r_s > 0$ 为对应的幂次,则其广义特征子空间之和是直和:

$$ \text{Ker}(A - \lambda_1 I)^{r_1} \oplus \dots \oplus \text{Ker}(A - \lambda_s I)^{r_s} $$

  • 证明逻辑(构造性矛盾法)

    1. 假设存在非零向量之和为零:$\alpha_1 + \dots + \alpha_s = 0$。

    2. 对 $\alpha_1$,寻找使其“退化”到特征向量层级的最小指数 $t$,定义 $\beta_1 = (A - \lambda_1 I)^{t-1} \alpha_1 \neq 0$。此时 $\beta_1$是属于$\lambda_1$ 的特征向量($A-\lambda I$作用$\beta$是$0$ )。

    3. 利用算子 $(A - \lambda_1 I)^{t-1} \prod_{j \neq 1} (A - \lambda_j I)^{r_j}$ 左乘原式。

    4. 除了第一项,其余项均会因落在 $\text{Ker}$中而消解为$0$。

    5. 最终导出 $(\lambda_1 - \lambda_2)^{r_2} \dots (\lambda_1 - \lambda_s)^{r_s} \beta_1 = 0$。由于特征值互异且 $\beta_1 \neq 0$,产生矛盾,从而证明各分量必为零。


那之前大费周章学了那么多多项式的内容有什么用呢?实际上利用多项式我们可以给出空间的分解:

核空间分解定理的详细证明

一、 定理

设 $f_1(x), \dots, f_s(x) \in K[x]$两两互素。记$f(x) = \prod_{i=1}^s f_i(x)$。对于 $A \in M_n(K)$,有:

$$ \text{Ker } f(A) = \text{Ker } f_1(A) \oplus \text{Ker } f_2(A) \oplus \dots \oplus \text{Ker } f_s(A) $$


二、 证明步骤拆解

1. 证明和是“直和”

要证直和,只需证 $V_i \cap (\sum_{j \neq i} V_j) = {0}$,其中 $V_i = \text{Ker } f_i(A)$。

  • 构造辅助多项式:记 $F_i(x) = \frac{f(x)}{f_i(x)}$,即除去 $f_i$ 后其余多项式的乘积。

  • 利用互素性:由于 $(f_i(x), f_j(x)) = 1$(对所有 $j \neq i$),推导出 $f_i(x)$与$F_i(x)$互素,即$(f_i, F_i) = 1$。

  • 裴蜀等式 (Bézout’s Identity):存在 $u(x), v(x)$使得$u(x)f_i(x) + v(x)F_i(x) = 1$。

  • 算子化:将 $x$换成矩阵$A$,作用于任意向量 $\alpha \in V_i \cap (\sum_{j \neq i} V_j)$:

    • $\alpha = u(A)f_i(A)\alpha + v(A)F_i(A)\alpha$- 因为$\alpha \in \text{Ker } f_i(A)$,故 $f_i(A)\alpha = 0$。

    • 因为 $\alpha$在其余核空间的和中,而$F_i(A)$包含所有其余因子,故$F_i(A)\alpha = 0$。

    • 结论:$\alpha = 0$,故和为直和。

2. 证明核空间的包含关系

需证 $\sum \text{Ker } f_i(A) = \text{Ker } f(A)$。

  • 以 $s=2$为例:已知$(f_1, f_2) = 1$,则 $u(A)f_1(A) + v(A)f_2(A) = I$。

  • 对于 $\forall \alpha \in \text{Ker } f(A)$:

$$ \alpha = I\alpha = \underbrace{u(A)f_1(A)\alpha}_{\in \text{Ker } f_2(A)} + \underbrace{v(A)f_2(A)\alpha}_{\in \text{Ker } f_1(A)} $$

(注:$f_2(A) \cdot [u(A)f_1(A)\alpha] = u(A)f(A)\alpha = 0$)

  • 推广到一般情形:利用归纳法,将 $f(x)$视为$f_1(x)$与$(f_2 \dots f_s)(x)$ 的积,层层剥离。

综合两方面证明就完成了。也就是说,从一个多项式的分解,我们可以得到一个空间的分解,这是非常美妙的。

如果我们想分解整个空间,要考虑什么多项式呢?

零化多项式与空间分解

一、 零化多项式 (Annihilating Polynomial)

  • 定义:设 $A \in M_n(K)$,若存在多项式 $f(x) \in K[x]$使得$f(A) = 0$,则称 $f(x)$为$A$ 的一个零化多项式

  • 经典示例

    • 幂等变换(投影):$x^2 - x$是其零化多项式(因为$A^2 = A$)。

    • 对合变换(镜像):$x^2 - 1$是其零化多项式(因为$A^2 = I$)。

二、 零化多项式驱动的空间全分解

核心定理

若矩阵 $A$的零化多项式$f(x)$在域$K$上可分解为两两互素的因子乘积$f(x) = f_1(x) \dots f_s(x)$,则全空间 $V$ 具有直和分解:

$$ V = \text{Ker } f_1(A) \oplus \dots \oplus \text{Ker } f_s(A) $$

逻辑跃迁:这里因为 $f(A)=0$,所以 $\text{Ker } f(A)$直接就是整个空间$V$。


三、 可对角化的充分必要条件

这是线性代数中最优雅的结论之一:

矩阵 $A$在域$K$上可对角化,当且仅当$A$有一个零化多项式能在$K$ 上分解成互异的一次因式的乘积:

$$ f(x) = (x - \mu_1)(x - \mu_2) \dots (x - \mu_s), \quad \mu_i \in K \text{ 且互异} $$

  • 必要性推导:若 $A$可对角化,则全空间是特征子空间的直和。作用算子$(A - \lambda_1 I)\dots(A - \lambda_s I)$于任何向量都会得到$0$,说明该乘积即为零化多项式。

  • 充分性推导:若存在此类零化多项式,由核空间分解定理,全空间 $V$ 会分解为各个特征子空间(或零空间)的直和:

$$ V = \bigoplus_{i=1}^s \text{Ker}(A - \mu_i I) $$

这意味着 $V$有一组由特征向量构成的基,即$A$ 可对角化。


四、 案例应用:对合变换的分解

场景:设 $V = M_n(K)$,考虑转置变换 $T: A \to A^T$。

  1. 特征方程:显然 $T^2 = I$,故零化多项式为 $f(x) = x^2 - 1 = (x - 1)(x + 1)$。

  2. 空间直和:由于 $1$与$-1$互异,空间$V$ 可分解为:

$$ V = \text{Ker}(T - I) \oplus \text{Ker}(T + I) $$

  1. 几何意义

    • $\text{Ker}(T - I)$是所有满足$A^T = A$的矩阵(对称矩阵$V_1$)。

    • $\text{Ker}(T + I)$是所有满足$A^T = -A$的矩阵(反对称矩阵$V_2$)。

    • 结论:任何方阵都能唯一地分解为一个对称矩阵与一个反对称矩阵之和:$A = \frac{A+A^T}{2} + \frac{A-A^T}{2}$。

补空间与外直和

一、 补空间 (Complementary Subspace)

如果说子空间是空间的一部分,那么补空间就是“剩下那部分”的完美补充。

  • 定义:设 $W, W’$是$V$的子空间。若满足$V = W \oplus W’$(即 $V$是它们的直和),则称$W$与$W’$ 互为补空间

  • 存在性定理:任何线性子空间都有补空间。

  • 构造逻辑

    1. 取 $W$的一组基$\alpha_1, \dots, \alpha_r$。

    2. 将其扩充为全空间 $V$的一组基$\alpha_1, \dots, \alpha_r, \alpha_{r+1}, \dots, \alpha_n$。

    3. 由扩充出来的向量 $\langle \alpha_{r+1}, \dots, \alpha_n \rangle$张成的子空间即为$W$ 的一个补空间。

  • 注意:补空间通常不唯一。扩充基底的方式不同,得到的补空间在空间中的“姿态”也不同。


二、 外直和 (External Direct Sum)

当我们手里有几个独立的线性空间,想要把它们合成一个更大的空间时,就需要用到外直和。

  • 定义:设 $V_1, \dots, V_s$是数域$K$ 上的线性空间,其外直和定义为笛卡尔积集合:

$$ V_1 \oplus \dots \oplus V_s = \{ (\alpha_1, \dots, \alpha_s) \mid \alpha_i \in V_i \} $$

  • 运算规则

    • 加法:分量对位相加,$(\alpha_1, \dots) + (\beta_1, \dots) = (\alpha_1 + \beta_1, \dots)$。

    • 数乘:标量作用于每个分量,$k(\alpha_1, \dots) = (k\alpha_1, \dots)$。


三、 外直和与内直和的统一

虽然“外直和”是从多个集合构建新集合,但它本质上可以看作“内直和”。

  • 嵌入与同构

    构造 $V$的子空间$V_i’$,使得 $V_i’$中的元素仅在第$i$个位置有非零向量,其余位置全为$0$:

$$ V_i' = \{ (0, \dots, \alpha_i, \dots, 0) \mid \alpha_i \in V_i \} $$

  • 结论

    1. $V_i’ \cong V_i$(每个 $V_i’$都同构于原空间$V_i$)。

    2. 整个外直和空间 $V$恰好是这些子空间$V_i’$ 的内直和

$$ V = V_1' \oplus \dots \oplus V_s' $$


线性空间的同构

线性映射与同构的定义

设 $U, V$是域$K$上的两个线性空间。若映射$\mathcal{A}: U \to V$ 满足:

  1. 加法齐次性:$\mathcal{A}(\alpha + \beta) = \mathcal{A}\alpha + \mathcal{A}\beta, \quad \forall \alpha, \beta \in U$

  2. 数乘齐次性:$\mathcal{A}(k\alpha) = k\mathcal{A}\alpha, \quad \forall k \in K$则称$\mathcal{A}$是$U$到$V$ 的线性映射

若 $\mathcal{A}$是双射(既是单射又是满射),则称$\mathcal{A}$是$U$到$V$的线性同构,记作$U \cong V$。


2. 同构的关键判定与定理

  • 推论:设 $\mathcal{A}: U \to V$ 是线性映射,$\alpha_1, \dots, \alpha_n$是$U$的一组基。$\mathcal{A}$是$U$与$V$的线性同构$\iff \mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n$是$V$ 的一组基。

  • 基础定理:有限维 $K$-线性空间 $U$与$V$ 同构的充要条件是它们的维数相等:

$$ U \cong V \iff \dim U = \dim V $$


3. 性质证明要点

  • 满射判定:$\mathcal{A}$是满射$\iff \mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n$张成$V$。

    即 $V$中任意向量均可表示为$\mathcal{A}\alpha_i$ 的线性组合:$\text{Im} \mathcal{A} = L(\mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n)$。

  • 单射判定:$\mathcal{A}$是单射$\iff \mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n$ 线性无关。

    证明思路:由 $\sum k_i \mathcal{A}\alpha_i = 0$推导出$\mathcal{A}(\sum k_i \alpha_i) = 0$,若 $\mathcal{A}$为单射则核为空,进而利用$\alpha_i$的无关性证得$k_i = 0$。


4. 坐标同构 (Coordinate Isomorphism)

在 $n$维线性空间$V$中取定一组基$\alpha_1, \dots, \alpha_n$ 后,$V$中的每个元素$\alpha = \sum k_i \alpha_i$与其坐标向量$[k_1, \dots, k_n]^T \in K^n$ 之间建立了一一对应关系。

结论:这种对应保持了向量的加法与数乘运算,即 $V$与向量空间$K^n$ 线性同构。


5. 同构关系的性质

线性空间的同构关系满足:

  • 自反性:$V \cong V$- 交换性:若$U \cong V$,则 $V \cong U$- 传递性:若$U \cong V$且$V \cong W$,则 $U \cong W$

    因此,同构是线性空间集合上的一个等价关系


6. 实例与应用

  • 矩阵秩的性质

    设矩阵 $A = [\alpha_1, \dots, \alpha_n]$列满秩,则映射$X \mapsto AX$是$K^n$到$A$ 的列空间的线性同构。

  • 矩阵分解应用

    若 $B = AC = [\alpha_1, \dots, \alpha_n] [\gamma_1, \dots, \gamma_s]$,则:

    1. $B$的秩$= C$ 的秩。

    2. $B$的解空间$= C$ 的解空间。

    3. $\gamma_1, \dots, \gamma_s$是$\beta_1, \dots, \beta_s$在基$\alpha_1, \dots, \alpha_n$ 下的坐标。

  • 思考题:矩阵 $A$ 的行空间与列空间同构吗?

    提示:由于行秩等于列秩,即维数相等,根据定理它们必然同构。

商空间与线性映射基本定理

商空间听起来很高级,实际上动机是简单的,我们知道重力势能可以简单地写为 $mgh$ ,那么水平方向如何运动便可以置之不顾了,那么我们略去三维中的两维,只看高度这一个坐标即可,商空间干的事其实也就是这样。

核心动机:忽略不相关的细节

在处理复杂事物时,我们往往只关注某些特定的“层面”。

  • 数学直观:如果我们对子空间 $W$ 方向的差异不感兴趣,就希望通过某种方式将其“抹去”或“淡化”。

  • 几何想象:将高维空间沿 $W$方向“压扁”,使得落在同一个与$W$ 平行的平面(陪集)上的所有点,在商空间视角下被视为同一个“元素”。

$W$-陪集(Coset)

陪集是将空间 $V$按照子空间$W$进行划分的基本单位。简单来说就是让$W=0$。按照之前的重力势能的比喻,就是说在同一个高度的坐标我们就看做一个陪集,认为他们都相等,这里就可以把$W$看做$x,y$ 坐标,即被弃置不顾的东西。

  • 等价关系:定义 $\alpha \sim \beta \iff \alpha - \beta \in W$。

  • 定义:对于 $V$中的向量$\beta$,其所在的等价类称为 $\beta$的$W$-陪集,记作 $\beta + W = { \beta + \gamma \mid \gamma \in W }$。

  • 代表元:陪集中的任何向量都可以作为该陪集的代表。只要 $\alpha - \beta \in W$,则 $\alpha + W = \beta + W$。

商空间 $V/W$ 的代数结构

全体 $W$-陪集的集合记为 $V/W$。为了使其成为线性空间,定义了如下运算:

  • 加法:$(\alpha + W) + (\beta + W) = (\alpha + \beta) + W$

  • 数乘:$k(\alpha + W) = k\alpha + W$

  • 良定义性:运算结果不依赖于陪集代表元的选取(需验证)。作差即可验证。

  • 结论:在此运算下,$V/W$ 构成线性空间,称为 $V$模$W$ 的商空间

基与维度(Basis and Dimension)

这是将商空间具体化的关键。

  • 定理:设 $W$的一组基为$\alpha_1, \dots, \alpha_s$,将其扩充为 $V$的一组基$\alpha_1, \dots, \alpha_s, \beta_1, \dots, \beta_r$。

  • 结论:剩余的向量所形成的陪集 ${\beta_1 + W, \dots, \beta_r + W}$构成了商空间$V/W$ 的一组

  • 维数公式

$$ \dim(V/W) = \dim V - \dim W $$

证明:

  • 证明能表出(Spanning)

    对于 $V/W$中任意元素$\alpha + W$,将 $\alpha$用$V$的全基线性表示。由于$\alpha_i$部分全部落在$W$中,在商运算(模$W$)下,属于 $W$的分量会自动坍缩为零元(即$0 + W$)。

$$ \alpha + W = (\sum k_i \alpha_i + \sum l_j \beta_j) + W = (\sum l_j \beta_j) + W $$

这说明 $\beta_j + W$ 足以覆盖整个商空间。

  • 证明线性无关(Linear Independence)

    设定线性组合为零元:$\sum l_j (\beta_j + W) = 0 + W$。

    这意味着向量 $\sum l_j \beta_j$必须落在子空间$W$ 内。

    根据基底的唯一定义,若一个仅由 $\beta_j$组成的向量属于$\text{span}{\alpha_i}$,由于全基 ${\alpha_i, \beta_j}$是线性无关的,所有系数$l_j$必须全为$0$。

线性映射的核心:核与像

对于任何线性映射 $\mathcal{A}: U \to V$,都有两个关键的子空间:

  • 像空间 $\text{Im},\mathcal{A}$:$V$ 中所有能被映射到的向量集合。它反映了映射的“广度”。

  • 核空间 $\text{Ker},\mathcal{A}$:$U$中所有被映射到$0$ 的向量集合。它反映了映射丢失的“信息量”。

  • 典范映射:特例情况下,映射 $\mathcal{A}: V \to V/W$将向量映为其陪集$\alpha + W$,此时 $\text{Ker},\mathcal{A} = W$,$\text{Im},\mathcal{A} = V/W$。

线性映射基本定理

这是线性代数的高光时刻。定理指出:任何线性映射都可以被“分解”为一个同构映射。

  • 同构关系

$$ U/\text{Ker}\,\mathcal{A} \cong \text{Im}\,\mathcal{A} $$

  • 直观理解

    如果我们把定义域 $U$中那些映射到同一个点的向量“打包”在一起(即作商空间,模掉$\text{Ker},\mathcal{A}$),那么这个“包”的集合与像空间之间就是一一对应的。

  • 性质:映射 $\varphi: \alpha + \text{Ker},\mathcal{A} \mapsto \mathcal{A}\alpha$ 是良定义的,且既是单射又是满射。

1. 诱导映射的构造

定义映射 $\varphi: U/\text{Ker},\mathcal{A} \to \text{Im},\mathcal{A}$,其规则为:

$$ \varphi(\alpha + \text{Ker}\,\mathcal{A}) = \mathcal{A}\alpha $$

  • 代数上的相容性:$\varphi$ 完美保持了向量的加法与数乘运算。

  • 几何上的映射关系:原本在 $U$中所有映射到同一个像点$\beta$的向量(它们构成一个$\text{Ker},\mathcal{A}$ 的陪集),现在被视为商空间中的一个整体。这意味着映射从“多对一”变成了一对一的线性同构

具体的验证比较容易,就不打出来了。

2. 维度守恒:秩-零化度定理

基于 $U/\text{Ker},\mathcal{A} \cong \text{Im},\mathcal{A}$ 的同构关系,我们必然得到维度的平衡:

$$ \dim U = \dim(\text{Ker}\,\mathcal{A}) + \dim(\text{Im}\,\mathcal{A}) $$

这可以看作是定义域空间的“能量守恒”:一部分维度坍缩到了零点(核空间),剩下的维度则铺开了映射的像(像空间)。


矩阵视角的具象化:方程组与空间的映射

当我们将上述理论落地到矩阵 $A \in K^{m \times n}$ 时,抽象的符号变成了直观的线性方程组特性:

抽象概念 矩阵具象 物理/几何意义
像空间 $\text{Im},\mathcal{A}$ 列空间 (Column Space) 矩阵各列向量线性组合所能张成的空间。
核空间 $\text{Ker},\mathcal{A}$ 解空间 (Null Space) 齐次线性方程组 $A\mathbf{x} = \mathbf{0}$ 的全体解。
同构关系 $K^n / \text{Null}(A) \cong \text{Col}(A)$ 剔除解空间后的输入,与输出空间达成一一对应。

结论

由基本定理可直接导出矩阵论的基石:

矩阵的秩(列空间的维数) + 解空间的维数 = 矩阵的列数。

这意味着,非齐次线性方程组 $A\mathbf{x} = \mathbf{b}$ 的解集之所以呈现出“特解 + 齐次核”的形态,本质上是因为它就是商空间中某一个特定的陪集。

商空间的使用方法:构造满射,模去核空间,得到同构

例:设 $U, W$是线性空间$V$ 的子空间。证明:

$$ U / U \cap W \cong (U + W) / W $$

证:映射 $\mathcal{A} : U \to (U + W) / W

$$ $\alpha \mapsto \alpha + W $$

是线性映射。

$\mathcal{A}$显然是满射 且$\text{Ker} \mathcal{A} = U \cap W$。

由线性映射基本定理即得到结论。


$\mathbf{W}$的补空间$\cong$模$\mathbf{W}$ 的商空间

定理:

设 $\mathbf{V}$的子空间$\mathbf{W}$的有一个补空间$\mathbf{U}$,即 $\mathbf{W} \oplus \mathbf{U} = \mathbf{V}$。则映射

$$ \sigma : \mathbf{U} \to \mathbf{V} / \mathbf{W} $$

$$ \alpha \mapsto \alpha + \mathbf{W} $$

是 $\mathbf{W}$的补空间$\mathbf{U}$到商空间$\mathbf{V} / \mathbf{W}$ 的同构。


$\mathbf{W} \oplus \mathbf{U} = \mathbf{V} \implies \mathbf{U} \cong \mathbf{V} / \mathbf{W}$

$\beta + \alpha = \gamma \mapsto \alpha + \mathbf{W} = \gamma + \mathbf{W}$

阅读全文

神秘补充题

线代 2026/4/5

设 $V = \mathbb{F}{13}^3$是有限域$\mathbb{F}{13}$ 上的三维向量空间。给定矩阵:

$$ A = \begin{bmatrix} 5 & 7 & 7 \\ 12 & 4 & 2 \\ 3 & 7 & 9 \end{bmatrix} \pmod{13} $$

  1. 对角化判定判断矩阵 $A$能否在域$\mathbb{F}_{13}$ 上对角化,并说明理由。

  2. 矩阵的阶与可逆性证明 $A$是可逆矩阵,并求出最小的正整数$d$,使得:

$$ A^d = I $$

(其中 $I$ 为单位矩阵)。

  1. 向量等价关系与轨道分解设 $\alpha, \beta \in \mathbb{F}_{13}^3$。若存在非负整数 $k, l \ge 0$,使得:

$$ A^k \alpha = \beta \quad \text{且} \quad A^l \beta = \alpha $$

则称 $\alpha$与$\beta$等价,记作$\alpha \sim \beta$。证明:“$\sim$” 是向量空间 $\mathbb{F}{13}^3$上的一个等价关系。向量空间$\mathbb{F}{13}^3$被划分为几个等价类?每个等价类(称为一条$A$-轨道)分别包含几个向量?哪些等价类的并集能够构成 $\mathbb{F}_{13}^3$ 的子空间?

这道题的本质,其实是:

有限域上线性变换 = 对角化 + 有限乘法群 + 群作用轨道分解

阅读全文

罗马

阅读全文

4月日记

日记类 2026/4/1

4月了呢。

阅读全文

0323 导数与放缩

2026/3/31

导数

一、 核心方法体系(Methodology)

解决导数恒成立问题的核心在于将“不等式成立”转化为“函数最值”问题。

  • 分离参数: 将参数 $a$孤立在不等式一侧,转化为$a \ge f(x){\max}$或$a \le f(x){\min}$。

  • 分类讨论: 当参数无法分离时,根据参数对导数符号(单调性)的影响进行分段讨论。

  • 数形结合: 借助函数图像的直观性(如二次函数与三角函数的上下位置关系)快速定位临界状态。

  • 端点效应(必要探路): 利用定义域端点的函数值或导数值缩小参数范围,再证明充分性。


二、 “任意”与“存在”的转化逻辑

在双变量问题中,逻辑词的组合决定了最值的组合方式:

逻辑条件翻译 转化目标(数学等价)
$\forall x_1 \in D_1, \forall x_2 \in D_2, f(x_1) \le g(x_2)$ $f(x_1){\max} \le g(x_2){\min}$
$\forall x_1 \in D_1, \exists x_2 \in D_2, f(x_1) \ge g(x_2)$ $f(x_1){\min} \ge g(x_2){\min}$
$\exists x_1 \in D_1, \exists x_2 \in D_2, f(x_1) \le g(x_2)$ $f(x_1){\min} \le g(x_2){\max}$
$\forall x_1 \in D_1, \exists x_2 \in D_2, f(x_1) = g(x_2)$ $f(x)$的值域$\subseteq g(x)$ 的值域

经典题型与实战技巧

一:数形结合与临界相切模型

题目: 已知函数 $f(x)=3x^2 - 8\sin(x+\varphi)$,其中 $\varphi \in [-\frac{\pi}{2}, 0]$。若 $\forall x \ge 0, f(x) \ge 0$恒成立,求$\varphi$ 的取值范围。

【解析】

  1. 等价转化:

    不等式 $f(x) \ge 0$等价于$3x^2 \ge 8\sin(x+\varphi)$。

    令 $g(x) = 3x^2$,$h(x) = 8\sin(x+\varphi)$。题目转化为:在 $[0, +\infty)$ 上,抛物线始终在正弦曲线的上方或与其相切。

  2. 寻找临界切点:

    设两曲线在 $x_0$ 处相切,则在该点处函数值相等且导数值相等:

$$ \begin{cases} 3x_0^2 = 8\sin(x_0+\varphi) & \text{——(1)} \\ 6x_0 = 8\cos(x_0+\varphi) & \text{——(2)} \end{cases} $$

  1. 消参计算:

    利用 $\sin^2\theta + \cos^2\theta = 1$,将 (1) 和 (2) 式平方相加:

    $(\frac{3x_0^2}{8})^2 + (\frac{6x_0}{8})^2 = 1 \implies \frac{9x_0^4}{64} + \frac{36x_0^2}{64} = 1$

    整理得:$9x_0^4 + 36x_0^2 - 64 = 0$

    因式分解:$(3x_0^2 - 4)(3x_0^2 + 16) = 0$由于$x_0 > 0$,解得 $x_0^2 = \frac{4}{3} \implies x_0 = \frac{2\sqrt{3}}{3}$。

  2. 求 $\varphi$:

    将 $x_0$ 代入 (2) 式:$6 \cdot \frac{2\sqrt{3}}{3} = 8\cos(x_0+\varphi) \implies \cos(x_0+\varphi) = \frac{\sqrt{3}}{2}$。

    因 $\varphi \in [-\frac{\pi}{2}, 0]$且$x_0 \approx 1.15$,取 $x_0+\varphi = \frac{\pi}{6}$。

    $\varphi = \frac{\pi}{6} - \frac{2\sqrt{3}}{3}$。

结论: $\varphi$的取值范围是$[\frac{\pi}{6} - \frac{2\sqrt{3}}{3}, 0]$(结合 $\varphi$ 原本范围)。

二:切线放缩与构造函数(2012新课标)

题目: 已知 $f(x)=e^x - x + \frac{1}{2}x^2$。若 $f(x) \ge \frac{1}{2}x^2 + ax + b$恒成立,求$(a+1)b$ 的最大值。

【解析】

  1. 化简不等式:

    $e^x - x + \frac{1}{2}x^2 \ge \frac{1}{2}x^2 + ax + b \implies e^x \ge (a+1)x + b$。

  2. 几何逻辑:

    令 $y = e^x$,该不等式表示直线始终在指数函数下方。当直线与曲线相切时,$b$ 取得最大可能值(截距最大)。

  3. 设切点求关系:

    设切点为 $(x_0, e^{x_0})$。

    切线斜率 $k = (e^x)’|_{x=x_0} = e^{x_0} = a+1$。

    切线方程为:$y - e^{x_0} = e^{x_0}(x - x_0) \implies y = e^{x_0}x + e^{x_0}(1-x_0)$。

    对比 $y = (a+1)x + b$,得:

    $a+1 = e^{x_0}$,$b = e^{x_0}(1-x_0)$。

  4. 构造新函数求极值:

    目标式 $G(x_0) = (a+1)b = e^{x_0} \cdot e^{x_0}(1-x_0) = e^{2x_0}(1-x_0)$。

    求导:$G’(x_0) = 2e^{2x_0}(1-x_0) - e^{2x_0} = e^{2x_0}(1-2x_0)$。

    令 $G’(x_0) = 0$,得 $x_0 = \frac{1}{2}$。

    此时最大值为 $G(\frac{1}{2}) = e^{2(1/2)}(1 - \frac{1}{2}) = \frac{e}{2}$。

三:双变量全称命题(2015新课标二)

题目: 设 $f(x)=e^{mx} + x^2 - mx$。若对于任意 $x_1, x_2 \in [-1, 1]$,都有 $|f(x_1) - f(x_2)| \le e-1$恒成立,求$m$ 的取值范围。

【解析】

  1. 模型转化:

    $|f(x_1) - f(x_2)| \le e-1 \iff f(x){\max} - f(x){\min} \le e-1$(在 $[-1, 1]$ 上)。

  2. 分析单调性:

    $f’(x) = m e^{mx} + 2x - m$,$f’’(x) = m^2 e^{mx} + 2 > 0$。

    说明 $f’(x)$单调递增。又因为$f’(0) = m \cdot 1 + 0 - m = 0$。

    所以:当 $x \in [-1, 0)$ 时,$f’(x) < 0$,$f(x)$减;当$x \in (0, 1]$ 时,$f’(x) > 0$,$f(x)$ 增。

    最小值: $f(x)_{\min} = f(0) = 1$。

  3. 确定最大值:

    最大值必在端点 $f(-1)$或$f(1)$处取得。$f(1) = e^m + 1 - m$;$f(-1) = e^{-m} + 1 + m$。

    令 $h(m) = e^m - m + 1$,观察发现 $f(-1) = h(-m)$,$f(1) = h(m)$。

    根据条件需满足:

$$ \begin{cases} f(1) - f(0) \le e-1 \implies e^m - m \le e-1 \\ f(-1) - f(0) \le e-1 \implies e^{-m} + m \le e-1 \end{cases} $$

  1. 求解范围:

    观察函数 $h(m) = e^m - m$,其在 $m=1$时$h(1)=e-1$。由于 $h(m)$的性质:$e^m - m \le e-1 \implies m \in [-?, 1]$;

    $e^{-m} + m \le e-1 \implies m \in [-1, ?]$。

    交集得 $m \in [-1, 1]$。

端点效应与必要性探路

一、 什么是“端点效应”?

端点效应的核心逻辑是“由局部推全局”。

对于不等式 $f(x) \ge 0$在闭区间$[x_0, +\infty)$ 恒成立的问题:

  1. 第一层(函数值): 必须满足 $f(x_0) \ge 0$。如果 $f(x_0) = 0$,则需进一步考察导数。

  2. 第二层(一阶导): 在端点值为 0 的前提下,函数必须在端点附近“向上走”,故需满足 $f’(x_0) \ge 0$。

  3. 第三层(高阶导): 若连 $f’(x_0)$也等于 0,则需继续考察$f’’(x_0) \ge 0$,以此类推。

注意: 以上步骤求得的是参数的必要条件(即参数“至少”要满足的范围)。求出范围后,必须回代进行充分性证明,这才是完整的解题大题流程。


二、 核心逻辑图解

根据端点处的初始状态,我们可以分为以下三种情形进行“探路”:

情形 图像特征 判别必要条件
不附加任何条件 图像从端点上方开始 $f(x_0) \ge 0$
附加条件 $f(x_0)=0$ 图像从原点出发,必须不向下掉 $f’(x_0) \ge 0$
附加条件 $f(x_0)=f’(x_0)=0$ 图像在端点处平滑且不下凹 $f’’(x_0) \ge 0$

实战演练:2024 全国甲卷真题还原

题目: 已知函数 $f(x) = (1-ax)\ln(1+x) - x$。若当 $x \ge 0$ 时,$f(x) \ge 0$恒成立,求$a$ 的取值范围。

第一步:必要性探路(先猜答案)

  1. 检查端点值: $f(0) = (1-0)\ln(1) - 0 = 0$。

    因为 $f(0)=0$,若要 $f(x) \ge 0$恒成立,则在$x=0$处的导数$f’(0)$ 不能为负。

  2. 求一阶导:

    $f’(x) = -a\ln(1+x) + (1-ax) \cdot \frac{1}{1+x} - 1$

    代入端点:$f’(0) = -a\ln(1) + \frac{1}{1} - 1 = 0$。

  3. 求二阶导:

    由于 $f’(0)=0$,我们继续看 $f’’(0)$。

    $f’’(x) = \frac{-a}{1+x} + \frac{-a(1+x)-(1-ax)}{(1+x)^2} = \frac{-a}{1+x} + \frac{-a-1}{(1+x)^2}$

    代入端点:$f’’(0) = -a + (-a - 1) = -2a - 1$。

    若要 $f(x) \ge 0$恒成立,必要条件是$f’’(0) \ge 0 \implies -2a-1 \ge 0 \implies \mathbf{a \le -\frac{1}{2}}$。

第二步:充分性证明(正式步骤)

我们需要证明:当 $a = -\frac{1}{2}$ 时,$f(x) \ge 0$恒成立。(注:若$a \le -\frac{1}{2}$成立,则$a = -\frac{1}{2}$ 是最临界的状况)。

  1. 代入 $a = -\frac{1}{2}$,构造函数 $g(x) = (1 + \frac{1}{2}x)\ln(1+x) - x$。

  2. $g’(x) = \frac{1}{2}\ln(1+x) + (1+\frac{1}{2}x)\frac{1}{1+x} - 1 = \frac{1}{2}\ln(1+x) + \frac{1+\frac{1}{2}x - (1+x)}{1+x} = \frac{1}{2}\ln(1+x) - \frac{\frac{1}{2}x}{1+x}$。

  3. 继续求导 $g’’(x) = \frac{1}{2(1+x)} - \frac{\frac{1}{2}(1+x)-\frac{1}{2}x}{(1+x)^2} = \frac{1+x-1}{2(1+x)^2} = \frac{x}{2(1+x)^2}$。

  4. 当 $x > 0$ 时,$g’’(x) > 0$,故 $g’(x)$在$[0, +\infty)$ 单调递增。

  5. 因为 $g’(0)=0$,所以 $g’(x) \ge 0$,进而 $g(x)$在$[0, +\infty)$ 单调递增。

  6. 因为 $g(0)=0$,所以 $g(x) \ge 0$ 恒成立。

第三步:排除法(完善逻辑)

当 $a > -\frac{1}{2}$时,由必要性探路可知$f’’(0) < 0$。根据导数定义的保号性,存在 $x \in (0, x_0)$使得$f’(x) < f’(0) = 0$,进而 $f(x) < f(0) = 0$,与题意不符。

结论: $a$的取值范围是$(-\infty, -\frac{1}{2}]$。

2024 广东模拟题

题目:若关于 $x$的不等式$2x^2 \ln x \ge 4ax \ln x - x^2 + a$在$\forall x \in [1, +\infty)$上恒成立,求实数$a$ 的取值范围。

解析步骤:

  1. 构造函数:移项得 $f(x) = 4ax \ln x - x^2 + a - 2x^2 \ln x \le 0$。

  2. 端点探路:代入 $x=1$,得到 $f(1) = -1 + a \le 0 \implies \mathbf{a \le 1}$。

  3. 充分性证明

    • 将原式整理为关于 $a$ 的一次函数:$f(x) = (4x \ln x + 1)a - x^2 - 2x^2 \ln x$。

    • 观察到当 $x \ge 1$ 时,$4x \ln x + 1 > 0$,故 $f(x)$关于$a$ 单调递增。

    • 因此,$f(x)$的最大值在$a=1$ 时取得。

    • 代入 $a=1$构造$g(x) = (4x - 2x^2) \ln x + 1 - x^2$。

    • 求导得 $g’(x) = (4-4x)(\ln x + 1)$。由于 $x \ge 1$,则 $4-4x \le 0$且$\ln x + 1 > 0$,故 $g’(x) \le 0$。

    • 所以 $g(x)$ 单调递减,$g(x) \le g(1) = 0$ 恒成立。

结论:$a$的取值范围是$(-\infty, 1]$。

端点效应的“失效”警示与深度避坑

端点效应(必要性探路)虽然是破题利器,但并非万能钥匙。


一、 什么时候端点效应会失效?

端点效应失效的核心原因在于:端点的一阶(或高阶)导数大于 0,只能保证函数在端点“附近”大于 0,无法保证在整个区间内不“掉下去”

1. 情形一:非单调函数的“中途折返”

当函数在区间内不是单调递增,而是先增后减时,即使端点处斜率向上,函数也可能在区间中部的极小值点处跌破 $x$ 轴。

  • 适用情况:函数在端点后存在极小值点 $x_0$。

  • 判别标准:若极小值点 $x_0$落在定义域内,必须满足$f(x_0) \ge 0$,而不仅仅是端点 $f(x_{start}) \ge 0$。

2. 情形二:必要性不等于充分性

通过端点效应求出的参数范围只是必要条件

  • 案例警示:在处理 2020 年新课标一卷真题时,若通过 $h’’(0) \ge 0$算出$a \ge -1/2$。

  • 翻车现场:当取临界值 $a = -1/2$时,带回原函数计算发现$h(1) = e - 3 < 0$。这说明 $a \ge -1/2$ 并不足以保证不等式恒成立,此时端点效应求出的范围过大,必须结合区间内的最小值进行二次验证。


二、 典型失效案例解析

【案例 1】隐零点导致的失效(2020 新课标一卷)

题目:已知 $f(x) = e^x + ax^2 - x$。当 $x \ge 0$ 时,$f(x) \ge \frac{1}{2}x^3 + 1$恒成立,求$a$ 的取值范围。

【探路过程】

  1. 构造 $h(x) = e^x + ax^2 - x - \frac{1}{2}x^3 - 1$。

  2. $h(0) = 0, h’(0) = 0$。

  3. 由 $h’’(0) = e^0 + 2a \ge 0$得$a \ge -1/2$。

    【失效分析】

  • 当 $a = -1/2$ 时,$h’(x) = e^x - x - 1 - \frac{3}{2}x^2$。通过二阶导分析发现,$h’(x)$在区间内会先增后减,导致$h(x)$ 在后期掉到 0 以下。

  • 结论:本题不能仅靠端点,需利用隐零点法锁定函数真正的极小值点。

【完整解答】

1. 构造函数与初步探路

令 $h(x) = e^x + ax^2 - x - \frac{1}{2}x^3 - 1$,则 $h(0) = 0$。

$h’(x) = e^x + 2ax - 1 - \frac{3}{2}x^2$,则 $h’(0) = 0$。

$h’’(x) = e^x + 2a - 3x$。

若 $h(x) \ge 0$恒成立,则需$h’’(0) = 1 + 2a \ge 0 \implies a \ge -\frac{1}{2}$(必要条件)。

2. 检验临界值 $a = -1/2$ 的充分性

当 $a = -1/2$ 时,$h’’(x) = e^x - 3x - 1$。

再次求导:$h’’’(x) = e^x - 3$。

令 $h’’’(x) = 0 \implies x = \ln 3$。

  • 当 $x \in (0, \ln 3)$ 时,$h’’’(x) < 0$,$h’’(x)$ 递减;

  • 当 $x \in (\ln 3, +\infty)$ 时,$h’’’(x) > 0$,$h’’(x)$ 递增。

    由于 $h’’(0) = 0$,$h’’(2) = e^2 - 7 > 0$,$h’’(1) = e - 4 < 0$。

    说明 $h’’(x)$在$(0, 2)$上存在零点,导致$h’(x)$先减后增,继而$h(x)$ 可能小于 0。

    计算可知 $h(1) = e - \frac{1}{2} - 1 - \frac{1}{2} - 1 = e - 3 < 0$。

    故 $a = -1/2$ 不满足题意,端点效应求出的范围过大。

3. 寻找正确范围

需找到 $x_0$使得$h(x_0)=0$且$h’(x_0)=0$。

联立方程:

$$ \begin{cases} e^{x_0} + a x_0^2 - x_0 - \frac{1}{2}x_0^3 - 1 = 0 \\ e^{x_0} + 2a x_0 - 1 - \frac{3}{2}x_0^2 = 0 \end{cases} $$

消去 $a$得到关于$x_0$ 的方程:$(x_0-2)e^{x_0} + x_0 - \frac{1}{2}x_0^3 + 2 = 0$。

观察发现 $x_0 = 2$ 是该方程的一个解。

代入 $x_0 = 2$求$a$:$e^2 + 4a - 1 - 6 = 0 \implies a = \frac{7-e^2}{4}$。

结论: $a$的取值范围是$[\frac{7-e^2}{4}, +\infty)$。

【案例 2】极小值点脱离端点(模拟题)

题目:已知 $f(x) = \ln(ax+1) - \frac{2ax}{x+2} \ge 2\ln2 - \frac{3}{2}$在$x \ge 0$ 恒成立。

【解析要点】

  1. 求导发现导函数 $g’(x)$的零点为$x_0 = 4a - 4$。

  2. 分类讨论

    • 若 $4a-4 \le 0$(即 $a \le 1$),极小值点在端点左侧,函数单调,端点效应生效。

    • 若 $4a-4 > 0$(即 $a > 1$),极小值点落在 $(0, +\infty)$内部,此时必须保证极小值$g(4a-4) \ge 0$。

  3. 通过构造新函数 $h(t)$证明极小值点的偏移,最终锁定$a \le 3/2$。

【完整解答】

1. 求导分析单调性

$f’(x) = \frac{a}{ax+1} - \frac{2a(x+2)-2ax}{(x+2)^2} = \frac{a}{ax+1} - \frac{4a}{(x+2)^2} = \frac{a(x^2+4x+4-4ax-4)}{(ax+1)(x+2)^2} = \frac{ax(x+4-4a)}{(ax+1)(x+2)^2}$。

2. 分类讨论极小值点

令 $f’(x) = 0$,解得 $x_1 = 0$,$x_2 = 4a - 4$。

  • 情形一: 若 $4a - 4 \le 0$,即 $0 < a \le 1$。

    当 $x > 0$ 时,$f’(x) > 0$,$f(x)$在$[0, +\infty)$ 上单调递增。

    此时 $f(x)_{\min} = f(0) = 0$。而 $2\ln 2 - \frac{3}{2} \approx 1.38 - 1.5 = -0.12 < 0$。

    故 $f(x) \ge 0 > 2\ln 2 - \frac{3}{2}$ 恒成立,符合题意。

  • 情形二: 若 $4a - 4 > 0$,即 $a > 1$。

    当 $x \in (0, 4a-4)$ 时,$f’(x) < 0$;当 $x \in (4a-4, +\infty)$ 时,$f’(x) > 0$。

    故 $f(x)$在$x = 4a-4$ 处取得极小值。

3. 构造新函数证明充分性

令 $x_0 = 4a-4$,则 $a = \frac{x_0+4}{4}$。代入极小值点:

$f(x_0) = \ln(a x_0 + 1) - \frac{2a x_0}{x_0+2}$。

通过代换 $t = \frac{x_0+4}{4} \cdot x_0 + 1$ 等方式简化(或直接利用题干数值):

设 $h(t) = 2\ln t - (t - \frac{1}{t})$,通过求导证明 $h(t)$ 单调性。

最终解得 $a$的临界值为$3/2$。

结论: $a$的取值范围是$(0, \frac{3}{2}]$。

导数恒成立中的“指对放缩”核心技巧

在处理导数压轴题时,当常规求导难以判断单调性,或者参数与变量高度耦合时,利用指对常见不等式进行“放缩”往往能化繁为简。


一、 指对必备放缩工具箱

在考场上,以下基础不等式及其变体是放缩的“弹药库”:

1. 指数类必会不等式

  • 基础型:$e^x \ge x + 1$(当且仅当 $x=0$ 时取等号)

  • 加强型:$e^x \ge 1 + x + \frac{1}{2}x^2$($x \ge 0$)

  • 切线型:$e^x \ge ex$(当且仅当 $x=1$ 时取等号)

  • 二阶型:$e^x \ge ex + (x-1)^2$

2. 对数类必会不等式

  • 基础型:$\ln x \le x - 1$(当且仅当 $x=1$ 时取等号)

  • 割线型:$\ln x \le \frac{x}{e}$

  • 双边型:$\frac{2(x-1)}{x+1} \le \ln x \le \frac{1}{2}(x - \frac{1}{x})$($x \ge 1$)


二、 典型例题深度解析

【例题 1】2022 广东模拟:巧妙利用切线放缩

题目:当 $x > 0$ 时,证明:$e^{x^2} - x\ln x < xe^x + \frac{1}{e}$。

【核心分析】

直接求导会发现 $x$与$x^2$指数项共存,极难处理。观察结构,左右两边都有指数项,考虑利用$e^x \ge ex$(即 $ex - \ln x$ 的变体)进行消项。

【详细解答】

  1. 等价转化:原不等式等价于证明 $ex - \ln x < e^x + \frac{1}{ex}$(通过除以 $x$ 观察)。

  2. 利用已知放缩

    • 已知 $e^x \ge ex$,当 $x=1$ 时取等。

    • 则有 $ex - \ln x < e^x + \frac{1}{ex}$ 成立。

  3. 构造函数证明临界点

    • 只需证 $\ln \frac{1}{x} \le \frac{1}{e} \cdot \frac{1}{x}$,即 $\ln t \le \frac{t}{e}$(令 $t = \frac{1}{x}$)。

    • 令 $h(t) = \ln t - \frac{t}{e}$,求导得 $h’(t) = \frac{1}{t} - \frac{1}{e}$。

    • 当 $t=e$ 时,$h(t)$取得最大值$h(e) = \ln e - 1 = 0$。

    • 故 $\ln t \le \frac{t}{e}$ 恒成立。

  4. 结论:原命题得证。


【例题 2】2024 山东期末:组合放缩与构造

题目:求证:对于 $\forall x > 0$,不等式 $e^x + x^2 - (e+1)x + \frac{e}{x} > 2$ 成立。

【核心分析】

分式 $\frac{e}{x}$是难点。由于$e^x$具有极强的增长性,我们先用$e^x \ge ex$ 消耗掉一部分一次项,减小多项式的次数。

【详细解答】

  1. 首轮放缩:利用 $e^x \ge ex$,原不等式左边 $\ge ex + x^2 - (e+1)x + \frac{e}{x} = x^2 - x + \frac{e}{x}$。

  2. 目标降维:现在只需证 $x^2 - x + \frac{e}{x} > 2$,即 $x^3 - x^2 - 2x + e > 0$(由于 $x>0$)。

  3. 导数寻根

    • 令 $h(x) = x^3 - x^2 - 2x + e$,求导得 $h’(x) = 3x^2 - 2x - 2$。

    • 令 $h’(x) = 0$,解得正根 $x_0 = \frac{1 + \sqrt{7}}{3} \approx 1.22$。

    • 在 $(0, x_0)$上$h(x)$递减,在$(x_0, +\infty)$上$h(x)$ 递增。

  4. 精度估算

    • 计算极小值 $h(x_0)$。经估算或代入临界值(如 $x=1.2$),发现 $h(x_0) > 0$。

    • 例如 $h(1) = 1 - 1 - 2 + e = e - 2 \approx 0.718 > 0$。

  5. 结论:由于最小值大于 0,原不等式成立。


【例题 3】综合放缩练习

题目:证明 $e^x + \frac{1}{x} \ge 2 - \ln x + x^2 + (e-2)x$。

【详细解答】

此题跨越了指数、对数和多项式。

  1. 左侧放缩:$e^x \ge x+1$。

  2. 右侧转化:利用 $\ln x \le x-1 \implies -\ln x \ge 1-x$。

  3. 合并验证:通过逐项对消,观察余项 $x^2 + \dots$ 的开口方向。

    这种题目通常在 $x=1$处取等,验证$x=1$ 时左右两边是否相等($e+1 = 2-0+1+e-2 = e+1$)是破题的关键信号。

第一步:观察结构与找寻“取等点”

在处理指对混合放缩时,第一步通常是寻找使等号成立的 $x$ 值。

  • 代入 $x=1$:

    • 左边 $= e^1 + \frac{1}{1} = e + 1$- 右边$= 2 - \ln 1 + 1^2 + (e-2) \cdot 1 = 2 - 0 + 1 + e - 2 = e + 1$- 结论:左右两边在$x=1$处相等。这意味着我们的放缩或构造函数,应当以$x=1$ 为核心切点。

第二步:等价转化与函数构造

为了方便计算,我们将所有项移至等号左边,构造函数 $f(x)$:

$$ f(x) = e^x + \frac{1}{x} + \ln x - x^2 - (e-2)x - 2 $$

只需证明 $f(x) \ge f(1) = 0$ 恒成立。


第三步:分类放缩与求导分析

1. 基础放缩试探

我们已知两个核心不等式:

  1. $e^x \ge ex$(当 $x=1$ 时取等)

  2. $\ln x \le x - 1 \implies -\ln x \ge 1 - x$(由于题目是 $+\ln x$,此方向不直接适用,需采用求导)

2. 求导精确分析

求 $f(x)$ 的导函数:

$$ f'(x) = e^x - \frac{1}{x^2} + \frac{1}{x} - 2x - (e-2) $$

继续求二阶导以判断单调性:

$$ f''(x) = e^x + \frac{2}{x^3} - \frac{1}{x^2} - 2 $$

分析 $f’’(x)$:

  • 当 $x \ge 1$时:$e^x \ge e \approx 2.718$,且 $\frac{2}{x^3} - \frac{1}{x^2} = \frac{2-x}{x^3}$。

    在 $x \in [1, 2]$ 时,$\frac{2-x}{x^3} \ge 0$,故 $f’’(x) > 0$。

    当 $x > 2$ 时,$e^x$增长极快,足以抵消负项,显见$f’’(x) > 0$。

  • 当 $0 < x < 1$ 时:

    利用分式项 $\frac{2}{x^3}$的爆炸性增长,当$x \to 0^+$ 时,$f’’(x) \to +\infty$。

结论:$f’(x)$在$(0, +\infty)$ 上单调递增。


第四步:结论汇总

  1. 因为 $f’(x)$单调递增,且$f’(1) = e^1 - 1 + 1 - 2 - (e-2) = 0$。

  2. 所以:

    • 当 $x \in (0, 1)$ 时,$f’(x) < 0$,$f(x)$ 单调递减。

    • 当 $x \in (1, +\infty)$ 时,$f’(x) > 0$,$f(x)$ 单调递增。

  3. 因此,$f(x)$在$x=1$ 处取得极小值,亦为最小值。

  4. $f(x)_{\min} = f(1) = 0$。

最终结论:原不等式 $e^x + \frac{1}{x} \ge 2 - \ln x + x^2 + (e-2)x$ 得证。


数列放缩

1. 裂项相消放缩

裂项是数列放缩的灵魂。它的精髓在于构造 $b_n = \phi(n) - \phi(n+1)$,这样求和时中间项全部抵消,只剩首尾。

(1) 幂函数型(分式放缩)

这是最基础的,目标是把分母的次数降低。

  • $n^2$型:$\frac{1}{n^2} < \frac{1}{n(n-1)} = \frac{1}{n-1} - \frac{1}{n}$注:这会导致第一项$n=1$没意义,通常保留第一项,从$n=2$ 开始放。

  • $n^2$型:$\frac{1}{n^2} < \frac{1}{n^2 - 1/4} = \frac{1}{(n-1/2)(n+1/2)} = \left( \frac{1}{n-1/2} - \frac{1}{n+1/2} \right)$

    这种放缩保留了对称性,求和结果更紧凑。

  • $n^k$ 型 ($k \ge 3$):

    $\frac{1}{n^3} < \frac{1}{n^3 - n} = \frac{1}{(n-1)n(n+1)} = \frac{1}{2} \left[ \frac{1}{(n-1)n} - \frac{1}{n(n+1)} \right]$

    通过增加因式来构造裂项,这是处理高次项的标准化动作。

(2) 无理式型(根式放缩)

核心是利用共轭根式

  • 常用结论:

    $\frac{1}{2\sqrt{n+1}} < \sqrt{n+1} - \sqrt{n} = \frac{1}{\sqrt{n+1} + \sqrt{n}} < \frac{1}{2\sqrt{n}}$这个公式在证明$\sum \frac{1}{\sqrt{n}}$ 的范围时非常霸道。


2. 等比数列放缩

当通项公式里含有阶乘 $n!$、指数 $a^n$ 或者增长极快的项时,裂项往往失效,此时要考虑向等比数列靠拢

(1) 阶乘放缩

阶乘是增长最快的结构之一,我们通常用 $2^{n-1}$ 来压制它:

  • 当 $n \ge 2$ 时,$\frac{1}{n!} = \frac{1}{1 \cdot 2 \cdot 3 \dots n} \le \frac{1}{2 \cdot 2 \dots 2} = \frac{1}{2^{n-1}}$。

  • 利用等比数列求和公式 $\sum \frac{1}{2^{n-1}}$,上限立刻锁定在 $2$ 左右。

(2) 指数复合型

例如 $a_n = \frac{n}{3^n}$。虽然可以用错位相减法求和,但如果只是证不等式:

  • 观察 $\frac{a_{n+1}}{a_n} = \frac{n+1}{3n} = \frac{1}{3} + \frac{1}{3n}$。

  • 当 $n$足够大时,这个比值趋近于$1/3$。我们可以放缩成公比为 $1/2$(稍微放大一点点)的等比数列,从而轻松求和。


3. 积分放缩(选看)

求和是矩形面积之和,积分是曲线下的面积。

  • 基本原理: 若 $f(x)$单调递减,则$\int_n^{n+1} f(x) dx < f(n) < \int_{n-1}^n f(x) dx$。

  • 应用案例: 证明 $\sum_{i=1}^n \frac{1}{i}$(调和级数)的范围。

    $\ln(n+1) = \int_1^{n+1} \frac{1}{x} dx < \sum_{i=1}^n \frac{1}{i} < 1 + \int_1^n \frac{1}{x} dx = 1 + \ln n$。

    这个技巧在处理和对数相关的放缩题时,很好用!


4. 关键策略:保留前几项

这是放缩法成败的生死线! 很多学生放缩后发现范围太大,是因为第一、二项通常是“巨无霸”,直接放缩损耗太严重。

  • SOP 操作流程:

    1. 观察结论: 结论要求 $S_n < 1.6$,但直接裂项发现 $S_n < 2$。

    2. 手术切除: 算出 $a_1 = 1$。

    3. 局部放缩: $S_n = a_1 + (a_2 + a_3 + \dots + a_n)$。

    4. 重新评估: 对括号里的项进行裂项放缩。因为 $a_2, a_3$ 变小了,放缩带来的误差也会成倍缩小。


2021·厦门二模(改编版)

已知数列 ${a_n}$满足$a_1=2, a_{n+1}=\frac{2a_n-1}{a_n}$。

(1) 证明:数列 ${\frac{1}{a_n-1}}$ 是等差数列;

(2) 令 $b_n=\frac{1}{a_1 a_2 \dots a_n}$,证明:$b_1^2+b_2^2+\dots+b_n^2 < 1$。

(3) 加强挑战: 证明 $b_1^2+b_2^2+\dots+b_n^2 < \frac{3}{4}$。


分析

  1. 递推式的本质: $a_{n+1} = 2 - \frac{1}{a_n}$。这是一个典型的不动点为 $1$的分式线性变换。既然不动点是$1$,那么研究 $a_n - 1$ 的倒数结构就是最直接的路径。

  2. 通项的连锁: 观察 $a_n = \frac{n+1}{n}$,这是一个“前项分子等于后项分母”的结构。这种结构在相乘(积项)时会产生消去律,直接导致 $b_n$ 退化为简单的幂函数分式。

  3. 放缩的精度:

    • 弱放缩: $\frac{1}{n^2} < \frac{1}{n(n-1)}$,损失较大,通常用于证明小于 $1$或$2$。

    • 强放缩: 保留首项 $b_1^2$,对后续项进行裂项,可以极大地收窄上界。


✍️ 标准解答流程

(1) 等差数列证明

设 $c_n = \frac{1}{a_n-1}$。

由 $a_{n+1} = \frac{2a_n-1}{a_n}$,得 $a_{n+1}-1 = \frac{2a_n-1-a_n}{a_n} = \frac{a_n-1}{a_n}$。

则 $c_{n+1} = \frac{1}{a_{n+1}-1} = \frac{a_n}{a_n-1} = \frac{(a_n-1)+1}{a_n-1} = 1 + c_n$。

又 $c_1 = \frac{1}{2-1} = 1$。

所以 ${c_n}$是首项为$1$,公差为 $1$ 的等差数列。(置信度:高)

(2) 原题结论证明

由 (1) 知 $c_n = 1 + (n-1) \cdot 1 = n$,则 $\frac{1}{a_n-1} = n \implies a_n = \frac{n+1}{n}$。

从而 $a_1 a_2 \dots a_n = \frac{2}{1} \cdot \frac{3}{2} \dots \frac{n+1}{n} = n+1$。

故 $b_n = \frac{1}{n+1}$。

令 $S_n = \sum_{i=1}^n b_i^2 = \frac{1}{2^2} + \frac{1}{3^2} + \dots + \frac{1}{(n+1)^2}$。

利用裂项放缩:$\frac{1}{(i+1)^2} < \frac{1}{i(i+1)} = \frac{1}{i} - \frac{1}{i+1}$。

$S_n < (\frac{1}{1} - \frac{1}{2}) + (\frac{1}{2} - \frac{1}{3}) + \dots + (\frac{1}{n} - \frac{1}{n+1}) = 1 - \frac{1}{n+1} < 1$。

证毕。


🔥 加强版

“保留项放缩” 的魔力。

(3) 证明 $S_n < \frac{3}{4}$

我们观察到 $\frac{1}{2^2} = 0.25$,如果把第一项拎出来不放缩:

$S_n = \frac{1}{4} + \left( \frac{1}{3^2} + \frac{1}{4^2} + \dots + \frac{1}{(n+1)^2} \right)$对括号内从$i=2$开始放缩:$\frac{1}{(i+1)^2} < \frac{1}{i(i+1)} = \frac{1}{i} - \frac{1}{i+1}$

$S_n < \frac{1}{4} + \left( \frac{1}{2} - \frac{1}{3} + \frac{1}{3} - \frac{1}{4} + \dots + \frac{1}{n} - \frac{1}{n+1} \right)$

$S_n < \frac{1}{4} + \frac{1}{2} - \frac{1}{n+1} = \frac{3}{4} - \frac{1}{n+1} < 0.75$。

只需多留一个项,界限就从 $1.0$缩减到了$0.75$。如果你愿意保留前 $100$项,你可以把这个值逼近到$\frac{\pi^2}{6} - 1 \approx 0.645$


题目

已知 $a_n = \frac{1}{2^n - \frac{1}{2^n}} = \frac{2^n}{4^n - 1}$。

我们的目标是证明 $S_n = \sum_{i=1}^n \frac{1}{2^i - \frac{1}{2^i}} < \frac{4}{3}$。

核心矛盾: 分母减去了一个正数,导致 $a_n$比$\frac{1}{2^n}$ 稍微大了一点点。我们需要量化这个“一点点”。


## ✍️ 解答流程

Step 1: 寻找放缩不等式

我们需要把 $a_n$ 放缩成一个标准的等比数列。

观察分母:当 $n \ge 1$时,我们尝试寻找一个常数$k$,使得 $\frac{1}{2^n - \frac{1}{2^n}} \le \frac{k}{2^n}$。

通过计算前几项:

  • $a_1 = \frac{1}{2 - 1/2} = \frac{2}{3}$。此时 $\frac{2/3}{1/2} = \frac{4}{3}$。

  • $a_2 = \frac{1}{4 - 1/4} = \frac{4}{15}$。此时 $\frac{4/15}{1/4} = \frac{16}{15} < \frac{4}{3}$。

构造猜想: $a_n \le \frac{4}{3} \cdot \frac{1}{2^n}$。

严谨证明:

要证 $\frac{1}{2^n - 2^{-n}} \le \frac{4}{3 \cdot 2^n}$,只需证 $3 \cdot 2^n \le 4(2^n - 2^{-n})$。

即 $3 \cdot 2^n \le 4 \cdot 2^n - 4 \cdot 2^{-n} \implies 4 \cdot 2^{-n} \le 2^n \implies 4 \le 4^n$。

显然,当 $n \ge 1$ 时,该式恒成立!

Step 2: 等比数列求和

有了这个“代理人”,剩下的就是初中水平的求和了:

$$ S_n = \sum_{i=1}^n a_i \le \frac{4}{3} \sum_{i=1}^n \left(\frac{1}{2}\right)^i $$

$$ S_n \le \frac{4}{3} \cdot \frac{\frac{1}{2}(1 - (1/2)^n)}{1 - 1/2} = \frac{4}{3} (1 - \frac{1}{2^n}) $$

显然,$\frac{4}{3} (1 - \frac{1}{2^n}) < \frac{4}{3}$。

证毕。


2019 浙江

证 $\sum_{i=1}^n \sqrt{\frac{i-1}{i(i+1)}} < 2\sqrt{n}$。

  • 分子放大: 观察到 $\sqrt{\frac{n-1}{n(n+1)}} < \sqrt{\frac{n}{n(n+1)}} = \frac{1}{\sqrt{n+1}}$。

  • 构造裂项: 利用根式核心不等式:$\frac{1}{\sqrt{n+1}} < \frac{2}{\sqrt{n+1} + \sqrt{n}} = 2(\sqrt{n+1} - \sqrt{n})$。

  • 累加求和:

    $C_n = c_1 + c_2 + \dots + c_n$ $C_n < 0 + 2(\sqrt{2}-\sqrt{1}) + 2(\sqrt{3}-\sqrt{2}) + \dots + 2(\sqrt{n+1}-\sqrt{n})$ $C_n < 2(\sqrt{n+1} - 1)$

  • 收尾:

    因为 $\sqrt{n+1} < \sqrt{n} + 1$,所以 $2\sqrt{n+1}-2 < 2(\sqrt{n}+1)-2 = 2\sqrt{n}$。

    证毕


估阶

1. 什么是数列的“阶”?

简单来说,“阶”就是数列增长或衰减的“快慢等级”

当我们讨论 $\sum a_n$的放缩时,本质是在问:这个和$S_n$ 最终会跑向无穷大,还是被锁死在一个常数里?

核心分水岭:$1/n$ 判别准则

  • 级数发散(跑向无穷): $\sum \frac{1}{n^p}$,当 $p \le 1$ 时。

    • 比如 $\sum \frac{1}{n}$(调和级数)的阶是 $\ln n$。

    • 比如 $\sum \frac{1}{\sqrt{n}}$的阶是$\sqrt{n}$。

  • 级数收敛(锁定常数): $\sum \frac{1}{n^p}$,当 $p > 1$ 时。

    • 比如 $\sum \frac{1}{n^2}$的阶是常数(精确值为$\pi^2/6 \approx 1.645$)。

  1. 三大常用“阶”的放缩逻辑

我们可以把数列按“阶”排个序:

(1) 根式阶:$a_n \sim \frac{1}{\sqrt{n}}$—— 目标是$\sqrt{n}$

  • 特征: 分母只有半次方,增长非常缓慢。

  • 放缩目标: $2\sqrt{n}$ 左右。

  • 必杀技: 根式裂项

    利用 $2(\sqrt{n+1}-\sqrt{n}) < \frac{1}{\sqrt{n}} < 2(\sqrt{n}-\sqrt{n-1})$。

(2) 对数阶:$a_n \sim \frac{1}{n}$—— 目标是$\ln n$

  • 特征: 处于收敛与发散的临界点(调和级数)。

  • 放缩目标: 通常带有 $\ln n$或者要求证一个随$n$ 缓慢增长的界限。

  • 必杀技: 积分放缩

    利用 $\ln(n+1) < \sum_{i=1}^n \frac{1}{i} < 1 + \ln n$。

    注:高考很少直接考 $\ln n$,通常会把它包装在导数不等式里。

(3) 平方阶:$a_n \sim \frac{1}{n^2}$—— 目标是 常数$C$

  • 特征: 衰减极快,求和一定能被一个常数压住。

  • 放缩目标: $1, 2, \frac{3}{4}, \frac{\pi^2}{6}$ 等确定的数值。

  • 必杀技: 分式裂项

    利用 $\frac{1}{n^2} < \frac{1}{n(n-1)} = \frac{1}{n-1} - \frac{1}{n}$。


3. 进阶:指数阶与阶乘阶(降维打击)

当数列里出现 $2^n$或$n!$ 时,放缩就变成了“降维打击”。

  • 等比阶(指数阶): $a_n \sim q^n$- 只要$|q| < 1$,直接用等比数列求和。

    • 技能:比值判别思维。只要 $\frac{a_{n+1}}{a_n} \le q < 1$,它就一定收敛。
  • 阶乘阶: $a_n \sim \frac{1}{n!}$

    • 衰减速度毁天灭地。

    • 技能:强行降阶为等比。$\frac{1}{n!} \le \frac{1}{2^{n-1}}$。


4. 阶的“叠加”与“主项意识”

“谁才是老大”

比如 $a_n = \frac{n + \sin n}{n^3 + \ln n}$。

  • 在无穷远处,$n$相比$n^3$ 简直微不足道。

  • 所以这个数列的阶由最高次幂决定:$a_n \sim \frac{n}{n^3} = \frac{1}{n^2}$。

  • 结论: 这个数列的求和一定收敛于一个常数,放缩时直接盯着 $1/n^2$ 的裂项法做就行了!


总结

通项特征 对应“阶” 求和目标类型 核心放缩工具
分母是 $\sqrt{n}$ 根式阶 $\sqrt{n}$ 相关式 根式裂项
分母是 $n$ 对数阶 $\ln n$ 相关式 积分/切线放缩
分母是 $n^2$ 平方阶 确定常数 分式裂项
分母包含 $2^n$ 指数阶 确定常数 等比数列求和
阅读全文

3.29 数列

2026/3/31







阅读全文

Oedipus the King

是命运的嘲弄,还是自由意志导向的必然悲剧?

阅读全文

张雪峰之死

日记类 2026/3/24

摘自3月日记,也许该单发出来,这大约有别于十分寻常的日记。

阅读全文

笔记2.环论初探

线代 2026/3/19

意外在习题课被灌注了环论,那就稍微整整(

阅读全文
1 ... 7 8 9 ... 12