Logic の博客

一小块凝固的时间

笔记4.矩阵空间与向量空间的同构

线代 2026/4/13

对一个向量，我们把它看做 $n$个坐标，构建从向量到$n$ 个坐标的同构。
矩阵实际上也就是向量的堆叠，那类似的我们把它看做 $n$ 个向量，也可以构建同构。

矩阵的展开 (Matrix Vectorization)

列展开 $\text{cs}(A)$：将 $m \times n$矩阵$A$的元素自左向右、一列一列地排列成一个$mn$ 维列向量。
- 示例：若 $A = \begin{pmatrix} 1 & 4 \ 2 & 5 \ 3 & 6 \end{pmatrix}$，则 $\text{cs}(A) = [1, 2, 3, 4, 5, 6]^T$。
行展开 $\text{rs}(A)$：类似地，将矩阵按行顺序排列成一个行向量。
- 示例：对于上述矩阵，$rs(A) = [1, 4, 2, 5, 3, 6]$。

这显然是同构，也就是说，我们完全可以把矩阵看成一个超级向量。

Kronecker 积 (Kronecker Product)

定义

设矩阵 $A = [a_{ij}] \in M_{m,n}(K)$，矩阵 $B \in M_{p,q}(K)$。它们的 Kronecker 积（也称张量积）记为 $A \otimes B$，是一个 $mp \times nq$ 的分块矩阵：

$$ A \otimes B = \begin{pmatrix} a_{11}B & \dots & a_{1n}B \\ \vdots & \ddots & \vdots \\ a_{m1}B & \dots & a_{mn}B \end{pmatrix} $$

即用 $A$的每个元素$a_{ij}$乘以矩阵$B$ 得到的分块矩阵。

关键性质

非交换性：一般情况下，$A \otimes B \neq B \otimes A$。
结合律：$(A \otimes B) \otimes C = A \otimes (B \otimes C)$。
特殊情形：当 $A$为列向量且$C$为行向量时（或反之），在特定维度下可能满足$A \otimes C = C \otimes A = AC$。

运算示例

基础计算

若 $A = \begin{pmatrix} 1 & 2 & 3 \ 4 & 5 & 6 \end{pmatrix}$，$B = \begin{pmatrix} a & b \ c & d \end{pmatrix}$，则：

$$ A \otimes B = \begin{pmatrix} B & 2B & 3B \\ 4B & 5B & 6B \end{pmatrix} = \begin{pmatrix} a & b & 2a & 2b & 3a & 3b \\ c & d & 2c & 2d & 3c & 3d \\ 4a & 4b & 5a & 5b & 6a & 6b \\ 4c & 4d & 5c & 5d & 6c & 6d \end{pmatrix} $$

向量间的积

若 $A = [1, 2, 3]^T$，$B = [a, b]^T$，则：

$A \otimes B = [a, b, 2a, 2b, 3a, 3b]^T$-$B \otimes A = [a, 2a, 3a, b, 2b, 3b]^T$

（此处直观展示了顺序不同导致的结果差异）

4. 混合乘积公式 (Mixed-Product Property)

这是 Kronecker 积最重要的性质之一，联系了普通矩阵乘法与张量积：

$$ (A \otimes B)(C \otimes D) = (AC) \otimes (BD) $$

前提条件：矩阵乘法 $AC$和$BD$必须有意义（即$A$的列数等于$C$ 的行数，$B$的列数等于$D$ 的行数）。
推导逻辑：通过分块矩阵乘法规律可以证明，左侧展开后的子块项 $\sum a_{ik} c_{kj} B D$正好对应右侧$(AC) \otimes (BD)$ 的构造。

Kronecker 积的核心性质

结合律：$(A \otimes B) \otimes C = A \otimes (B \otimes C)$
混合乘积公式：$(A \otimes B)(C \otimes D) = AC \otimes BD$
逆矩阵：$(A \otimes B)^{-1} = A^{-1} \otimes B^{-1}$
转置：$(A \otimes B)^T = A^T \otimes B^T$- 正交性保持：若$A, B$是正交矩阵，则$A \otimes B$ 也是正交矩阵。

代数特征（秩、行列式、特征值）

秩：$\text{rank}(A \otimes B) = \text{rank}(A) \cdot \text{rank}(B)$2. 行列式：设$A$为$m$ 阶方阵，$B$为$n$阶方阵，则$|A \otimes B| = |A|^n |B|^m$
特征值：
- 设 $A$的特征值为$\lambda_i$，$B$的特征值为$\mu_j$。
- $A \otimes B$的特征值为$\lambda_i \mu_j$。
- Kronecker 和 $A \otimes I_n + I_m \otimes B$的特征值为$\lambda_i + \mu_j$。

特殊实例：Hadamard 矩阵的构造

利用 Kronecker 积可以递归构造特殊的正交矩阵（如 Hadamard 矩阵）：

$A_2 = \frac{1}{\sqrt{2}} \begin{pmatrix} 1 & 1 \ 1 & -1 \end{pmatrix}$-$A_4 = A_2 \otimes A_2 = \frac{1}{2} \begin{pmatrix} A_2 & A_2 \ A_2 & -A_2 \end{pmatrix}$-$A_8 = A_2 \otimes A_4$ … 以此类推。

矩阵列展开的核心定理

这是连接矩阵方程与线性方程组的桥梁：

定理：$\text{cs}(AXB) = (B^T \otimes A) \text{cs}(X)$

证明逻辑拆解：

左乘变换：$\text{cs}(AX) = (I_n \otimes A) \text{cs}(X)$。这说明 $A$对$X$ 的左乘对应于列展开后的块对角阵相乘。
右乘变换：$\text{cs}(XB) = (B^T \otimes I_m) \text{cs}(X)$。注意此处 $B$ 需要转置。
合成结论：通过结合律 $\text{cs}(A(XB)) = (I_n \otimes A) \text{cs}(XB) = (I_n \otimes A)(B^T \otimes I_m) \text{cs}(X)$，利用混合乘积公式化简为 $(B^T \otimes A) \text{cs}(X)$。

线性变换的矩阵表示

设 $\mathcal{A}: X \mapsto AXB$是矩阵空间$M_{m,n}(K)$ 上的线性变换：

在标准基 $E_{1,1}, E_{2,1}, \dots, E_{m,n}$（即按列展开排序）下，该线性变换对应的矩阵正是 $B^T \otimes A$。
直观理解：
- $A$作用于$X$ 的行变换。
- $B$作用于$X$ 的列变换。

线性矩阵方程的向量化求解

基于前文的列展开性质，可以将复杂的矩阵方程转化为标准的线性方程组形式。

推论：$X \in M_{m,n}(K)$是矩阵方程$\sum_{j=1}^{s} A_j X B_j = C$的解，当且仅当其列展开$\text{cs}(X)$ 满足：

$$ \left( \sum_{j=1}^{s} B_j^T \otimes A_j \right) \text{cs}(X) = \text{cs}(C) $$

其中 $A_j, B_j$分别为$m, n$ 级方阵，$C \in M_{m,n}(K)$。

本质：这利用了 Kronecker 积将矩阵算子“拉直”为算子矩阵，使得我们能用经典的线性代数工具（如高斯消元法）来处理矩阵方程。

张量积空间 (Tensor Product Space)

将张量积从矩阵运算上升到线性空间的构造。

定义：设 $U = R^m, V = R^n$ 是两个线性空间，集合

$$ T = \left\{ \sum_{i=1}^{k} \alpha_i \otimes \beta_i \mid \alpha_i \in U, \beta_i \in V, k \geq 1 \right\} $$

构成一个线性空间，称为 $U$与$V$的张量积空间，记为$U \otimes V$。

基与维数：
- 若 $\alpha_1, \dots, \alpha_m$是$U$ 的基，$\beta_1, \dots, \beta_n$是$V$ 的基。
- 则所有可能的组合 ${\alpha_i \otimes \beta_j}$构成$U \otimes V$ 的一组基。
- 结论：$U \otimes V \cong R^{mn}$，即张量积空间的维数是原空间维数的乘积。

线性变换的张量积

这是张量积在算子层面的推广。

定义：设 $\mathcal{A} \in \text{Hom}(U), \mathcal{B} \in \text{Hom}(V)$，定义线性变换 $\mathcal{A} \otimes \mathcal{B}: U \otimes V \to U \otimes V$ 为：

$$ \mathcal{A} \otimes \mathcal{B} (\alpha \otimes \beta) = (\mathcal{A}\alpha) \otimes (\mathcal{B}\beta) $$

该变换称为变换 $\mathcal{A}$与$\mathcal{B}$ 的张量积。

矩阵表示：

若 $\mathcal{A}$在基${\alpha_i}$下的矩阵为$A$，$\mathcal{B}$在基${\beta_j}$下的矩阵为$B$，则线性变换 $\mathcal{A} \otimes \mathcal{B}$在$U \otimes V$的基${\alpha_i \otimes \beta_j}$ 下的矩阵恰好就是 $A \otimes B$。

这些东西实际上是可以简化结构，让我们更清楚地看到矩阵的，例如我们可以看一些问题：

题目：矩阵方程解空间的性质证明

设 $A, B$分别是$m, n$级方阵，且$\text{rank}(A) = r$，$\text{rank}(B) = s$。证明：

$$ W = \{ X \in M_{m,n}(K) \mid AXB = 0 \} $$

是矩阵空间 $M_{m,n}(K)$的子空间，且$\dim W = mn - rs$。

1. 证明 $W$ 是子空间

根据子空间的定义，需验证对加法和数乘的封闭性：

加法封闭性：设 $X, Y \in W$，则有 $AXB = 0$且$AYB = 0$。

$$ A(X + Y)B = AXB + AYB = 0 + 0 = 0 $$

故 $X + Y \in W$。

数乘封闭性：设 $X \in W, k \in K$，则：

$$ A(kX)B = k(AXB) = k \cdot 0 = 0 $$

故 $kX \in W$。

由此可知，$W$是$M_{m,n}(K)$ 的子空间。

2. 证明 $\dim W = mn - rs$

这里使用了**列展开（Vectorization）**和 Kronecker 积 的性质将矩阵问题转化为线性方程组问题。

(1) 方程转化

利用恒等式 $\text{cs}(AXB) = (B^T \otimes A) \text{cs}(X)$，原矩阵方程 $AXB = 0$ 等价于线性方程组：

$$ (B^T \otimes A) \cdot \text{cs}(X) = \mathbf{0} $$

其中，$\text{cs}(X)$是一个$mn$维的列向量，系数矩阵为$M = B^T \otimes A$，其规模为 $mn \times mn$。

(2) 确定系数矩阵的秩

根据 Kronecker 积关于秩的性质：

$$ \text{rank}(B^T \otimes A) = \text{rank}(B^T) \cdot \text{rank}(A) $$

由于矩阵转置不改变秩，且已知 $\text{rank}(A) = r, \text{rank}(B) = s$，则：

$$ \text{rank}(B^T \otimes A) = s \cdot r = rs $$

(3) 利用维数公式

子空间 $W$ 的维数等价于上述齐次线性方程组解空间的维数。根据线性方程组解空间的维数公式（$n$ 维空间减去系数矩阵的秩）：

$$ \dim W = \dim (\text{解空间}) = mn - \text{rank}(B^T \otimes A) = mn - rs $$

证毕。

题目：矩阵变换 $\mathcal{S}$ 的特征值与对角化证明

设 $A, B$分别是$m, n$阶复矩阵，其特征值分别为${\lambda_1, \dots, \lambda_m}$与${\mu_1, \dots, \mu_n}$。

定义映射 $\mathcal{S}: M_{m,n}(\mathbb{C}) \to M_{m,n}(\mathbb{C})$：

$$ \mathcal{S}(X) = AX - XB + AXB^2 $$

1. 证明 $\mathcal{S}$ 是线性变换

根据线性变换的定义，需满足加法与数乘的齐次性：

线性度验证：利用矩阵乘法的分配律与结合律：

$$ \mathcal{S}(k_1 X + k_2 Y) = A(k_1 X + k_2 Y) - (k_1 X + k_2 Y)B + A(k_1 X + k_2 Y)B^2 $$

$$ = k_1(AX - XB + AXB^2) + k_2(AY - YB + AYB^2) = k_1 \mathcal{S}(X) + k_2 \mathcal{S}(Y) $$

故 $\mathcal{S}$是$M_{m,n}(\mathbb{C})$ 上的线性变换。

2. 求变换 $\mathcal{S}$ 的所有特征值

利用列展开（Vectorization），我们将 $\mathcal{S}(X)$ 转换为向量形式：

$$ \text{cs}(\mathcal{S}(X)) = \text{cs}(AXI_n - I_m XB + AXB^2) $$

根据公式 $\text{cs}(AXB) = (B^T \otimes A) \text{cs}(X)$，提取 $\text{cs}(X)$得到变换矩阵$M$：

$$ M = (I_n \otimes A) - (B^T \otimes I_m) + ((B^2)^T \otimes A) $$

特征值计算：

已知 $A$的特征值为$\lambda_i$，$B$（及 $B^T$）的特征值为 $\mu_j$。

根据 Kronecker 积的性质，特征值的对应关系为：
- $I_n \otimes A$的特征值为$1 \cdot \lambda_i = \lambda_i$-$B^T \otimes I_m$的特征值为$\mu_j \cdot 1 = \mu_j$-$(B^T)^2 \otimes A$的特征值为$\mu_j^2 \cdot \lambda_i$由于这些项在同一组基（由$A$和$B^T$的特征向量构成的张量积基）下可以同时三角化，因此变换$\mathcal{S}$ 的特征值为：

$$ \lambda'_{ij} = \lambda_i - \mu_j + \lambda_i \mu_j^2, \quad (i=1,\dots,m; \ j=1,\dots,n) $$

3. 对角化证明与特征向量

证明：

前提条件：已知 $A$和$B$可对角化。这意味着$A$有$m$个线性无关的特征向量$\alpha_i$， $B^T$有$n$个线性无关的特征向量$\gamma_j$（注意 $B$可对角化则$B^T$ 亦然，且特征值相同）。
构造变换 $\mathcal{S}$ 的特征向量：

在张量积空间 $M_{m,n}(\mathbb{C})$中，变换$\mathcal{S}$ 的特征向量对应的“矩阵形式”为：

$$ X_{ij} = \alpha_i \beta_j^H \quad (\text{或更简单地记为 } \alpha_i \text{ 与 } B \text{ 的左特征向量的积}) $$

更严谨地说，若 $A\alpha_i = \lambda_i \alpha_i$，且 $\beta_j$是$B$的特征向量（满足$B\beta_j = \mu_j \beta_j$并不直观，这里通常看作$X \beta_j$ 的映射关系）。

结论：

由于我们能构造出 $m \times n$个形如$E_{ij} = \alpha_i \otimes \gamma_j$的线性无关特征向量，而空间$M_{m,n}(\mathbb{C})$的维数恰好也是$mn$，特征向量集构成了空间的一组基。

故 $\mathcal{S}$ 可对角化。

$\mathcal{S}$ 的特征向量（矩阵形式）：

即满足 $\mathcal{S}(X) = \lambda’_{ij} X$的矩阵。若$A \alpha_i = \lambda_i \alpha_i$且$\beta_j^T B = \mu_j \beta_j^T$（即 $\beta_j^T$是$B$ 的左特征向量），则：

$$ X_{ij} = \alpha_i \beta_j^T $$

数学

阅读全文

笔记3.线性空间

线代 2026/4/13

尽管可能显得欠缺一定的连续性，先论述线性空间是合理的，尔后再从多项式延展到空间分解才更为自然，或许不妨看做两个分支，从线性空间和多项式环合并而导回线性代数的主分支。

仍然给出一坨定义：

线性空间的结构

线性空间的定义与公理体系

线性空间是一个非空集合 $V$（其中的元素称为抽象向量），建立在数域 $K$ 之上，并定义了两种运算：加法与数乘。

核心运算与封闭性

加法 (Vector Addition)：
- 定义：$V \times V \to V$
- 映射：$(\alpha, \beta) \mapsto \alpha + \beta$- 本质：集合$V$ 对加法运算封闭。
数乘 (Scalar Multiplication)：
- 定义：$K \times V \to V$
- 映射：$(k, \alpha) \mapsto k\alpha$- 本质：数域$K$中的标量与向量结合，结果仍留在$V$ 中。

八条公理 (The 8 Axioms)

这八条准则共同构成了线性空间的骨架。前四条确立了 $V$ 在加法下的交换群（阿贝尔群）地位，后四条规定了数乘与加法的兼容性。

1. 加法性质（交换群）

(1) 交换律： $\alpha + \beta = \beta + \alpha$- (2) 结合律：$\alpha + (\beta + \gamma) = (\alpha + \beta) + \gamma$- (3) 存在单位元（零元素）： 存在元素$0 \in V$，使得 $0 + \alpha = \alpha + 0 = \alpha, \forall \alpha \in V$- (4) 存在逆元（负元素）： 对任何$\alpha$，都有 $-\alpha \in V$，使得 $\alpha + (-\alpha) = (-\alpha) + \alpha = 0$

推论： 零元素与负元素在给定空间中是唯一的。

2. 数乘性质

对 $\forall \alpha, \beta \in V$以及$\forall k, l \in K$：

(5) 数乘单位元： $1 \cdot \alpha = \alpha$- (6) 数乘结合律：$k(l\alpha) = (kl)\alpha$- (7) 左分配律：$(k + l)\alpha = k\alpha + l\alpha$- (8) 右分配律：$k(\alpha + \beta) = k\alpha + k\beta$

$V$是能与$K$ 作数乘的交换群。

与环的对比

如果把代数结构比作某种构建规则，线性空间强调的是层次间的互动，而环强调的是内部的自我演化。

环（Ring） 是一个 “自给自足” 的单集结构。它在一个集合 $R$ 上定义了两种二元运算：加法和乘法。所有的操作（$a+b$或$a \cdot b$）都发生在 $R$ 内部。你可以把它想象成一个封闭的黑盒，里面的元素通过两种规则自我碰撞。
线性空间（Vector Space） 是一个 “双集联动” 的结构。它涉及两个集合：一个向量集 $V$和一个数域$K$（标量）。加法是 $V$内部的互动，但乘法（数乘）是跨界的——由域$K$中的“外部力量”作用于$V$ 中的元素。

这部分讲义将讨论的重心从线性空间的“定义”转向了它的结构度量。如果说公理是空间的“宪法”，那么基（Basis） 与维数（Dimension） 就是它的“骨架”与“尺度”。

类似我们熟悉的向量组的讨论，线性空间也可以完全类似地定义基、维数等，事实上我们将看到线性映射和矩阵是同构的。

基、维数与同构

向量组的秩与极大无关组

极大无关组：向量组可以有许多不同的极大无关组，但它们包含的向量个数必然相同。
秩（Rank）：极大无关组所含向量的个数称为该向量组的秩。

基底与维数

对于线性空间 $V$的子集$S$：

线性表出：若 $V$中每个向量都能表示为$S$中有限个向量的线性组合，称$S$能线性表出$V$。
线性无关：若 $S$的任意有限子集都线性无关，则称$S$ 线性无关。

基底（Basis）的定义：

若子集 $S$ 同时满足：

$S$ 线性无关；
$S$能线性表出$V$；

则称 $S$是$V$ 的一组基。

维数（Dimension）：
- 若 $S$是有限集，则称$V$ 为有限维线性空间。
- $V$的任意两组基包含的向量个数相同，这个常数称为$V$的维数，记为$\dim V$。
- 规定零空间 ${0}$的维数为$0$。

引理与推论

引理：设 $\alpha_1, \dots, \alpha_s$线性无关，则$\alpha_1, \dots, \alpha_s, \beta$线性相关$\iff \beta$能被$\alpha_1, \dots, \alpha_s$ 线性表出。
扩充定理（推论）：在有限维线性空间 $V$中，任何线性无关的向量组$\alpha_1, \dots, \alpha_s$都能扩充为$V$ 的一组基。

基底的判定定理

设 $S$是有限维线性空间$V$的子集，以下三个条件中只要有两个成立，则三个条件都成立（即$S$构成$V$ 的基）：

$S$ 线性无关；
$S$能线性表出$V$；
$|S| = \dim V$（向量个数等于空间维数）。

坐标同构 $V \cong K^n$一旦在线性空间$V$中取定了一组基$\alpha_1, \alpha_2, \dots, \alpha_n$，那么 $V$中的每一个元素$\alpha$ 都可以唯一地表示为：

$$ \alpha = k_1\alpha_1 + k_2\alpha_2 + \dots + k_n\alpha_n $$

坐标：列向量 $[k_1, k_2, \dots, k_n]^T \in K^n$称为$\alpha$ 在该基下的坐标。
本质：这种一一对应关系保持了加法和数乘运算。这意味着，任何 $n$维线性空间在代数结构上都与$K^n$ 是一模一样的（同构）。

关于基、换基等操作，可以在数学随笔3.基底思想阅读。

子空间的运算

线性子空间的定义

若线性空间 $V$的子集$W$满足以下三条性质，则称$W$是$V$ 的子空间：

非空性/包含零向量：$0 \in W$2. 加法封闭性：若$\alpha, \beta \in W$，则 $\alpha + \beta \in W$3. 数乘封闭性：若$k \in K, \beta \in W$，则 $k\beta \in W$

本质：$W$在$V$ 原有的运算下也构成一个完备的线性空间，自动满足八条公理。

子空间的性质与构造

定理（基扩张与维数）：
- 子空间 $W$的基都能扩充成全空间$V$ 的基。
- 维数不等式：$\dim W \le \dim V$。
- 等号成立条件：$\dim W = \dim V \iff W = V$。
给出子空间的几种方式：
1. 生成元方式：由一组向量生成的张成空间 $W = \langle \alpha_1, \dots, \alpha_s \rangle$。
2. 解空间方式：作为齐次线性方程组 $Ax = 0$ 的解集。
3. 运算构造方式：通过交、和、正交补（内积空间中）等运算得到。

子空间的运算：交与和

1. 子空间的交 (Intersection)

定理：若 $V_1, V_2$是$V$的子空间，则其交集$V_1 \cap V_2$也是$V$ 的子空间。
注意：并集 $V_1 \cup V_2$一般不是子空间，除非其中一个包含另一个（即$V_1 \supseteq V_2$或$V_1 \subseteq V_2$）。

2. 子空间的和 (Sum)

定义：若 $V_1, V_2$是$V$的子空间，集合${ \alpha_1 + \alpha_2 \mid \alpha_1 \in V_1, \alpha_2 \in V_2 }$称为$V_1$与$V_2$ 的和，记为 $V_1 + V_2$。
性质：$V_1 + V_2$也是$V$ 的子空间。
生成元表示：

若 $V_1 = \langle \alpha_1, \dots, \alpha_r \rangle$，$V_2 = \langle \beta_1, \dots, \beta_s \rangle$，

则 $V_1 + V_2 = \langle \alpha_1, \dots, \alpha_r, \beta_1, \dots, \beta_s \rangle$。

相比于并，和更能体现线性空间的味道，例如两条直线的并是两条直线作为一个整体，但是和则是铺成一个平面，带有了线性运算。同时，和可以直接构造子空间，并则不太容易。

维数公式

一、定理内容

若 $V_1, V_2$是线性空间$V$ 的子空间，则它们的和空间与交空间的维数满足以下关系：

$$ \dim(V_1 + V_2) + \dim(V_1 \cap V_2) = \dim V_1 + \dim V_2 $$

直观理解：两个空间的合并维数，等于各自维数之和减去重复计算的交集部分维数。这与集合论中的容斥原理极其相似。

二、证明概要

证明的核心在于通过基的扩充构造出一组能张成 $V_1 + V_2$ 的线性无关组。实际上在数学随笔3之基底思想已经干过完全一样的证明了。

取交空间的基：设 $V_1 \cap V_2$的一组基为$\alpha_1, \dots, \alpha_r$。此时 $\dim(V_1 \cap V_2) = r$。
向两侧扩充：
- 将其扩充为 $V_1$ 的基：$\alpha_1, \dots, \alpha_r, \beta_1, \dots, \beta_m$。则 $\dim V_1 = r + m$。
- 将其扩充为 $V_2$ 的基：$\alpha_1, \dots, \alpha_r, \gamma_1, \dots, \gamma_s$。则 $\dim V_2 = r + s$。
构造和空间的基：证明 $\beta_1, \dots, \beta_m, \alpha_1, \dots, \alpha_r, \gamma_1, \dots, \gamma_s$线性无关且张成$V_1 + V_2$。
- 若线性组合为零：$k_1\beta_1 + \dots + l_1\gamma_1 + \dots = 0$。
- 变形得：$k_i\beta_i$的组合属于$V_2$，因此必然落在交集 $V_1 \cap V_2$ 中。
- 利用交空间的基表出并结合线性无关性，推出所有系数全为 $0$。
结论：$\dim(V_1 + V_2) = m + r + s$。
- 代入等式：$(m + r + s) + r = (r + m) + (r + s)$，公式成立。

线性无关、直和与唯一性表示

一、线性无关 $\iff$ 表出唯一

对于向量组 $\alpha_1, \dots, \alpha_s$：

核心逻辑：如果该向量组表示零向量的方式是唯一的，那么它表示任何能表出的向量的方式都是唯一的。

若满足表达零向量唯一，则设有两种方法表示 $\beta$ ，作差就得到两种方法的系数必须一样，那也就实际上只有一种方法。

二、子空间的直和 (Direct Sum)

当我们将讨论的对象从“单个向量”提升到“子空间”时，唯一性依然是判定结构的核心。

1. 表示方式的定义

设 $V_1, \dots, V_s$是$V$的子空间。对于和空间$V_1 + \dots + V_s$中的任意向量$\beta$，其表示方式为：

$$ \beta = \alpha_1 + \alpha_2 + \dots + \alpha_s, \quad (\alpha_i \in V_i) $$

有序组 $(\alpha_1, \dots, \alpha_s)$称为$\beta$ 的一种表示。

2. 直和的判定：零向量的唯一性

定理：表示零向量的方式唯一 $\iff$ 表示任何向量的方式都唯一。
直和的定义：若 $V_1 + \dots + V_s$ 中任何元素的表示方式都唯一，则称该和为直和，记为：

$$ V_1 \oplus V_2 \oplus \dots \oplus V_s $$

推导过程：
- 如果表示零向量的方式不唯一（存在非零向量之和为 $0$），则通过加法叠加，任何向量的表示都会有无数种组合。
- 反之，若表示 $0$的方式唯一（即$\sum \alpha_i = 0 \implies \alpha_i = 0$），则由 $\beta$ 的两种表示作差，立得两种表示完全一致。

直和的本质是子空间之间“不重叠”（除零向量外）。

非直和情形：若 $V_1 \cap V_2 \neq {0}$，则存在非零向量 $\alpha \in V_1 \cap V_2$。此时零向量可以有非平凡表示：$0 = \alpha + (-\alpha)$。几何上表现为两个平面（或线）交于一条线。
直和情形：若 $V_1 \cap V_2 = {0}$，则 $\alpha_1 + \alpha_2 = 0 \implies \alpha_1 = -\alpha_2 \in V_1 \cap V_2 = {0}$。这意味着分解方式唯一。几何上表现为两个空间仅交于原点。

当涉及多个子空间 $V_1, \dots, V_s$ 时，两两交为零是不够的，必须满足更强的条件。

定理：

$V_1 + \dots + V_s$是直和，当且仅当对每一个$k$ ($1 \le k \le s$)，第 $k$ 个子空间与它前面所有子空间之和的交集仅含零向量：

$$ V_k \cap (V_1 + \dots + V_{k-1}) = \{0\} $$

证明要点：
- 充分性：设 $\sum \alpha_i = 0$。取最后一个非零向量 $\alpha_k$，则 $\alpha_k = -(\alpha_1 + \dots + \alpha_{k-1})$。这导致 $\alpha_k$落在$V_k$ 与前面子空间和的交集中，与条件矛盾。
- 必要性：若交集不为零，则存在非零向量能被前面的向量组表出，导致零向量的表示不唯一。

三、等价命题定理

以下命题对于判定子空间是否构成直和是等价的：

表示唯一性：$V_1 + \dots + V_s$是直和（即表示$0$ 的方式唯一）。
基的保持性：分别取子空间 $V_1, \dots, V_s$ 的基，将这些基向量合并后，得到的向量组在全空间中依然线性无关。
- 换句话说，这些基向量合并后构成了和空间 $V_1 \oplus \dots \oplus V_s$ 的一组基.。
维数和：$dim(V_1+…+V_s)=dim(V_1)+…+dim(V_s)$当$\dim(V_1 \cap V_2) = 0$（即 $V_1 \cap V_2 = {0}$）时，维数公式简化为：

$$ \dim(V_1 + V_2) = \dim V_1 + \dim V_2 $$

此时的和称为直和，记作 $V_1 \oplus V_2$。这意味着和空间中的每一个向量都可以唯一地表示为 $V_1$和$V_2$ 中向量的和。

我们看一个定理，这实际上在数学随笔之范德蒙德行列式的意外出现有提到过，讨论的就是直和。

定理：

设 $V_1, V_2, \dots, V_s$是方阵$A$对应于不同特征值$\lambda_1, \lambda_2, \dots, \lambda_s$ 的特征子空间，则它们的和是直和。

证明思路（范德蒙德法）：
1. 设 $\alpha_1 + \alpha_2 + \dots + \alpha_s = 0$，其中 $\alpha_i \in V_i$。
2. 利用 $A$左乘该式$s-1$次，根据$A\alpha_i = \lambda_i \alpha_i$，得到一系列线性方程：

$$ \begin{cases} \alpha_1 + \dots + \alpha_s = 0 \\ \lambda_1 \alpha_1 + \dots + \lambda_s \alpha_s = 0 \\ \vdots \\ \lambda_1^{s-1} \alpha_1 + \dots + \lambda_s^{s-1} \alpha_s = 0 \end{cases} $$

由于特征值 $\lambda_i$两两不同，对应的范德蒙德行列式不为零，从而推导出每个分量$\alpha_i$必须全为$0$。

还可以更进一步，考虑所谓广义特征子空间。

广义特征子空间的直和与多项式分解

一、广义特征子空间的直和性

定理：

设 $\lambda_1, \dots, \lambda_s \in K$是矩阵$A \in M_n(K)$ 的互异特征值，$r_1, \dots, r_s > 0$ 为对应的幂次，则其广义特征子空间之和是直和：

$$ \text{Ker}(A - \lambda_1 I)^{r_1} \oplus \dots \oplus \text{Ker}(A - \lambda_s I)^{r_s} $$

证明逻辑（构造性矛盾法）：
1. 假设存在非零向量之和为零：$\alpha_1 + \dots + \alpha_s = 0$。
2. 对 $\alpha_1$，寻找使其“退化”到特征向量层级的最小指数 $t$，定义 $\beta_1 = (A - \lambda_1 I)^{t-1} \alpha_1 \neq 0$。此时 $\beta_1$是属于$\lambda_1$ 的特征向量($A-\lambda I$作用$\beta$是$0$ )。
3. 利用算子 $(A - \lambda_1 I)^{t-1} \prod_{j \neq 1} (A - \lambda_j I)^{r_j}$ 左乘原式。
4. 除了第一项，其余项均会因落在 $\text{Ker}$中而消解为$0$。
5. 最终导出 $(\lambda_1 - \lambda_2)^{r_2} \dots (\lambda_1 - \lambda_s)^{r_s} \beta_1 = 0$。由于特征值互异且 $\beta_1 \neq 0$，产生矛盾，从而证明各分量必为零。

那之前大费周章学了那么多多项式的内容有什么用呢？实际上利用多项式我们可以给出空间的分解：

核空间分解定理的详细证明

一、定理

设 $f_1(x), \dots, f_s(x) \in K[x]$两两互素。记$f(x) = \prod_{i=1}^s f_i(x)$。对于 $A \in M_n(K)$，有：

$$ \text{Ker } f(A) = \text{Ker } f_1(A) \oplus \text{Ker } f_2(A) \oplus \dots \oplus \text{Ker } f_s(A) $$

二、证明步骤拆解

1. 证明和是“直和”

要证直和，只需证 $V_i \cap (\sum_{j \neq i} V_j) = {0}$，其中 $V_i = \text{Ker } f_i(A)$。

构造辅助多项式：记 $F_i(x) = \frac{f(x)}{f_i(x)}$，即除去 $f_i$ 后其余多项式的乘积。
利用互素性：由于 $(f_i(x), f_j(x)) = 1$（对所有 $j \neq i$），推导出 $f_i(x)$与$F_i(x)$互素，即$(f_i, F_i) = 1$。
裴蜀等式 (Bézout’s Identity)：存在 $u(x), v(x)$使得$u(x)f_i(x) + v(x)F_i(x) = 1$。
算子化：将 $x$换成矩阵$A$，作用于任意向量 $\alpha \in V_i \cap (\sum_{j \neq i} V_j)$：
- $\alpha = u(A)f_i(A)\alpha + v(A)F_i(A)\alpha$- 因为$\alpha \in \text{Ker } f_i(A)$，故 $f_i(A)\alpha = 0$。
- 因为 $\alpha$在其余核空间的和中，而$F_i(A)$包含所有其余因子，故$F_i(A)\alpha = 0$。
- 结论：$\alpha = 0$，故和为直和。

2. 证明核空间的包含关系

需证 $\sum \text{Ker } f_i(A) = \text{Ker } f(A)$。

以 $s=2$为例：已知$(f_1, f_2) = 1$，则 $u(A)f_1(A) + v(A)f_2(A) = I$。
对于 $\forall \alpha \in \text{Ker } f(A)$：

$$ \alpha = I\alpha = \underbrace{u(A)f_1(A)\alpha}_{\in \text{Ker } f_2(A)} + \underbrace{v(A)f_2(A)\alpha}_{\in \text{Ker } f_1(A)} $$

（注：$f_2(A) \cdot [u(A)f_1(A)\alpha] = u(A)f(A)\alpha = 0$）

推广到一般情形：利用归纳法，将 $f(x)$视为$f_1(x)$与$(f_2 \dots f_s)(x)$ 的积，层层剥离。

综合两方面证明就完成了。也就是说，从一个多项式的分解，我们可以得到一个空间的分解，这是非常美妙的。

如果我们想分解整个空间，要考虑什么多项式呢？

零化多项式与空间分解

一、零化多项式 (Annihilating Polynomial)

定义：设 $A \in M_n(K)$，若存在多项式 $f(x) \in K[x]$使得$f(A) = 0$，则称 $f(x)$为$A$ 的一个零化多项式。
经典示例：
- 幂等变换（投影）：$x^2 - x$是其零化多项式（因为$A^2 = A$）。
- 对合变换（镜像）：$x^2 - 1$是其零化多项式（因为$A^2 = I$）。

二、零化多项式驱动的空间全分解

核心定理：

若矩阵 $A$的零化多项式$f(x)$在域$K$上可分解为两两互素的因子乘积$f(x) = f_1(x) \dots f_s(x)$，则全空间 $V$ 具有直和分解：

$$ V = \text{Ker } f_1(A) \oplus \dots \oplus \text{Ker } f_s(A) $$

逻辑跃迁：这里因为 $f(A)=0$，所以 $\text{Ker } f(A)$直接就是整个空间$V$。

三、可对角化的充分必要条件

这是线性代数中最优雅的结论之一：

矩阵 $A$在域$K$上可对角化，当且仅当$A$有一个零化多项式能在$K$ 上分解成互异的一次因式的乘积：

$$ f(x) = (x - \mu_1)(x - \mu_2) \dots (x - \mu_s), \quad \mu_i \in K \text{ 且互异} $$

必要性推导：若 $A$可对角化，则全空间是特征子空间的直和。作用算子$(A - \lambda_1 I)\dots(A - \lambda_s I)$于任何向量都会得到$0$，说明该乘积即为零化多项式。
充分性推导：若存在此类零化多项式，由核空间分解定理，全空间 $V$ 会分解为各个特征子空间（或零空间）的直和：

$$ V = \bigoplus_{i=1}^s \text{Ker}(A - \mu_i I) $$

这意味着 $V$有一组由特征向量构成的基，即$A$ 可对角化。

四、案例应用：对合变换的分解

场景：设 $V = M_n(K)$，考虑转置变换 $T: A \to A^T$。

特征方程：显然 $T^2 = I$，故零化多项式为 $f(x) = x^2 - 1 = (x - 1)(x + 1)$。
空间直和：由于 $1$与$-1$互异，空间$V$ 可分解为：

$$ V = \text{Ker}(T - I) \oplus \text{Ker}(T + I) $$

几何意义：
- $\text{Ker}(T - I)$是所有满足$A^T = A$的矩阵（对称矩阵$V_1$）。
- $\text{Ker}(T + I)$是所有满足$A^T = -A$的矩阵（反对称矩阵$V_2$）。
- 结论：任何方阵都能唯一地分解为一个对称矩阵与一个反对称矩阵之和：$A = \frac{A+A^T}{2} + \frac{A-A^T}{2}$。

补空间与外直和

一、补空间 (Complementary Subspace)

如果说子空间是空间的一部分，那么补空间就是“剩下那部分”的完美补充。

定义：设 $W, W’$是$V$的子空间。若满足$V = W \oplus W’$（即 $V$是它们的直和），则称$W$与$W’$ 互为补空间。
存在性定理：任何线性子空间都有补空间。
构造逻辑：
1. 取 $W$的一组基$\alpha_1, \dots, \alpha_r$。
2. 将其扩充为全空间 $V$的一组基$\alpha_1, \dots, \alpha_r, \alpha_{r+1}, \dots, \alpha_n$。
3. 由扩充出来的向量 $\langle \alpha_{r+1}, \dots, \alpha_n \rangle$张成的子空间即为$W$ 的一个补空间。
注意：补空间通常不唯一。扩充基底的方式不同，得到的补空间在空间中的“姿态”也不同。

二、外直和 (External Direct Sum)

当我们手里有几个独立的线性空间，想要把它们合成一个更大的空间时，就需要用到外直和。

定义：设 $V_1, \dots, V_s$是数域$K$ 上的线性空间，其外直和定义为笛卡尔积集合：

$$ V_1 \oplus \dots \oplus V_s = \{ (\alpha_1, \dots, \alpha_s) \mid \alpha_i \in V_i \} $$

运算规则：
- 加法：分量对位相加，$(\alpha_1, \dots) + (\beta_1, \dots) = (\alpha_1 + \beta_1, \dots)$。
- 数乘：标量作用于每个分量，$k(\alpha_1, \dots) = (k\alpha_1, \dots)$。

三、外直和与内直和的统一

虽然“外直和”是从多个集合构建新集合，但它本质上可以看作“内直和”。

嵌入与同构：

构造 $V$的子空间$V_i’$，使得 $V_i’$中的元素仅在第$i$个位置有非零向量，其余位置全为$0$：

$$ V_i' = \{ (0, \dots, \alpha_i, \dots, 0) \mid \alpha_i \in V_i \} $$

结论：
1. $V_i’ \cong V_i$（每个 $V_i’$都同构于原空间$V_i$）。
2. 整个外直和空间 $V$恰好是这些子空间$V_i’$ 的内直和：

$$ V = V_1' \oplus \dots \oplus V_s' $$

线性空间的同构

线性映射与同构的定义

设 $U, V$是域$K$上的两个线性空间。若映射$\mathcal{A}: U \to V$ 满足：

加法齐次性：$\mathcal{A}(\alpha + \beta) = \mathcal{A}\alpha + \mathcal{A}\beta, \quad \forall \alpha, \beta \in U$
数乘齐次性：$\mathcal{A}(k\alpha) = k\mathcal{A}\alpha, \quad \forall k \in K$则称$\mathcal{A}$是$U$到$V$ 的线性映射。

若 $\mathcal{A}$是双射（既是单射又是满射），则称$\mathcal{A}$是$U$到$V$的线性同构，记作$U \cong V$。

2. 同构的关键判定与定理

推论：设 $\mathcal{A}: U \to V$ 是线性映射，$\alpha_1, \dots, \alpha_n$是$U$的一组基。$\mathcal{A}$是$U$与$V$的线性同构$\iff \mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n$是$V$ 的一组基。
基础定理：有限维 $K$-线性空间 $U$与$V$ 同构的充要条件是它们的维数相等：

$$ U \cong V \iff \dim U = \dim V $$

3. 性质证明要点

满射判定：$\mathcal{A}$是满射$\iff \mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n$张成$V$。

即 $V$中任意向量均可表示为$\mathcal{A}\alpha_i$ 的线性组合：$\text{Im} \mathcal{A} = L(\mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n)$。
单射判定：$\mathcal{A}$是单射$\iff \mathcal{A}\alpha_1, \dots, \mathcal{A}\alpha_n$ 线性无关。

证明思路：由 $\sum k_i \mathcal{A}\alpha_i = 0$推导出$\mathcal{A}(\sum k_i \alpha_i) = 0$，若 $\mathcal{A}$为单射则核为空，进而利用$\alpha_i$的无关性证得$k_i = 0$。

4. 坐标同构 (Coordinate Isomorphism)

在 $n$维线性空间$V$中取定一组基$\alpha_1, \dots, \alpha_n$ 后，$V$中的每个元素$\alpha = \sum k_i \alpha_i$与其坐标向量$[k_1, \dots, k_n]^T \in K^n$ 之间建立了一一对应关系。

结论：这种对应保持了向量的加法与数乘运算，即 $V$与向量空间$K^n$ 线性同构。

5. 同构关系的性质

线性空间的同构关系满足：

自反性：$V \cong V$- 交换性：若$U \cong V$，则 $V \cong U$- 传递性：若$U \cong V$且$V \cong W$，则 $U \cong W$

因此，同构是线性空间集合上的一个等价关系。

6. 实例与应用

矩阵秩的性质：

设矩阵 $A = [\alpha_1, \dots, \alpha_n]$列满秩，则映射$X \mapsto AX$是$K^n$到$A$ 的列空间的线性同构。
矩阵分解应用：

若 $B = AC = [\alpha_1, \dots, \alpha_n] [\gamma_1, \dots, \gamma_s]$，则：
1. $B$的秩$= C$ 的秩。
2. $B$的解空间$= C$ 的解空间。
3. $\gamma_1, \dots, \gamma_s$是$\beta_1, \dots, \beta_s$在基$\alpha_1, \dots, \alpha_n$ 下的坐标。
思考题：矩阵 $A$ 的行空间与列空间同构吗？

提示：由于行秩等于列秩，即维数相等，根据定理它们必然同构。

商空间与线性映射基本定理

商空间听起来很高级，实际上动机是简单的，我们知道重力势能可以简单地写为 $mgh$ ，那么水平方向如何运动便可以置之不顾了，那么我们略去三维中的两维，只看高度这一个坐标即可，商空间干的事其实也就是这样。

核心动机：忽略不相关的细节

在处理复杂事物时，我们往往只关注某些特定的“层面”。

数学直观：如果我们对子空间 $W$ 方向的差异不感兴趣，就希望通过某种方式将其“抹去”或“淡化”。
几何想象：将高维空间沿 $W$方向“压扁”，使得落在同一个与$W$ 平行的平面（陪集）上的所有点，在商空间视角下被视为同一个“元素”。

$W$-陪集（Coset）

陪集是将空间 $V$按照子空间$W$进行划分的基本单位。简单来说就是让$W=0$。按照之前的重力势能的比喻，就是说在同一个高度的坐标我们就看做一个陪集，认为他们都相等，这里就可以把$W$看做$x,y$ 坐标，即被弃置不顾的东西。

等价关系：定义 $\alpha \sim \beta \iff \alpha - \beta \in W$。
定义：对于 $V$中的向量$\beta$，其所在的等价类称为 $\beta$的$W$-陪集，记作 $\beta + W = { \beta + \gamma \mid \gamma \in W }$。
代表元：陪集中的任何向量都可以作为该陪集的代表。只要 $\alpha - \beta \in W$，则 $\alpha + W = \beta + W$。

商空间 $V/W$ 的代数结构

全体 $W$-陪集的集合记为 $V/W$。为了使其成为线性空间，定义了如下运算：

加法：$(\alpha + W) + (\beta + W) = (\alpha + \beta) + W$
数乘：$k(\alpha + W) = k\alpha + W$
良定义性：运算结果不依赖于陪集代表元的选取（需验证）。作差即可验证。
结论：在此运算下，$V/W$ 构成线性空间，称为 $V$模$W$ 的商空间。

基与维度（Basis and Dimension）

这是将商空间具体化的关键。

定理：设 $W$的一组基为$\alpha_1, \dots, \alpha_s$，将其扩充为 $V$的一组基$\alpha_1, \dots, \alpha_s, \beta_1, \dots, \beta_r$。
结论：剩余的向量所形成的陪集 ${\beta_1 + W, \dots, \beta_r + W}$构成了商空间$V/W$ 的一组基。
维数公式：

$$ \dim(V/W) = \dim V - \dim W $$

证明：

证明能表出（Spanning）：

对于 $V/W$中任意元素$\alpha + W$，将 $\alpha$用$V$的全基线性表示。由于$\alpha_i$部分全部落在$W$中，在商运算（模$W$）下，属于 $W$的分量会自动坍缩为零元（即$0 + W$）。

$$ \alpha + W = (\sum k_i \alpha_i + \sum l_j \beta_j) + W = (\sum l_j \beta_j) + W $$

这说明 $\beta_j + W$ 足以覆盖整个商空间。

证明线性无关（Linear Independence）：

设定线性组合为零元：$\sum l_j (\beta_j + W) = 0 + W$。

这意味着向量 $\sum l_j \beta_j$必须落在子空间$W$ 内。

根据基底的唯一定义，若一个仅由 $\beta_j$组成的向量属于$\text{span}{\alpha_i}$，由于全基 ${\alpha_i, \beta_j}$是线性无关的，所有系数$l_j$必须全为$0$。

线性映射的核心：核与像

对于任何线性映射 $\mathcal{A}: U \to V$，都有两个关键的子空间：

像空间 $\text{Im},\mathcal{A}$：$V$ 中所有能被映射到的向量集合。它反映了映射的“广度”。
核空间 $\text{Ker},\mathcal{A}$：$U$中所有被映射到$0$ 的向量集合。它反映了映射丢失的“信息量”。
典范映射：特例情况下，映射 $\mathcal{A}: V \to V/W$将向量映为其陪集$\alpha + W$，此时 $\text{Ker},\mathcal{A} = W$，$\text{Im},\mathcal{A} = V/W$。

线性映射基本定理

这是线性代数的高光时刻。定理指出：任何线性映射都可以被“分解”为一个同构映射。

同构关系：

$$ U/\text{Ker}\,\mathcal{A} \cong \text{Im}\,\mathcal{A} $$

直观理解：

如果我们把定义域 $U$中那些映射到同一个点的向量“打包”在一起（即作商空间，模掉$\text{Ker},\mathcal{A}$），那么这个“包”的集合与像空间之间就是一一对应的。
性质：映射 $\varphi: \alpha + \text{Ker},\mathcal{A} \mapsto \mathcal{A}\alpha$ 是良定义的，且既是单射又是满射。

1. 诱导映射的构造

定义映射 $\varphi: U/\text{Ker},\mathcal{A} \to \text{Im},\mathcal{A}$，其规则为：

$$ \varphi(\alpha + \text{Ker}\,\mathcal{A}) = \mathcal{A}\alpha $$

代数上的相容性：$\varphi$ 完美保持了向量的加法与数乘运算。
几何上的映射关系：原本在 $U$中所有映射到同一个像点$\beta$的向量（它们构成一个$\text{Ker},\mathcal{A}$ 的陪集），现在被视为商空间中的一个整体。这意味着映射从“多对一”变成了一对一的线性同构。

具体的验证比较容易，就不打出来了。

2. 维度守恒：秩-零化度定理

基于 $U/\text{Ker},\mathcal{A} \cong \text{Im},\mathcal{A}$ 的同构关系，我们必然得到维度的平衡：

$$ \dim U = \dim(\text{Ker}\,\mathcal{A}) + \dim(\text{Im}\,\mathcal{A}) $$

这可以看作是定义域空间的“能量守恒”：一部分维度坍缩到了零点（核空间），剩下的维度则铺开了映射的像（像空间）。

矩阵视角的具象化：方程组与空间的映射

当我们将上述理论落地到矩阵 $A \in K^{m \times n}$ 时，抽象的符号变成了直观的线性方程组特性：

抽象概念	矩阵具象	物理/几何意义
像空间 $\text{Im},\mathcal{A}$	列空间 (Column Space)	矩阵各列向量线性组合所能张成的空间。
核空间 $\text{Ker},\mathcal{A}$	解空间 (Null Space)	齐次线性方程组 $A\mathbf{x} = \mathbf{0}$ 的全体解。
同构关系	$K^n / \text{Null}(A) \cong \text{Col}(A)$	剔除解空间后的输入，与输出空间达成一一对应。

结论

由基本定理可直接导出矩阵论的基石：

矩阵的秩（列空间的维数） + 解空间的维数 = 矩阵的列数。

这意味着，非齐次线性方程组 $A\mathbf{x} = \mathbf{b}$ 的解集之所以呈现出“特解 + 齐次核”的形态，本质上是因为它就是商空间中某一个特定的陪集。

商空间的使用方法：构造满射，模去核空间，得到同构

例：设 $U, W$是线性空间$V$ 的子空间。证明：

$$ U / U \cap W \cong (U + W) / W $$

证：映射 $\mathcal{A} : U \to (U + W) / W

$$ $\alpha \mapsto \alpha + W $$

是线性映射。

$\mathcal{A}$显然是满射且$\text{Ker} \mathcal{A} = U \cap W$。

由线性映射基本定理即得到结论。

$\mathbf{W}$的补空间$\cong$模$\mathbf{W}$ 的商空间

定理：

设 $\mathbf{V}$的子空间$\mathbf{W}$的有一个补空间$\mathbf{U}$，即 $\mathbf{W} \oplus \mathbf{U} = \mathbf{V}$。则映射

$$ \sigma : \mathbf{U} \to \mathbf{V} / \mathbf{W} $$

$$ \alpha \mapsto \alpha + \mathbf{W} $$

是 $\mathbf{W}$的补空间$\mathbf{U}$到商空间$\mathbf{V} / \mathbf{W}$ 的同构。

$\mathbf{W} \oplus \mathbf{U} = \mathbf{V} \implies \mathbf{U} \cong \mathbf{V} / \mathbf{W}$

$\beta + \alpha = \gamma \mapsto \alpha + \mathbf{W} = \gamma + \mathbf{W}$

数学

阅读全文

神秘补充题

线代 2026/4/5

一

设 $V = \mathbb{F}{13}^3$是有限域$\mathbb{F}{13}$ 上的三维向量空间。给定矩阵：

$$ A = \begin{bmatrix} 5 & 7 & 7 \\ 12 & 4 & 2 \\ 3 & 7 & 9 \end{bmatrix} \pmod{13} $$

对角化判定判断矩阵 $A$能否在域$\mathbb{F}_{13}$ 上对角化，并说明理由。
矩阵的阶与可逆性证明 $A$是可逆矩阵，并求出最小的正整数$d$，使得：

$$ A^d = I $$

（其中 $I$ 为单位矩阵）。

向量等价关系与轨道分解设 $\alpha, \beta \in \mathbb{F}_{13}^3$。若存在非负整数 $k, l \ge 0$，使得：

$$ A^k \alpha = \beta \quad \text{且} \quad A^l \beta = \alpha $$

则称 $\alpha$与$\beta$等价，记作$\alpha \sim \beta$。证明：“$\sim$” 是向量空间 $\mathbb{F}{13}^3$上的一个等价关系。向量空间$\mathbb{F}{13}^3$被划分为几个等价类？每个等价类（称为一条$A$-轨道）分别包含几个向量？哪些等价类的并集能够构成 $\mathbb{F}_{13}^3$ 的子空间？

这道题的本质，其实是：

有限域上线性变换 = 对角化 + 有限乘法群 + 群作用轨道分解

数学

阅读全文

罗马

西方文化选读 2026/4/2

阅读全文

4月日记

日记类 2026/4/1

4月了呢。

日记类

阅读全文

0323 导数与放缩

2026/3/31

导数

一、核心方法体系（Methodology）

解决导数恒成立问题的核心在于将“不等式成立”转化为“函数最值”问题。

分离参数： 将参数 $a$孤立在不等式一侧，转化为$a \ge f(x){\max}$或$a \le f(x){\min}$。
分类讨论： 当参数无法分离时，根据参数对导数符号（单调性）的影响进行分段讨论。
数形结合： 借助函数图像的直观性（如二次函数与三角函数的上下位置关系）快速定位临界状态。
端点效应（必要探路）： 利用定义域端点的函数值或导数值缩小参数范围，再证明充分性。

二、 “任意”与“存在”的转化逻辑

在双变量问题中，逻辑词的组合决定了最值的组合方式：

逻辑条件翻译	转化目标（数学等价）
$\forall x_1 \in D_1, \forall x_2 \in D_2, f(x_1) \le g(x_2)$	$f(x_1){\max} \le g(x_2){\min}$
$\forall x_1 \in D_1, \exists x_2 \in D_2, f(x_1) \ge g(x_2)$	$f(x_1){\min} \ge g(x_2){\min}$
$\exists x_1 \in D_1, \exists x_2 \in D_2, f(x_1) \le g(x_2)$	$f(x_1){\min} \le g(x_2){\max}$
$\forall x_1 \in D_1, \exists x_2 \in D_2, f(x_1) = g(x_2)$	$f(x)$的值域$\subseteq g(x)$ 的值域

经典题型与实战技巧

一：数形结合与临界相切模型

题目： 已知函数 $f(x)=3x^2 - 8\sin(x+\varphi)$，其中 $\varphi \in [-\frac{\pi}{2}, 0]$。若 $\forall x \ge 0, f(x) \ge 0$恒成立，求$\varphi$ 的取值范围。

【解析】

等价转化：

不等式 $f(x) \ge 0$等价于$3x^2 \ge 8\sin(x+\varphi)$。

令 $g(x) = 3x^2$，$h(x) = 8\sin(x+\varphi)$。题目转化为：在 $[0, +\infty)$ 上，抛物线始终在正弦曲线的上方或与其相切。
寻找临界切点：

设两曲线在 $x_0$ 处相切，则在该点处函数值相等且导数值相等：

$$ \begin{cases} 3x_0^2 = 8\sin(x_0+\varphi) & \text{——(1)} \\ 6x_0 = 8\cos(x_0+\varphi) & \text{——(2)} \end{cases} $$

消参计算：

利用 $\sin^2\theta + \cos^2\theta = 1$，将 (1) 和 (2) 式平方相加：

$(\frac{3x_0^2}{8})^2 + (\frac{6x_0}{8})^2 = 1 \implies \frac{9x_0^4}{64} + \frac{36x_0^2}{64} = 1$

整理得：$9x_0^4 + 36x_0^2 - 64 = 0$

因式分解：$(3x_0^2 - 4)(3x_0^2 + 16) = 0$由于$x_0 > 0$，解得 $x_0^2 = \frac{4}{3} \implies x_0 = \frac{2\sqrt{3}}{3}$。
求 $\varphi$：

将 $x_0$ 代入 (2) 式：$6 \cdot \frac{2\sqrt{3}}{3} = 8\cos(x_0+\varphi) \implies \cos(x_0+\varphi) = \frac{\sqrt{3}}{2}$。

因 $\varphi \in [-\frac{\pi}{2}, 0]$且$x_0 \approx 1.15$，取 $x_0+\varphi = \frac{\pi}{6}$。

$\varphi = \frac{\pi}{6} - \frac{2\sqrt{3}}{3}$。

结论： $\varphi$的取值范围是$[\frac{\pi}{6} - \frac{2\sqrt{3}}{3}, 0]$（结合 $\varphi$ 原本范围）。

二：切线放缩与构造函数（2012新课标）

题目： 已知 $f(x)=e^x - x + \frac{1}{2}x^2$。若 $f(x) \ge \frac{1}{2}x^2 + ax + b$恒成立，求$(a+1)b$ 的最大值。

【解析】

化简不等式：

$e^x - x + \frac{1}{2}x^2 \ge \frac{1}{2}x^2 + ax + b \implies e^x \ge (a+1)x + b$。
几何逻辑：

令 $y = e^x$，该不等式表示直线始终在指数函数下方。当直线与曲线相切时，$b$ 取得最大可能值（截距最大）。
设切点求关系：

设切点为 $(x_0, e^{x_0})$。

切线斜率 $k = (e^x)’|_{x=x_0} = e^{x_0} = a+1$。

切线方程为：$y - e^{x_0} = e^{x_0}(x - x_0) \implies y = e^{x_0}x + e^{x_0}(1-x_0)$。

对比 $y = (a+1)x + b$，得：

$a+1 = e^{x_0}$，$b = e^{x_0}(1-x_0)$。
构造新函数求极值：

目标式 $G(x_0) = (a+1)b = e^{x_0} \cdot e^{x_0}(1-x_0) = e^{2x_0}(1-x_0)$。

求导：$G’(x_0) = 2e^{2x_0}(1-x_0) - e^{2x_0} = e^{2x_0}(1-2x_0)$。

令 $G’(x_0) = 0$，得 $x_0 = \frac{1}{2}$。

此时最大值为 $G(\frac{1}{2}) = e^{2(1/2)}(1 - \frac{1}{2}) = \frac{e}{2}$。

三：双变量全称命题（2015新课标二）

题目： 设 $f(x)=e^{mx} + x^2 - mx$。若对于任意 $x_1, x_2 \in [-1, 1]$，都有 $|f(x_1) - f(x_2)| \le e-1$恒成立，求$m$ 的取值范围。

【解析】

模型转化：

$|f(x_1) - f(x_2)| \le e-1 \iff f(x){\max} - f(x){\min} \le e-1$（在 $[-1, 1]$ 上）。
分析单调性：

$f’(x) = m e^{mx} + 2x - m$，$f’’(x) = m^2 e^{mx} + 2 > 0$。

说明 $f’(x)$单调递增。又因为$f’(0) = m \cdot 1 + 0 - m = 0$。

所以：当 $x \in [-1, 0)$ 时，$f’(x) < 0$，$f(x)$减；当$x \in (0, 1]$ 时，$f’(x) > 0$，$f(x)$ 增。

最小值： $f(x)_{\min} = f(0) = 1$。
确定最大值：

最大值必在端点 $f(-1)$或$f(1)$处取得。$f(1) = e^m + 1 - m$；$f(-1) = e^{-m} + 1 + m$。

令 $h(m) = e^m - m + 1$，观察发现 $f(-1) = h(-m)$，$f(1) = h(m)$。

根据条件需满足：

$$ \begin{cases} f(1) - f(0) \le e-1 \implies e^m - m \le e-1 \\ f(-1) - f(0) \le e-1 \implies e^{-m} + m \le e-1 \end{cases} $$

求解范围：

观察函数 $h(m) = e^m - m$，其在 $m=1$时$h(1)=e-1$。由于 $h(m)$的性质：$e^m - m \le e-1 \implies m \in [-?, 1]$；

$e^{-m} + m \le e-1 \implies m \in [-1, ?]$。

交集得 $m \in [-1, 1]$。

端点效应与必要性探路

一、什么是“端点效应”？

端点效应的核心逻辑是“由局部推全局”。

对于不等式 $f(x) \ge 0$在闭区间$[x_0, +\infty)$ 恒成立的问题：

第一层（函数值）： 必须满足 $f(x_0) \ge 0$。如果 $f(x_0) = 0$，则需进一步考察导数。
第二层（一阶导）： 在端点值为 0 的前提下，函数必须在端点附近“向上走”，故需满足 $f’(x_0) \ge 0$。
第三层（高阶导）： 若连 $f’(x_0)$也等于 0，则需继续考察$f’’(x_0) \ge 0$，以此类推。

注意： 以上步骤求得的是参数的必要条件（即参数“至少”要满足的范围）。求出范围后，必须回代进行充分性证明，这才是完整的解题大题流程。

二、核心逻辑图解

根据端点处的初始状态，我们可以分为以下三种情形进行“探路”：

情形	图像特征	判别必要条件
不附加任何条件	图像从端点上方开始	$f(x_0) \ge 0$
附加条件 $f(x_0)=0$	图像从原点出发，必须不向下掉	$f’(x_0) \ge 0$
附加条件 $f(x_0)=f’(x_0)=0$	图像在端点处平滑且不下凹	$f’’(x_0) \ge 0$

实战演练：2024 全国甲卷真题还原

题目： 已知函数 $f(x) = (1-ax)\ln(1+x) - x$。若当 $x \ge 0$ 时，$f(x) \ge 0$恒成立，求$a$ 的取值范围。

第一步：必要性探路（先猜答案）

检查端点值： $f(0) = (1-0)\ln(1) - 0 = 0$。

因为 $f(0)=0$，若要 $f(x) \ge 0$恒成立，则在$x=0$处的导数$f’(0)$ 不能为负。
求一阶导：

$f’(x) = -a\ln(1+x) + (1-ax) \cdot \frac{1}{1+x} - 1$

代入端点：$f’(0) = -a\ln(1) + \frac{1}{1} - 1 = 0$。
求二阶导：

由于 $f’(0)=0$，我们继续看 $f’’(0)$。

$f’’(x) = \frac{-a}{1+x} + \frac{-a(1+x)-(1-ax)}{(1+x)^2} = \frac{-a}{1+x} + \frac{-a-1}{(1+x)^2}$

代入端点：$f’’(0) = -a + (-a - 1) = -2a - 1$。

若要 $f(x) \ge 0$恒成立，必要条件是$f’’(0) \ge 0 \implies -2a-1 \ge 0 \implies \mathbf{a \le -\frac{1}{2}}$。

第二步：充分性证明（正式步骤）

我们需要证明：当 $a = -\frac{1}{2}$ 时，$f(x) \ge 0$恒成立。（注：若$a \le -\frac{1}{2}$成立，则$a = -\frac{1}{2}$ 是最临界的状况）。

代入 $a = -\frac{1}{2}$，构造函数 $g(x) = (1 + \frac{1}{2}x)\ln(1+x) - x$。
$g’(x) = \frac{1}{2}\ln(1+x) + (1+\frac{1}{2}x)\frac{1}{1+x} - 1 = \frac{1}{2}\ln(1+x) + \frac{1+\frac{1}{2}x - (1+x)}{1+x} = \frac{1}{2}\ln(1+x) - \frac{\frac{1}{2}x}{1+x}$。
继续求导 $g’’(x) = \frac{1}{2(1+x)} - \frac{\frac{1}{2}(1+x)-\frac{1}{2}x}{(1+x)^2} = \frac{1+x-1}{2(1+x)^2} = \frac{x}{2(1+x)^2}$。
当 $x > 0$ 时，$g’’(x) > 0$，故 $g’(x)$在$[0, +\infty)$ 单调递增。
因为 $g’(0)=0$，所以 $g’(x) \ge 0$，进而 $g(x)$在$[0, +\infty)$ 单调递增。
因为 $g(0)=0$，所以 $g(x) \ge 0$ 恒成立。

第三步：排除法（完善逻辑）

当 $a > -\frac{1}{2}$时，由必要性探路可知$f’’(0) < 0$。根据导数定义的保号性，存在 $x \in (0, x_0)$使得$f’(x) < f’(0) = 0$，进而 $f(x) < f(0) = 0$，与题意不符。

结论： $a$的取值范围是$(-\infty, -\frac{1}{2}]$。

2024 广东模拟题

题目：若关于 $x$的不等式$2x^2 \ln x \ge 4ax \ln x - x^2 + a$在$\forall x \in [1, +\infty)$上恒成立，求实数$a$ 的取值范围。

解析步骤：

构造函数：移项得 $f(x) = 4ax \ln x - x^2 + a - 2x^2 \ln x \le 0$。
端点探路：代入 $x=1$，得到 $f(1) = -1 + a \le 0 \implies \mathbf{a \le 1}$。
充分性证明：
- 将原式整理为关于 $a$ 的一次函数：$f(x) = (4x \ln x + 1)a - x^2 - 2x^2 \ln x$。
- 观察到当 $x \ge 1$ 时，$4x \ln x + 1 > 0$，故 $f(x)$关于$a$ 单调递增。
- 因此，$f(x)$的最大值在$a=1$ 时取得。
- 代入 $a=1$构造$g(x) = (4x - 2x^2) \ln x + 1 - x^2$。
- 求导得 $g’(x) = (4-4x)(\ln x + 1)$。由于 $x \ge 1$，则 $4-4x \le 0$且$\ln x + 1 > 0$，故 $g’(x) \le 0$。
- 所以 $g(x)$ 单调递减，$g(x) \le g(1) = 0$ 恒成立。

结论：$a$的取值范围是$(-\infty, 1]$。

端点效应的“失效”警示与深度避坑

端点效应（必要性探路）虽然是破题利器，但并非万能钥匙。

一、什么时候端点效应会失效？

端点效应失效的核心原因在于：端点的一阶（或高阶）导数大于 0，只能保证函数在端点“附近”大于 0，无法保证在整个区间内不“掉下去”。

1. 情形一：非单调函数的“中途折返”

当函数在区间内不是单调递增，而是先增后减时，即使端点处斜率向上，函数也可能在区间中部的极小值点处跌破 $x$ 轴。

适用情况：函数在端点后存在极小值点 $x_0$。
判别标准：若极小值点 $x_0$落在定义域内，必须满足$f(x_0) \ge 0$，而不仅仅是端点 $f(x_{start}) \ge 0$。

2. 情形二：必要性不等于充分性

通过端点效应求出的参数范围只是必要条件。

案例警示：在处理 2020 年新课标一卷真题时，若通过 $h’’(0) \ge 0$算出$a \ge -1/2$。
翻车现场：当取临界值 $a = -1/2$时，带回原函数计算发现$h(1) = e - 3 < 0$。这说明 $a \ge -1/2$ 并不足以保证不等式恒成立，此时端点效应求出的范围过大，必须结合区间内的最小值进行二次验证。

二、典型失效案例解析

【案例 1】隐零点导致的失效（2020 新课标一卷）

题目：已知 $f(x) = e^x + ax^2 - x$。当 $x \ge 0$ 时，$f(x) \ge \frac{1}{2}x^3 + 1$恒成立，求$a$ 的取值范围。

【探路过程】：

构造 $h(x) = e^x + ax^2 - x - \frac{1}{2}x^3 - 1$。
$h(0) = 0, h’(0) = 0$。
由 $h’’(0) = e^0 + 2a \ge 0$得$a \ge -1/2$。

【失效分析】：

当 $a = -1/2$ 时，$h’(x) = e^x - x - 1 - \frac{3}{2}x^2$。通过二阶导分析发现，$h’(x)$在区间内会先增后减，导致$h(x)$ 在后期掉到 0 以下。
结论：本题不能仅靠端点，需利用隐零点法锁定函数真正的极小值点。

【完整解答】

1. 构造函数与初步探路

令 $h(x) = e^x + ax^2 - x - \frac{1}{2}x^3 - 1$，则 $h(0) = 0$。

$h’(x) = e^x + 2ax - 1 - \frac{3}{2}x^2$，则 $h’(0) = 0$。

$h’’(x) = e^x + 2a - 3x$。

若 $h(x) \ge 0$恒成立，则需$h’’(0) = 1 + 2a \ge 0 \implies a \ge -\frac{1}{2}$（必要条件）。

2. 检验临界值 $a = -1/2$ 的充分性

当 $a = -1/2$ 时，$h’’(x) = e^x - 3x - 1$。

再次求导：$h’’’(x) = e^x - 3$。

令 $h’’’(x) = 0 \implies x = \ln 3$。

当 $x \in (0, \ln 3)$ 时，$h’’’(x) < 0$，$h’’(x)$ 递减；
当 $x \in (\ln 3, +\infty)$ 时，$h’’’(x) > 0$，$h’’(x)$ 递增。

由于 $h’’(0) = 0$，$h’’(2) = e^2 - 7 > 0$，$h’’(1) = e - 4 < 0$。

说明 $h’’(x)$在$(0, 2)$上存在零点，导致$h’(x)$先减后增，继而$h(x)$ 可能小于 0。

计算可知 $h(1) = e - \frac{1}{2} - 1 - \frac{1}{2} - 1 = e - 3 < 0$。

故 $a = -1/2$ 不满足题意，端点效应求出的范围过大。

3. 寻找正确范围

需找到 $x_0$使得$h(x_0)=0$且$h’(x_0)=0$。

联立方程：

$$ \begin{cases} e^{x_0} + a x_0^2 - x_0 - \frac{1}{2}x_0^3 - 1 = 0 \\ e^{x_0} + 2a x_0 - 1 - \frac{3}{2}x_0^2 = 0 \end{cases} $$

消去 $a$得到关于$x_0$ 的方程：$(x_0-2)e^{x_0} + x_0 - \frac{1}{2}x_0^3 + 2 = 0$。

观察发现 $x_0 = 2$ 是该方程的一个解。

代入 $x_0 = 2$求$a$：$e^2 + 4a - 1 - 6 = 0 \implies a = \frac{7-e^2}{4}$。

结论： $a$的取值范围是$[\frac{7-e^2}{4}, +\infty)$。

【案例 2】极小值点脱离端点（模拟题）

题目：已知 $f(x) = \ln(ax+1) - \frac{2ax}{x+2} \ge 2\ln2 - \frac{3}{2}$在$x \ge 0$ 恒成立。

【解析要点】：

求导发现导函数 $g’(x)$的零点为$x_0 = 4a - 4$。
分类讨论：
- 若 $4a-4 \le 0$（即 $a \le 1$），极小值点在端点左侧，函数单调，端点效应生效。
- 若 $4a-4 > 0$（即 $a > 1$），极小值点落在 $(0, +\infty)$内部，此时必须保证极小值$g(4a-4) \ge 0$。
通过构造新函数 $h(t)$证明极小值点的偏移，最终锁定$a \le 3/2$。

【完整解答】

1. 求导分析单调性

$f’(x) = \frac{a}{ax+1} - \frac{2a(x+2)-2ax}{(x+2)^2} = \frac{a}{ax+1} - \frac{4a}{(x+2)^2} = \frac{a(x^2+4x+4-4ax-4)}{(ax+1)(x+2)^2} = \frac{ax(x+4-4a)}{(ax+1)(x+2)^2}$。

2. 分类讨论极小值点

令 $f’(x) = 0$，解得 $x_1 = 0$，$x_2 = 4a - 4$。

情形一： 若 $4a - 4 \le 0$，即 $0 < a \le 1$。

当 $x > 0$ 时，$f’(x) > 0$，$f(x)$在$[0, +\infty)$ 上单调递增。

此时 $f(x)_{\min} = f(0) = 0$。而 $2\ln 2 - \frac{3}{2} \approx 1.38 - 1.5 = -0.12 < 0$。

故 $f(x) \ge 0 > 2\ln 2 - \frac{3}{2}$ 恒成立，符合题意。
情形二： 若 $4a - 4 > 0$，即 $a > 1$。

当 $x \in (0, 4a-4)$ 时，$f’(x) < 0$；当 $x \in (4a-4, +\infty)$ 时，$f’(x) > 0$。

故 $f(x)$在$x = 4a-4$ 处取得极小值。

3. 构造新函数证明充分性

令 $x_0 = 4a-4$，则 $a = \frac{x_0+4}{4}$。代入极小值点：

$f(x_0) = \ln(a x_0 + 1) - \frac{2a x_0}{x_0+2}$。

通过代换 $t = \frac{x_0+4}{4} \cdot x_0 + 1$ 等方式简化（或直接利用题干数值）：

设 $h(t) = 2\ln t - (t - \frac{1}{t})$，通过求导证明 $h(t)$ 单调性。

最终解得 $a$的临界值为$3/2$。

结论： $a$的取值范围是$(0, \frac{3}{2}]$。

导数恒成立中的“指对放缩”核心技巧

在处理导数压轴题时，当常规求导难以判断单调性，或者参数与变量高度耦合时，利用指对常见不等式进行“放缩”往往能化繁为简。

一、指对必备放缩工具箱

在考场上，以下基础不等式及其变体是放缩的“弹药库”：

1. 指数类必会不等式

基础型：$e^x \ge x + 1$（当且仅当 $x=0$ 时取等号）
加强型：$e^x \ge 1 + x + \frac{1}{2}x^2$（$x \ge 0$）
切线型：$e^x \ge ex$（当且仅当 $x=1$ 时取等号）
二阶型：$e^x \ge ex + (x-1)^2$

2. 对数类必会不等式

基础型：$\ln x \le x - 1$（当且仅当 $x=1$ 时取等号）
割线型：$\ln x \le \frac{x}{e}$
双边型：$\frac{2(x-1)}{x+1} \le \ln x \le \frac{1}{2}(x - \frac{1}{x})$（$x \ge 1$）

二、典型例题深度解析

【例题 1】2022 广东模拟：巧妙利用切线放缩

题目：当 $x > 0$ 时，证明：$e^{x^2} - x\ln x < xe^x + \frac{1}{e}$。

【核心分析】

直接求导会发现 $x$与$x^2$指数项共存，极难处理。观察结构，左右两边都有指数项，考虑利用$e^x \ge ex$（即 $ex - \ln x$ 的变体）进行消项。

【详细解答】

等价转化：原不等式等价于证明 $ex - \ln x < e^x + \frac{1}{ex}$（通过除以 $x$ 观察）。
利用已知放缩：
- 已知 $e^x \ge ex$，当 $x=1$ 时取等。
- 则有 $ex - \ln x < e^x + \frac{1}{ex}$ 成立。
构造函数证明临界点：
- 只需证 $\ln \frac{1}{x} \le \frac{1}{e} \cdot \frac{1}{x}$，即 $\ln t \le \frac{t}{e}$（令 $t = \frac{1}{x}$）。
- 令 $h(t) = \ln t - \frac{t}{e}$，求导得 $h’(t) = \frac{1}{t} - \frac{1}{e}$。
- 当 $t=e$ 时，$h(t)$取得最大值$h(e) = \ln e - 1 = 0$。
- 故 $\ln t \le \frac{t}{e}$ 恒成立。
结论：原命题得证。

【例题 2】2024 山东期末：组合放缩与构造

题目：求证：对于 $\forall x > 0$，不等式 $e^x + x^2 - (e+1)x + \frac{e}{x} > 2$ 成立。

【核心分析】

分式 $\frac{e}{x}$是难点。由于$e^x$具有极强的增长性，我们先用$e^x \ge ex$ 消耗掉一部分一次项，减小多项式的次数。

【详细解答】

首轮放缩：利用 $e^x \ge ex$，原不等式左边 $\ge ex + x^2 - (e+1)x + \frac{e}{x} = x^2 - x + \frac{e}{x}$。
目标降维：现在只需证 $x^2 - x + \frac{e}{x} > 2$，即 $x^3 - x^2 - 2x + e > 0$（由于 $x>0$）。
导数寻根：
- 令 $h(x) = x^3 - x^2 - 2x + e$，求导得 $h’(x) = 3x^2 - 2x - 2$。
- 令 $h’(x) = 0$，解得正根 $x_0 = \frac{1 + \sqrt{7}}{3} \approx 1.22$。
- 在 $(0, x_0)$上$h(x)$递减，在$(x_0, +\infty)$上$h(x)$ 递增。
精度估算：
- 计算极小值 $h(x_0)$。经估算或代入临界值（如 $x=1.2$），发现 $h(x_0) > 0$。
- 例如 $h(1) = 1 - 1 - 2 + e = e - 2 \approx 0.718 > 0$。
结论：由于最小值大于 0，原不等式成立。

【例题 3】综合放缩练习

题目：证明 $e^x + \frac{1}{x} \ge 2 - \ln x + x^2 + (e-2)x$。

【详细解答】

此题跨越了指数、对数和多项式。

左侧放缩：$e^x \ge x+1$。
右侧转化：利用 $\ln x \le x-1 \implies -\ln x \ge 1-x$。
合并验证：通过逐项对消，观察余项 $x^2 + \dots$ 的开口方向。

这种题目通常在 $x=1$处取等，验证$x=1$ 时左右两边是否相等（$e+1 = 2-0+1+e-2 = e+1$）是破题的关键信号。

第一步：观察结构与找寻“取等点”

在处理指对混合放缩时，第一步通常是寻找使等号成立的 $x$ 值。

代入 $x=1$：
- 左边 $= e^1 + \frac{1}{1} = e + 1$- 右边$= 2 - \ln 1 + 1^2 + (e-2) \cdot 1 = 2 - 0 + 1 + e - 2 = e + 1$- 结论：左右两边在$x=1$处相等。这意味着我们的放缩或构造函数，应当以$x=1$ 为核心切点。

第二步：等价转化与函数构造

为了方便计算，我们将所有项移至等号左边，构造函数 $f(x)$：

$$ f(x) = e^x + \frac{1}{x} + \ln x - x^2 - (e-2)x - 2 $$

只需证明 $f(x) \ge f(1) = 0$ 恒成立。

第三步：分类放缩与求导分析

1. 基础放缩试探

我们已知两个核心不等式：

$e^x \ge ex$（当 $x=1$ 时取等）
$\ln x \le x - 1 \implies -\ln x \ge 1 - x$（由于题目是 $+\ln x$，此方向不直接适用，需采用求导）

2. 求导精确分析

求 $f(x)$ 的导函数：

$$ f'(x) = e^x - \frac{1}{x^2} + \frac{1}{x} - 2x - (e-2) $$

继续求二阶导以判断单调性：

$$ f''(x) = e^x + \frac{2}{x^3} - \frac{1}{x^2} - 2 $$

分析 $f’’(x)$：

当 $x \ge 1$时：$e^x \ge e \approx 2.718$，且 $\frac{2}{x^3} - \frac{1}{x^2} = \frac{2-x}{x^3}$。

在 $x \in [1, 2]$ 时，$\frac{2-x}{x^3} \ge 0$，故 $f’’(x) > 0$。

当 $x > 2$ 时，$e^x$增长极快，足以抵消负项，显见$f’’(x) > 0$。
当 $0 < x < 1$ 时：

利用分式项 $\frac{2}{x^3}$的爆炸性增长，当$x \to 0^+$ 时，$f’’(x) \to +\infty$。

结论：$f’(x)$在$(0, +\infty)$ 上单调递增。

第四步：结论汇总

因为 $f’(x)$单调递增，且$f’(1) = e^1 - 1 + 1 - 2 - (e-2) = 0$。
所以：
- 当 $x \in (0, 1)$ 时，$f’(x) < 0$，$f(x)$ 单调递减。
- 当 $x \in (1, +\infty)$ 时，$f’(x) > 0$，$f(x)$ 单调递增。
因此，$f(x)$在$x=1$ 处取得极小值，亦为最小值。
$f(x)_{\min} = f(1) = 0$。

最终结论：原不等式 $e^x + \frac{1}{x} \ge 2 - \ln x + x^2 + (e-2)x$ 得证。

数列放缩

1. 裂项相消放缩

裂项是数列放缩的灵魂。它的精髓在于构造 $b_n = \phi(n) - \phi(n+1)$，这样求和时中间项全部抵消，只剩首尾。

(1) 幂函数型（分式放缩）

这是最基础的，目标是把分母的次数降低。

$n^2$型：$\frac{1}{n^2} < \frac{1}{n(n-1)} = \frac{1}{n-1} - \frac{1}{n}$注：这会导致第一项$n=1$没意义，通常保留第一项，从$n=2$ 开始放。
$n^2$型：$\frac{1}{n^2} < \frac{1}{n^2 - 1/4} = \frac{1}{(n-1/2)(n+1/2)} = \left( \frac{1}{n-1/2} - \frac{1}{n+1/2} \right)$

这种放缩保留了对称性，求和结果更紧凑。
$n^k$ 型 ($k \ge 3$)：

$\frac{1}{n^3} < \frac{1}{n^3 - n} = \frac{1}{(n-1)n(n+1)} = \frac{1}{2} \left[ \frac{1}{(n-1)n} - \frac{1}{n(n+1)} \right]$

通过增加因式来构造裂项，这是处理高次项的标准化动作。

(2) 无理式型（根式放缩）

核心是利用共轭根式。

常用结论：

$\frac{1}{2\sqrt{n+1}} < \sqrt{n+1} - \sqrt{n} = \frac{1}{\sqrt{n+1} + \sqrt{n}} < \frac{1}{2\sqrt{n}}$这个公式在证明$\sum \frac{1}{\sqrt{n}}$ 的范围时非常霸道。

2. 等比数列放缩

当通项公式里含有阶乘 $n!$、指数 $a^n$ 或者增长极快的项时，裂项往往失效，此时要考虑向等比数列靠拢。

(1) 阶乘放缩

阶乘是增长最快的结构之一，我们通常用 $2^{n-1}$ 来压制它：

当 $n \ge 2$ 时，$\frac{1}{n!} = \frac{1}{1 \cdot 2 \cdot 3 \dots n} \le \frac{1}{2 \cdot 2 \dots 2} = \frac{1}{2^{n-1}}$。
利用等比数列求和公式 $\sum \frac{1}{2^{n-1}}$，上限立刻锁定在 $2$ 左右。

(2) 指数复合型

例如 $a_n = \frac{n}{3^n}$。虽然可以用错位相减法求和，但如果只是证不等式：

观察 $\frac{a_{n+1}}{a_n} = \frac{n+1}{3n} = \frac{1}{3} + \frac{1}{3n}$。
当 $n$足够大时，这个比值趋近于$1/3$。我们可以放缩成公比为 $1/2$（稍微放大一点点）的等比数列，从而轻松求和。

3. 积分放缩(选看)

求和是矩形面积之和，积分是曲线下的面积。

基本原理： 若 $f(x)$单调递减，则$\int_n^{n+1} f(x) dx < f(n) < \int_{n-1}^n f(x) dx$。
应用案例： 证明 $\sum_{i=1}^n \frac{1}{i}$（调和级数）的范围。

$\ln(n+1) = \int_1^{n+1} \frac{1}{x} dx < \sum_{i=1}^n \frac{1}{i} < 1 + \int_1^n \frac{1}{x} dx = 1 + \ln n$。

这个技巧在处理和对数相关的放缩题时，很好用！

4. 关键策略：保留前几项

这是放缩法成败的生死线！ 很多学生放缩后发现范围太大，是因为第一、二项通常是“巨无霸”，直接放缩损耗太严重。

SOP 操作流程：
1. 观察结论： 结论要求 $S_n < 1.6$，但直接裂项发现 $S_n < 2$。
2. 手术切除： 算出 $a_1 = 1$。
3. 局部放缩： $S_n = a_1 + (a_2 + a_3 + \dots + a_n)$。
4. 重新评估： 对括号里的项进行裂项放缩。因为 $a_2, a_3$ 变小了，放缩带来的误差也会成倍缩小。

2021·厦门二模（改编版）

已知数列 ${a_n}$满足$a_1=2, a_{n+1}=\frac{2a_n-1}{a_n}$。

(1) 证明：数列 ${\frac{1}{a_n-1}}$ 是等差数列；

(2) 令 $b_n=\frac{1}{a_1 a_2 \dots a_n}$，证明：$b_1^2+b_2^2+\dots+b_n^2 < 1$。

(3) 加强挑战： 证明 $b_1^2+b_2^2+\dots+b_n^2 < \frac{3}{4}$。

分析

递推式的本质： $a_{n+1} = 2 - \frac{1}{a_n}$。这是一个典型的不动点为 $1$的分式线性变换。既然不动点是$1$，那么研究 $a_n - 1$ 的倒数结构就是最直接的路径。
通项的连锁： 观察 $a_n = \frac{n+1}{n}$，这是一个“前项分子等于后项分母”的结构。这种结构在相乘（积项）时会产生消去律，直接导致 $b_n$ 退化为简单的幂函数分式。
放缩的精度：
- 弱放缩： $\frac{1}{n^2} < \frac{1}{n(n-1)}$，损失较大，通常用于证明小于 $1$或$2$。
- 强放缩： 保留首项 $b_1^2$，对后续项进行裂项，可以极大地收窄上界。

✍️ 标准解答流程

(1) 等差数列证明

设 $c_n = \frac{1}{a_n-1}$。

由 $a_{n+1} = \frac{2a_n-1}{a_n}$，得 $a_{n+1}-1 = \frac{2a_n-1-a_n}{a_n} = \frac{a_n-1}{a_n}$。

则 $c_{n+1} = \frac{1}{a_{n+1}-1} = \frac{a_n}{a_n-1} = \frac{(a_n-1)+1}{a_n-1} = 1 + c_n$。

又 $c_1 = \frac{1}{2-1} = 1$。

所以 ${c_n}$是首项为$1$，公差为 $1$ 的等差数列。（置信度：高）

(2) 原题结论证明

由 (1) 知 $c_n = 1 + (n-1) \cdot 1 = n$，则 $\frac{1}{a_n-1} = n \implies a_n = \frac{n+1}{n}$。

从而 $a_1 a_2 \dots a_n = \frac{2}{1} \cdot \frac{3}{2} \dots \frac{n+1}{n} = n+1$。

故 $b_n = \frac{1}{n+1}$。

令 $S_n = \sum_{i=1}^n b_i^2 = \frac{1}{2^2} + \frac{1}{3^2} + \dots + \frac{1}{(n+1)^2}$。

利用裂项放缩：$\frac{1}{(i+1)^2} < \frac{1}{i(i+1)} = \frac{1}{i} - \frac{1}{i+1}$。

$S_n < (\frac{1}{1} - \frac{1}{2}) + (\frac{1}{2} - \frac{1}{3}) + \dots + (\frac{1}{n} - \frac{1}{n+1}) = 1 - \frac{1}{n+1} < 1$。

证毕。

🔥 加强版

“保留项放缩” 的魔力。

(3) 证明 $S_n < \frac{3}{4}$

我们观察到 $\frac{1}{2^2} = 0.25$，如果把第一项拎出来不放缩：

$S_n = \frac{1}{4} + \left( \frac{1}{3^2} + \frac{1}{4^2} + \dots + \frac{1}{(n+1)^2} \right)$对括号内从$i=2$开始放缩：$\frac{1}{(i+1)^2} < \frac{1}{i(i+1)} = \frac{1}{i} - \frac{1}{i+1}$

$S_n < \frac{1}{4} + \left( \frac{1}{2} - \frac{1}{3} + \frac{1}{3} - \frac{1}{4} + \dots + \frac{1}{n} - \frac{1}{n+1} \right)$

$S_n < \frac{1}{4} + \frac{1}{2} - \frac{1}{n+1} = \frac{3}{4} - \frac{1}{n+1} < 0.75$。

只需多留一个项，界限就从 $1.0$缩减到了$0.75$。如果你愿意保留前 $100$项，你可以把这个值逼近到$\frac{\pi^2}{6} - 1 \approx 0.645$

题目

已知 $a_n = \frac{1}{2^n - \frac{1}{2^n}} = \frac{2^n}{4^n - 1}$。

我们的目标是证明 $S_n = \sum_{i=1}^n \frac{1}{2^i - \frac{1}{2^i}} < \frac{4}{3}$。

核心矛盾： 分母减去了一个正数，导致 $a_n$比$\frac{1}{2^n}$ 稍微大了一点点。我们需要量化这个“一点点”。

## ✍️ 解答流程

Step 1: 寻找放缩不等式

我们需要把 $a_n$ 放缩成一个标准的等比数列。

观察分母：当 $n \ge 1$时，我们尝试寻找一个常数$k$，使得 $\frac{1}{2^n - \frac{1}{2^n}} \le \frac{k}{2^n}$。

通过计算前几项：

$a_1 = \frac{1}{2 - 1/2} = \frac{2}{3}$。此时 $\frac{2/3}{1/2} = \frac{4}{3}$。
$a_2 = \frac{1}{4 - 1/4} = \frac{4}{15}$。此时 $\frac{4/15}{1/4} = \frac{16}{15} < \frac{4}{3}$。

构造猜想： $a_n \le \frac{4}{3} \cdot \frac{1}{2^n}$。

严谨证明：

要证 $\frac{1}{2^n - 2^{-n}} \le \frac{4}{3 \cdot 2^n}$，只需证 $3 \cdot 2^n \le 4(2^n - 2^{-n})$。

即 $3 \cdot 2^n \le 4 \cdot 2^n - 4 \cdot 2^{-n} \implies 4 \cdot 2^{-n} \le 2^n \implies 4 \le 4^n$。

显然，当 $n \ge 1$ 时，该式恒成立！

Step 2: 等比数列求和

有了这个“代理人”，剩下的就是初中水平的求和了：

$$ S_n = \sum_{i=1}^n a_i \le \frac{4}{3} \sum_{i=1}^n \left(\frac{1}{2}\right)^i $$

$$ S_n \le \frac{4}{3} \cdot \frac{\frac{1}{2}(1 - (1/2)^n)}{1 - 1/2} = \frac{4}{3} (1 - \frac{1}{2^n}) $$

显然，$\frac{4}{3} (1 - \frac{1}{2^n}) < \frac{4}{3}$。

证毕。

2019 浙江

证 $\sum_{i=1}^n \sqrt{\frac{i-1}{i(i+1)}} < 2\sqrt{n}$。

分子放大： 观察到 $\sqrt{\frac{n-1}{n(n+1)}} < \sqrt{\frac{n}{n(n+1)}} = \frac{1}{\sqrt{n+1}}$。
构造裂项： 利用根式核心不等式：$\frac{1}{\sqrt{n+1}} < \frac{2}{\sqrt{n+1} + \sqrt{n}} = 2(\sqrt{n+1} - \sqrt{n})$。
累加求和：

$C_n = c_1 + c_2 + \dots + c_n$ $C_n < 0 + 2(\sqrt{2}-\sqrt{1}) + 2(\sqrt{3}-\sqrt{2}) + \dots + 2(\sqrt{n+1}-\sqrt{n})$ $C_n < 2(\sqrt{n+1} - 1)$
收尾：

因为 $\sqrt{n+1} < \sqrt{n} + 1$，所以 $2\sqrt{n+1}-2 < 2(\sqrt{n}+1)-2 = 2\sqrt{n}$。

证毕

估阶

1. 什么是数列的“阶”？

简单来说，“阶”就是数列增长或衰减的“快慢等级”。

当我们讨论 $\sum a_n$的放缩时，本质是在问：这个和$S_n$ 最终会跑向无穷大，还是被锁死在一个常数里？

核心分水岭：$1/n$ 判别准则

级数发散（跑向无穷）： $\sum \frac{1}{n^p}$，当 $p \le 1$ 时。
- 比如 $\sum \frac{1}{n}$（调和级数）的阶是 $\ln n$。
- 比如 $\sum \frac{1}{\sqrt{n}}$的阶是$\sqrt{n}$。
级数收敛（锁定常数）： $\sum \frac{1}{n^p}$，当 $p > 1$ 时。
- 比如 $\sum \frac{1}{n^2}$的阶是常数（精确值为$\pi^2/6 \approx 1.645$）。

三大常用“阶”的放缩逻辑

我们可以把数列按“阶”排个序：

(1) 根式阶：$a_n \sim \frac{1}{\sqrt{n}}$—— 目标是$\sqrt{n}$

特征： 分母只有半次方，增长非常缓慢。
放缩目标： $2\sqrt{n}$ 左右。
必杀技： 根式裂项。

利用 $2(\sqrt{n+1}-\sqrt{n}) < \frac{1}{\sqrt{n}} < 2(\sqrt{n}-\sqrt{n-1})$。

(2) 对数阶：$a_n \sim \frac{1}{n}$—— 目标是$\ln n$

特征： 处于收敛与发散的临界点（调和级数）。
放缩目标： 通常带有 $\ln n$或者要求证一个随$n$ 缓慢增长的界限。
必杀技： 积分放缩。

利用 $\ln(n+1) < \sum_{i=1}^n \frac{1}{i} < 1 + \ln n$。

注：高考很少直接考 $\ln n$，通常会把它包装在导数不等式里。

(3) 平方阶：$a_n \sim \frac{1}{n^2}$—— 目标是常数$C$

特征： 衰减极快，求和一定能被一个常数压住。
放缩目标： $1, 2, \frac{3}{4}, \frac{\pi^2}{6}$ 等确定的数值。
必杀技： 分式裂项。

利用 $\frac{1}{n^2} < \frac{1}{n(n-1)} = \frac{1}{n-1} - \frac{1}{n}$。

3. 进阶：指数阶与阶乘阶（降维打击）

当数列里出现 $2^n$或$n!$ 时，放缩就变成了“降维打击”。

等比阶（指数阶）： $a_n \sim q^n$- 只要$|q| < 1$，直接用等比数列求和。
- 技能：比值判别思维。只要 $\frac{a_{n+1}}{a_n} \le q < 1$，它就一定收敛。
阶乘阶： $a_n \sim \frac{1}{n!}$
- 衰减速度毁天灭地。
- 技能：强行降阶为等比。$\frac{1}{n!} \le \frac{1}{2^{n-1}}$。

4. 阶的“叠加”与“主项意识”

看 “谁才是老大”。

比如 $a_n = \frac{n + \sin n}{n^3 + \ln n}$。

在无穷远处，$n$相比$n^3$ 简直微不足道。
所以这个数列的阶由最高次幂决定：$a_n \sim \frac{n}{n^3} = \frac{1}{n^2}$。
结论： 这个数列的求和一定收敛于一个常数，放缩时直接盯着 $1/n^2$ 的裂项法做就行了！

总结

通项特征	对应“阶”	求和目标类型	核心放缩工具
分母是 $\sqrt{n}$	根式阶	$\sqrt{n}$ 相关式	根式裂项
分母是 $n$	对数阶	$\ln n$ 相关式	积分/切线放缩
分母是 $n^2$	平方阶	确定常数	分式裂项
分母包含 $2^n$	指数阶	确定常数	等比数列求和

阅读全文

3.29 数列

2026/3/31

阅读全文

Oedipus the King

西方文化选读 2026/3/31

是命运的嘲弄，还是自由意志导向的必然悲剧？

阅读全文

张雪峰之死

日记类 2026/3/24

摘自3月日记，也许该单发出来，这大约有别于十分寻常的日记。

日记类

阅读全文

笔记2.环论初探

线代 2026/3/19

意外在习题课被灌注了环论，那就稍微整整（

数学

阅读全文

1 ... 7 8 9 ... 12

Logic

冀幸橐龠生光

LOADING

Logic の 博客

一小块凝固的时间

笔记4.矩阵空间与向量空间的同构

矩阵的展开 (Matrix Vectorization)

Kronecker 积 (Kronecker Product)

定义

关键性质

运算示例

基础计算

向量间的积

4. 混合乘积公式 (Mixed-Product Property)

Kronecker 积的核心性质

代数特征（秩、行列式、特征值）

特殊实例：Hadamard 矩阵的构造

矩阵列展开的核心定理

定理：$\text{cs}(AXB) = (B^T \otimes A) \text{cs}(X)$

证明逻辑拆解：

线性变换的矩阵表示

线性矩阵方程的向量化求解

张量积空间 (Tensor Product Space)

线性变换的张量积

题目：矩阵方程解空间的性质证明

1. 证明 $W$ 是子空间

2. 证明 $\dim W = mn - rs$

(1) 方程转化

(2) 确定系数矩阵的秩

(3) 利用维数公式

题目：矩阵变换 $\mathcal{S}$ 的特征值与对角化证明

1. 证明 $\mathcal{S}$ 是线性变换

2. 求变换 $\mathcal{S}$ 的所有特征值

3. 对角化证明与特征向量

笔记3.线性空间

线性空间的结构

线性空间的定义与公理体系

核心运算与封闭性

八条公理 (The 8 Axioms)

1. 加法性质（交换群）

2. 数乘性质

与环的对比

基、维数与同构

向量组的秩与极大无关组

基底与维数

引理与推论

基底的判定定理

坐标同构 $V \cong K^n$一旦在线性空间$V$中取定了一组基$\alpha_1, \alpha_2, \dots, \alpha_n$，那么 $V$中的每一个元素$\alpha$ 都可以唯一地表示为：

子空间的运算

线性子空间的定义

子空间的性质与构造

子空间的运算：交与和

1. 子空间的交 (Intersection)

2. 子空间的和 (Sum)

维数公式

一、 定理内容

二、 证明概要

线性无关、直和与唯一性表示

一、 线性无关 $\iff$ 表出唯一

二、 子空间的直和 (Direct Sum)

1. 表示方式的定义

2. 直和的判定：零向量的唯一性

三、 等价命题定理

广义特征子空间的直和与多项式分解

一、 广义特征子空间的直和性

核空间分解定理的详细证明

一、 定理

二、 证明步骤拆解

1. 证明和是“直和”

2. 证明核空间的包含关系

零化多项式与空间分解

一、 零化多项式 (Annihilating Polynomial)

二、 零化多项式驱动的空间全分解

三、 可对角化的充分必要条件

四、 案例应用：对合变换的分解

补空间与外直和

一、 补空间 (Complementary Subspace)

二、 外直和 (External Direct Sum)

三、 外直和与内直和的统一

线性空间的同构

线性映射与同构的定义

2. 同构的关键判定与定理

Logic の博客

一、定理内容

二、证明概要

一、线性无关 $\iff$ 表出唯一

二、子空间的直和 (Direct Sum)

三、等价命题定理

一、广义特征子空间的直和性

一、定理

二、证明步骤拆解

一、零化多项式 (Annihilating Polynomial)

二、零化多项式驱动的空间全分解

三、可对角化的充分必要条件

四、案例应用：对合变换的分解

一、补空间 (Complementary Subspace)

二、外直和 (External Direct Sum)

三、外直和与内直和的统一

一、核心方法体系（Methodology）

一、什么是“端点效应”？

二、核心逻辑图解

一、什么时候端点效应会失效？

二、典型失效案例解析

一、指对必备放缩工具箱

二、典型例题深度解析