笔记5.线性变换 I

2026/4/18 线代数学

首先，线性变换实际上是一种特殊的线性映射，定义域和陪域是同一个集合，所以我们关于线性映射的讨论仍然可以延续。

线性映射的核心定义

如果把一个空间 $U$映射到另一个空间$V$，要称之为“线性映射”，它必须恪守两个底线：

可加性：先相加再映射，等同于映射后再相加，即 $\mathscr{A}(\alpha + \beta) = \mathscr{A}\alpha + \mathscr{A}\beta$。
齐次性：缩放后的映射，等同于映射后再缩放，即 $\mathscr{A}(k\alpha) = k\mathscr{A}\alpha$。

当这两个空间重合（即 $U = V$）时，我们通常称之为线性变换。

基的像确定整个映射

对于从 $K^n$到$K^m$ 的映射，其操作的本质就是矩阵乘法。

标准基的作用：通过观察标准基向量（那些只有一位是 1，其余为 0 的向量）被映射后的去向，我们可以把这些结果纵向排列，构造出矩阵 $A$。
运算等价性：对向量 $x$进行线性映射，在计算层面等同于执行$Ax$。

设 $\mathscr{A}: \mathbf{K}^n \to \mathbf{K}^m$ 是线性映射

$$ \begin{bmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix}} , \quad \begin{bmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix}} , \dots, \quad \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix}} $$

$$ \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} \mapsto \begin{array}{|cccc|} \hline \color{green}{a_{11}} & \color{green}{a_{12}} & \dots & \color{green}{a_{1n}} \\ \color{green}{a_{21}} & \color{green}{a_{22}} & \dots & \color{green}{a_{2n}} \\ \vdots & \vdots & & \vdots \\ \color{green}{a_{m1}} & \color{green}{a_{m2}} & \dots & \color{green}{a_{mn}} \\ \hline \end{array} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} $$

**$\mathscr{A}$ 在标准基下的矩阵也就是表出系数。

这是线性代数中极具力量的一个结论：只要确定了基底的去向，整个映射就彻底定死了。

定理内涵：如果你给定空间 $U$的一组基${\alpha_1, \dots, \alpha_n}$，并随意指定它们在 $V$中对应的目标${\beta_1, \dots, \beta_n}$，那么世界上存在且仅存在一个线性映射 $\mathscr{A}$ 满足这个对应关系。
构造逻辑：
1. 由于任何向量 $\alpha$都能唯一地写成基底的线性组合$\alpha = \sum k_i \alpha_i$。
2. 我们利用线性的“可加性”和“齐次性”，强制定义映射结果为 $\mathscr{A}\alpha = \sum k_i \beta_i$。
3. 这种定义方式保证了映射的良定义性（即一个输入对应唯一确定的输出）。

证明一下吧：

验证 $\mathscr{A}$ 是线性映射

为了证明我们构造的映射 $\mathscr{A}$（即通过基底像的组合定义的映射）是合法的线性映射，需要验证其满足可加性与齐次性。

已知条件：

设 $\alpha = k_1 \alpha_1 + \dots + k_n \alpha_n \in U$若$\alpha’ = l_1 \alpha_1 + \dots + l_n \alpha_n \in U$，则：

验证过程：

可加性：

$$ \begin{aligned} \mathscr{A} (\alpha + \alpha') &= (k_1 + l_1) \beta_1 + \dots + (k_n + l_n) \beta_n \\ &= (k_1 \beta_1 + \dots + k_n \beta_n) + (l_1 \beta_1 + \dots + l_n \beta_n) \\ &= \mathscr{A} \alpha + \mathscr{A} \alpha' \end{aligned} $$

齐次性：

$$ \mathscr{A} (l \alpha) = l k_1 \beta_1 + \dots + l k_n \beta_n = l \mathscr{A} \alpha $$

$\mathscr{A}$ 的唯一性

这部分证明了：一旦基底的像 ${\beta_i}$ 被确定，世界上不存在第二个不同的线性映射能达成同样的对应关系。

证明过程：

若有线性映射 $\mathscr{B}: U \to V$，也满足：

$$ \mathscr{B} \alpha_i = \beta_i, \quad \forall i $$

则对于空间中任意向量的映射结果：

$$ \begin{aligned} \mathscr{B} (k_1 \alpha_1 + \dots + k_n \alpha_n) &= k_1 \mathscr{B} \alpha_1 + \dots + k_n \mathscr{B} \alpha_n \\ &= k_1 \beta_1 + \dots + k_n \beta_n \\ &= \mathscr{A} (k_1 \alpha_1 + \dots + k_n \alpha_n), \quad \forall k_i \end{aligned} $$

于是：

$$ \mathscr{B} = \mathscr{A} $$

线性映射的运算

线性运算：加法与数乘

若 $\mathscr{A}, \mathscr{B}$是从$U$到$V$ 的线性映射，则可以定义：

加法：$(\mathscr{A} + \mathscr{B}): \alpha \mapsto \mathscr{A}\alpha + \mathscr{B}\alpha$
数乘：$k\mathscr{A}: \alpha \mapsto k(\mathscr{A}\alpha) \quad (k \in K)$

这两个运算的结果仍然是线性映射。

核心结论：从 $U$到$V$ 的全体线性映射在上述运算下构成一个线性空间，记作 $\text{Hom}(U, V)$。

陪域上能作的运算映射也可以作

复合运算：映射的乘法

设 $\mathscr{B} \in \text{Hom}(U, V)$，$\mathscr{A} \in \text{Hom}(V, W)$。

定义：$\mathscr{B}$与$\mathscr{A}$的复合映射$\alpha \mapsto \mathscr{A}(\mathscr{B}\alpha)$是从$U$到$W$ 的线性映射。
记法：称为 $\mathscr{A}$与$\mathscr{B}$ 的乘积，记作 $\mathscr{A}\mathscr{B}$。
前提条件：$\mathscr{B}$的陪域与$\mathscr{A}$ 的定义域相同。
结合律：$(\mathscr{A}\mathscr{B})\mathscr{C} = \mathscr{A}(\mathscr{B}\mathscr{C})$。

线性变换的代数结构

当映射发生在同一个空间上，即 $\mathscr{A}, \mathscr{B} \in \text{Hom}(V)$ 时，结构变得更加丰富：

$\text{Hom}(V)$（或记作 $\text{End}(V)$）上的线性变换不但能相加、数乘，还能作乘法运算。
该乘法满足结合律、对加法的分配律，且存在单位元 $\mathscr{I}$（恒等变换）。

核心结论：$\text{Hom}(V)$ 构成一个 $K$-代数。

算子运算实例：微分与乘法

幻灯片展示了一个极具启发性的例子，定义在 $C^1(\mathbb{R})$ 上的变换：

微分算子 $D$：$f(x) \mapsto f’(x)$- 乘法算子$S$：$f(x) \mapsto xf(x)$根据导数的乘法法则$(xf(x))’ = xf’(x) + f(x)$，可以推导出算子之间的关系：

$$ (DS - SD)f = (xf)' - xf' = f'x + f - xf' = f $$

即：$DS - SD = \mathscr{I}$

这实际上是量子力学中正则对易关系在函数空间的数学原型。

几何变换实例：投影变换

沿 $W$向$U$的投影变换$\mathscr{P}_U$：

背景：空间 $V$可以分解为直和$V = U \oplus W$。
定义：对于任何向量 $\alpha = \beta + \gamma$（其中 $\beta \in U, \gamma \in W$），投影算子将其映射为 $U$ 中的分量：

$$ \mathscr{P}_U: \alpha \mapsto \beta $$

几何直观：所有平行于 $W$的向量被“压扁”到了平面$U$ 上。

投影变换的代数定义

当空间 $V$可以分解为直和$V = U \oplus W$时，任何向量$\alpha$都能唯一分解为$\alpha = \beta + \gamma$（其中 $\beta \in U, \gamma \in W$）。

投影算子 $P_U$：定义为 $\alpha \mapsto \beta$。
基本性质：
- 幂等性：$P_U^2 = P_U$（投射一次后再投射，结果不再改变）。
- 正交互补性：$P_U P_W = 0$且$P_U + P_W = I$。

2. 核心定理：投影与幂等的等价性

这是线性代数中的一个优美结论：一个线性变换 $P$ 是投影变换，当且仅当它是幂等变换（$P^2 = P$）。

空间分解：若 $P^2 = P$，则整个空间 $V$ 必然可以分解为：

$$ V = \text{Im } P \oplus \text{Ker } P $$

物理意义：
- $P$是沿$\text{Ker } P$向$\text{Im } P$ 的投影。
- $I - P$则是反过来的“镜像”操作，即沿$\text{Im } P$向$\text{Ker } P$ 的投影。

3. 证明逻辑要点

通过代数推导验证这种直和关系：

不动点特性：在 $\text{Im } P$中的向量$\beta$，在 $P$ 的作用下“点点不动”（$P\beta = \beta$）。
零交集：通过 $P\beta = \beta$和$\beta \in \text{Ker } P \implies P\beta = 0$联立，证明了$\text{Im } P \cap \text{Ker } P = {0}$，从而满足直和的条件。
全空间覆盖：利用恒等式 $\alpha = P\alpha + (I - P)\alpha$，说明任何向量都能拆分成这两个子空间的成员。

4. 推广：空间的多项分解

这一部分将二元投影推广到了多个子空间的情形。

定理（正向）：如果 $V$是多个子空间的直和$V = V_1 \oplus \dots \oplus V_s$，那么必然存在一组投影算子 $P_1, \dots, P_s$，它们满足：
1. 两两正交：$P_i P_j = 0 \quad (i \neq j)$
2. 完备性：$\sum P_i = I$
3. 像空间对应：$\text{Im } P_i = V_i$- 定理（逆向）：反之，若一组算子满足上述三个条件，它们就定义了空间$V$ 的一个直和分解。

5.多项式与投影

此前，我们已经讨论过如下定理：

设 $f_1(x), \dots, f_s(x) \in K[x]$两两互素。记$f(x) = \prod_{i=1}^s f_i(x)$。对于 $A \in M_n(K)$，有：

$$ \text{Ker } f(A) = \text{Ker } f_1(A) \oplus \text{Ker } f_2(A) \oplus \dots \oplus \text{Ker } f_s(A) $$

这实际上给出了一组投影。

线性映射空间与矩阵空间的同构

结论：$\text{Hom}(U, V) \cong M_{m,n}(K)$

当我们分别为线性空间 $U$和$V$取定基底${\alpha_1, \dots, \alpha_n}$和${\beta_1, \dots, \beta_m}$时，每一个线性映射$\mathscr{A}$都唯一对应一个矩阵$A$。

映射关系：$(\mathscr{A}\alpha_1, \mathscr{A}\alpha_2, \dots, \mathscr{A}\alpha_n) = (\beta_1, \beta_2, \dots, \beta_m)A$- 本质：这种对应不仅是双射，还保持了加法和数乘运算，意味着$\text{Hom}(U, V)$作为一个线性空间的结构，被矩阵空间$M_{m,n}(K)$ 完美“克隆”了。

基础矩阵与基本映射

正如矩阵空间有一组标准基 $E_{ij}$（仅在 $(i, j)$ 位置为 1，其余为 0），映射空间也有对应的基本映射。

定义：$E_{ij}: U \to V$，其作用规律为：

$$ E_{ij}(\alpha_k) = \begin{cases} \beta_i & k=j \\ 0 & k \neq j \end{cases} $$

意义：这组基本映射构成了 $\text{Hom}(U, V)$ 的基底。这告诉我们，任何复杂的线性映射都可以拆解为这些“只把特定的输入基映射到特定的输出基”的简单动作的线性组合。

映射复合与矩阵乘法的等价性

这是线性代数中最关键的定理之一：映射的复合对应矩阵的乘法。

定理描述：

设 $\mathscr{B}: U \to V$的矩阵是$B$，$\mathscr{A}: V \to W$的矩阵是$A$。

那么复合映射 $\mathscr{AB}: U \to W$的矩阵恰好就是$AB$。
逻辑演示：

通过观察基底像的传递过程：

$$ \begin{aligned} (\mathscr{AB}\alpha_1, \dots, \mathscr{AB}\alpha_n) &= \mathscr{A}((\beta_1, \dots, \beta_m)B) \\ &= ((\mathscr{A}\beta_1, \dots, \mathscr{A}\beta_m))B \\ &= ((\gamma_1, \dots, \gamma_s)A)B \\ &= (\gamma_1, \dots, \gamma_s)(AB) \end{aligned} $$

结合律的传递

映射层面：映射的复合天然满足结合律，即 $(\mathscr{AB})\mathscr{C} = \mathscr{A}(\mathscr{BC})$。
矩阵层面：基于上述等价性，矩阵乘法也必须满足结合律。

复合映射的像空间与维度公式

核心定理：

$$ \dim \text{Im } \mathscr{B} = \dim \text{Im } \mathscr{AB} + \dim(\text{Im } \mathscr{B} \cap \text{Ker } \mathscr{A}) $$

证明逻辑：
1. 考察 $\mathscr{A}$在$\text{Im } \mathscr{B}$上的限制映射$\mathscr{A}’ : \text{Im } \mathscr{B} \to W$。
2. 根据线性映射基本定理（第一同构定理）：$\text{Im } \mathscr{B} / \text{Ker } \mathscr{A}’ \cong \text{Im } \mathscr{A}’$。
3. 验证可知：$\text{Im } \mathscr{A}’ = \text{Im } \mathscr{AB}$，且 $\text{Ker } \mathscr{A}’ = \text{Im } \mathscr{B} \cap \text{Ker } \mathscr{A}$。
推论（Sylvester 秩不等式）：

利用上述维数公式，可以推导出：

$$ \dim \text{Im } \mathscr{A} + \dim \text{Im } \mathscr{B} \leq \dim \text{Im } \mathscr{AB} + \dim V $$

对于矩阵形式，即：$\text{rank}(A) + \text{rank}(B) \leq \text{rank}(AB) + n$。

_等号成立条件：$\text{Ker } \mathscr{A} \subseteq \text{Im } \mathscr{B}$，即 $A$的解空间包含于$B$ 的列空间。_

这在之前，我们曾用打洞法构造大矩阵证明过。

基变换与矩阵表示的演变

这是线性代数从“静态矩阵”向“动态变换”跨越的关键。

核心问题

当 $U$的基底从${\alpha_i}$变为${\alpha’_i}$（过渡矩阵为 $P$），$V$的基底从${\beta_j}$变为${\beta’_j}$（过渡矩阵为 $Q$）时，映射 $\mathscr{A}$ 的矩阵如何变化？

变换定理

若 $\mathscr{A}$在原基底下的矩阵为$A$，则在新基底下的矩阵为：

$$ \mathbf{B} = Q^{-1} A P $$

证明推导

关系式 1：$\mathscr{A}(\alpha_1 \dots \alpha_n) = (\beta_1 \dots \beta_m)A$
基变换：$(\alpha’_1 \dots \alpha’_n) = (\alpha_1 \dots \alpha_n)P$；$(\beta’_1 \dots \beta’_m) = (\beta_1 \dots \beta_m)Q \implies (\beta_1 \dots \beta_m) = (\beta’_1 \dots \beta’_m)Q^{-1}$
代入计算：

$$ \begin{aligned} \mathscr{A}(\alpha'_1 \dots \alpha'_n) &= \mathscr{A}(\alpha_1 \dots \alpha_n)P \\ &= (\beta_1 \dots \beta_m)AP \\ &= (\beta'_1 \dots \beta'_m)Q^{-1}AP \end{aligned} $$

在线性变换的语境下，就自然出现了所谓相似，$A=PQP^{-1}$ 。相似描述的实际上也就是同一个线性变换在不同基的表现。

在最美妙的选取下，就会出现所谓标准型，分块地写成单位阵和0。

LOADING