LOADING

加载过慢请开启缓存 浏览器默认开启

笔记5.线性变换 I

首先,线性变换实际上是一种特殊的线性映射,定义域和陪域是同一个集合,所以我们关于线性映射的讨论仍然可以延续。

线性映射的核心定义

如果把一个空间 $U$映射到另一个空间$V$,要称之为“线性映射”,它必须恪守两个底线:

  • 可加性:先相加再映射,等同于映射后再相加,即 $\mathscr{A}(\alpha + \beta) = \mathscr{A}\alpha + \mathscr{A}\beta$。

  • 齐次性:缩放后的映射,等同于映射后再缩放,即 $\mathscr{A}(k\alpha) = k\mathscr{A}\alpha$。

    当这两个空间重合(即 $U = V$)时,我们通常称之为线性变换

基的像确定整个映射

对于从 $K^n$到$K^m$ 的映射,其操作的本质就是矩阵乘法

  • 标准基的作用:通过观察标准基向量(那些只有一位是 1,其余为 0 的向量)被映射后的去向,我们可以把这些结果纵向排列,构造出矩阵 $A$

  • 运算等价性:对向量 $x$进行线性映射,在计算层面等同于执行$Ax$。

设 $\mathscr{A}: \mathbf{K}^n \to \mathbf{K}^m$ 是线性映射

$$ \begin{bmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix}} , \quad \begin{bmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix}} , \dots, \quad \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix}} $$

$$ \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} \mapsto \begin{array}{|cccc|} \hline \color{green}{a_{11}} & \color{green}{a_{12}} & \dots & \color{green}{a_{1n}} \\ \color{green}{a_{21}} & \color{green}{a_{22}} & \dots & \color{green}{a_{2n}} \\ \vdots & \vdots & & \vdots \\ \color{green}{a_{m1}} & \color{green}{a_{m2}} & \dots & \color{green}{a_{mn}} \\ \hline \end{array} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} $$

**$\mathscr{A}$ 在标准基下的矩阵也就是表出系数。

这是线性代数中极具力量的一个结论:只要确定了基底的去向,整个映射就彻底定死了。

  • 定理内涵:如果你给定空间 $U$的一组基${\alpha_1, \dots, \alpha_n}$,并随意指定它们在 $V$中对应的目标${\beta_1, \dots, \beta_n}$,那么世界上存在且仅存在一个线性映射 $\mathscr{A}$ 满足这个对应关系。

  • 构造逻辑

    1. 由于任何向量 $\alpha$都能唯一地写成基底的线性组合$\alpha = \sum k_i \alpha_i$。

    2. 我们利用线性的“可加性”和“齐次性”,强制定义映射结果为 $\mathscr{A}\alpha = \sum k_i \beta_i$。

    3. 这种定义方式保证了映射的良定义性(即一个输入对应唯一确定的输出)。

证明一下吧:

验证 $\mathscr{A}$ 是线性映射

为了证明我们构造的映射 $\mathscr{A}$(即通过基底像的组合定义的映射)是合法的线性映射,需要验证其满足可加性与齐次性。

已知条件:

设 $\alpha = k_1 \alpha_1 + \dots + k_n \alpha_n \in U$若$\alpha’ = l_1 \alpha_1 + \dots + l_n \alpha_n \in U$,则:

验证过程:

  • 可加性:

$$ \begin{aligned} \mathscr{A} (\alpha + \alpha') &= (k_1 + l_1) \beta_1 + \dots + (k_n + l_n) \beta_n \\ &= (k_1 \beta_1 + \dots + k_n \beta_n) + (l_1 \beta_1 + \dots + l_n \beta_n) \\ &= \mathscr{A} \alpha + \mathscr{A} \alpha' \end{aligned} $$

  • 齐次性:

$$ \mathscr{A} (l \alpha) = l k_1 \beta_1 + \dots + l k_n \beta_n = l \mathscr{A} \alpha $$


$\mathscr{A}$ 的唯一性

这部分证明了:一旦基底的像 ${\beta_i}$ 被确定,世界上不存在第二个不同的线性映射能达成同样的对应关系。

证明过程:

若有线性映射 $\mathscr{B}: U \to V$,也满足:

$$ \mathscr{B} \alpha_i = \beta_i, \quad \forall i $$

则对于空间中任意向量的映射结果:

$$ \begin{aligned} \mathscr{B} (k_1 \alpha_1 + \dots + k_n \alpha_n) &= k_1 \mathscr{B} \alpha_1 + \dots + k_n \mathscr{B} \alpha_n \\ &= k_1 \beta_1 + \dots + k_n \beta_n \\ &= \mathscr{A} (k_1 \alpha_1 + \dots + k_n \alpha_n), \quad \forall k_i \end{aligned} $$

于是:

$$ \mathscr{B} = \mathscr{A} $$

线性映射的运算

线性运算:加法与数乘

若 $\mathscr{A}, \mathscr{B}$是从$U$到$V$ 的线性映射,则可以定义:

  • 加法:$(\mathscr{A} + \mathscr{B}): \alpha \mapsto \mathscr{A}\alpha + \mathscr{B}\alpha$

  • 数乘:$k\mathscr{A}: \alpha \mapsto k(\mathscr{A}\alpha) \quad (k \in K)$

这两个运算的结果仍然是线性映射。

核心结论:从 $U$到$V$ 的全体线性映射在上述运算下构成一个线性空间,记作 $\text{Hom}(U, V)$

陪域上能作的运算映射也可以作


复合运算:映射的乘法

设 $\mathscr{B} \in \text{Hom}(U, V)$,$\mathscr{A} \in \text{Hom}(V, W)$。

  • 定义:$\mathscr{B}$与$\mathscr{A}$的复合映射$\alpha \mapsto \mathscr{A}(\mathscr{B}\alpha)$是从$U$到$W$ 的线性映射。

  • 记法:称为 $\mathscr{A}$与$\mathscr{B}$ 的乘积,记作 $\mathscr{A}\mathscr{B}$

  • 前提条件:$\mathscr{B}$的陪域与$\mathscr{A}$ 的定义域相同。

  • 结合律:$(\mathscr{A}\mathscr{B})\mathscr{C} = \mathscr{A}(\mathscr{B}\mathscr{C})$。


线性变换的代数结构

当映射发生在同一个空间上,即 $\mathscr{A}, \mathscr{B} \in \text{Hom}(V)$ 时,结构变得更加丰富:

  • $\text{Hom}(V)$(或记作 $\text{End}(V)$)上的线性变换不但能相加、数乘,还能作乘法运算。

  • 该乘法满足结合律、对加法的分配律,且存在单位元 $\mathscr{I}$(恒等变换)。

核心结论:$\text{Hom}(V)$ 构成一个 $K$-代数


算子运算实例:微分与乘法

幻灯片展示了一个极具启发性的例子,定义在 $C^1(\mathbb{R})$ 上的变换:

  • 微分算子 $D$:$f(x) \mapsto f’(x)$- 乘法算子$S$:$f(x) \mapsto xf(x)$根据导数的乘法法则$(xf(x))’ = xf’(x) + f(x)$,可以推导出算子之间的关系:

$$ (DS - SD)f = (xf)' - xf' = f'x + f - xf' = f $$

即:$DS - SD = \mathscr{I}$

这实际上是量子力学中正则对易关系在函数空间的数学原型。


几何变换实例:投影变换

沿 $W$向$U$的投影变换$\mathscr{P}_U$

  • 背景:空间 $V$可以分解为直和$V = U \oplus W$。

  • 定义:对于任何向量 $\alpha = \beta + \gamma$(其中 $\beta \in U, \gamma \in W$),投影算子将其映射为 $U$ 中的分量:

$$ \mathscr{P}_U: \alpha \mapsto \beta $$

  • 几何直观:所有平行于 $W$的向量被“压扁”到了平面$U$ 上。

投影变换的代数定义

当空间 $V$可以分解为直和$V = U \oplus W$时,任何向量$\alpha$都能唯一分解为$\alpha = \beta + \gamma$(其中 $\beta \in U, \gamma \in W$)。

  • 投影算子 $P_U$:定义为 $\alpha \mapsto \beta$。

  • 基本性质

    • 幂等性:$P_U^2 = P_U$(投射一次后再投射,结果不再改变)。

    • 正交互补性:$P_U P_W = 0$且$P_U + P_W = I$。

2. 核心定理:投影与幂等的等价性

这是线性代数中的一个优美结论:一个线性变换 $P$ 是投影变换,当且仅当它是幂等变换($P^2 = P$)。

  • 空间分解:若 $P^2 = P$,则整个空间 $V$ 必然可以分解为:

$$ V = \text{Im } P \oplus \text{Ker } P $$

  • 物理意义

    • $P$是沿$\text{Ker } P$向$\text{Im } P$ 的投影。

    • $I - P$则是反过来的“镜像”操作,即沿$\text{Im } P$向$\text{Ker } P$ 的投影。

3. 证明逻辑要点

通过代数推导验证这种直和关系:

  • 不动点特性:在 $\text{Im } P$中的向量$\beta$,在 $P$ 的作用下“点点不动”($P\beta = \beta$)。

  • 零交集:通过 $P\beta = \beta$和$\beta \in \text{Ker } P \implies P\beta = 0$联立,证明了$\text{Im } P \cap \text{Ker } P = {0}$,从而满足直和的条件。

  • 全空间覆盖:利用恒等式 $\alpha = P\alpha + (I - P)\alpha$,说明任何向量都能拆分成这两个子空间的成员。

4. 推广:空间的多项分解

这一部分将二元投影推广到了多个子空间的情形。

  • 定理(正向):如果 $V$是多个子空间的直和$V = V_1 \oplus \dots \oplus V_s$,那么必然存在一组投影算子 $P_1, \dots, P_s$,它们满足:

    1. 两两正交:$P_i P_j = 0 \quad (i \neq j)$

    2. 完备性:$\sum P_i = I$

    3. 像空间对应:$\text{Im } P_i = V_i$- 定理(逆向):反之,若一组算子满足上述三个条件,它们就定义了空间$V$ 的一个直和分解。

5.多项式与投影

此前,我们已经讨论过如下定理:

设 $f_1(x), \dots, f_s(x) \in K[x]$两两互素。记$f(x) = \prod_{i=1}^s f_i(x)$。对于 $A \in M_n(K)$,有:

$$ \text{Ker } f(A) = \text{Ker } f_1(A) \oplus \text{Ker } f_2(A) \oplus \dots \oplus \text{Ker } f_s(A) $$

这实际上给出了一组投影。

线性映射空间与矩阵空间的同构

结论:$\text{Hom}(U, V) \cong M_{m,n}(K)$

当我们分别为线性空间 $U$和$V$取定基底${\alpha_1, \dots, \alpha_n}$和${\beta_1, \dots, \beta_m}$时,每一个线性映射$\mathscr{A}$都唯一对应一个矩阵$A$。

  • 映射关系:$(\mathscr{A}\alpha_1, \mathscr{A}\alpha_2, \dots, \mathscr{A}\alpha_n) = (\beta_1, \beta_2, \dots, \beta_m)A$- 本质:这种对应不仅是双射,还保持了加法和数乘运算,意味着$\text{Hom}(U, V)$作为一个线性空间的结构,被矩阵空间$M_{m,n}(K)$ 完美“克隆”了。

基础矩阵与基本映射

正如矩阵空间有一组标准基 $E_{ij}$(仅在 $(i, j)$ 位置为 1,其余为 0),映射空间也有对应的基本映射

  • 定义:$E_{ij}: U \to V$,其作用规律为:

$$ E_{ij}(\alpha_k) = \begin{cases} \beta_i & k=j \\ 0 & k \neq j \end{cases} $$

  • 意义:这组基本映射构成了 $\text{Hom}(U, V)$ 的基底。这告诉我们,任何复杂的线性映射都可以拆解为这些“只把特定的输入基映射到特定的输出基”的简单动作的线性组合。

映射复合与矩阵乘法的等价性

这是线性代数中最关键的定理之一:映射的复合对应矩阵的乘法。

  • 定理描述

    设 $\mathscr{B}: U \to V$的矩阵是$B$,$\mathscr{A}: V \to W$的矩阵是$A$。

    那么复合映射 $\mathscr{AB}: U \to W$的矩阵恰好就是$AB$。

  • 逻辑演示

    通过观察基底像的传递过程:

$$ \begin{aligned} (\mathscr{AB}\alpha_1, \dots, \mathscr{AB}\alpha_n) &= \mathscr{A}((\beta_1, \dots, \beta_m)B) \\ &= ((\mathscr{A}\beta_1, \dots, \mathscr{A}\beta_m))B \\ &= ((\gamma_1, \dots, \gamma_s)A)B \\ &= (\gamma_1, \dots, \gamma_s)(AB) \end{aligned} $$


结合律的传递

  • 映射层面:映射的复合天然满足结合律,即 $(\mathscr{AB})\mathscr{C} = \mathscr{A}(\mathscr{BC})$。

  • 矩阵层面:基于上述等价性,矩阵乘法也必须满足结合律。

复合映射的像空间与维度公式

  • 核心定理

$$ \dim \text{Im } \mathscr{B} = \dim \text{Im } \mathscr{AB} + \dim(\text{Im } \mathscr{B} \cap \text{Ker } \mathscr{A}) $$

  • 证明逻辑

    1. 考察 $\mathscr{A}$在$\text{Im } \mathscr{B}$上的限制映射$\mathscr{A}’ : \text{Im } \mathscr{B} \to W$。

    2. 根据线性映射基本定理(第一同构定理):$\text{Im } \mathscr{B} / \text{Ker } \mathscr{A}’ \cong \text{Im } \mathscr{A}’$。

    3. 验证可知:$\text{Im } \mathscr{A}’ = \text{Im } \mathscr{AB}$,且 $\text{Ker } \mathscr{A}’ = \text{Im } \mathscr{B} \cap \text{Ker } \mathscr{A}$。

  • 推论(Sylvester 秩不等式)

    利用上述维数公式,可以推导出:

$$ \dim \text{Im } \mathscr{A} + \dim \text{Im } \mathscr{B} \leq \dim \text{Im } \mathscr{AB} + \dim V $$

对于矩阵形式,即:$\text{rank}(A) + \text{rank}(B) \leq \text{rank}(AB) + n$

_等号成立条件:$\text{Ker } \mathscr{A} \subseteq \text{Im } \mathscr{B}$,即 $A$的解空间包含于$B$ 的列空间。_

这在之前,我们曾用打洞法构造大矩阵证明过。


基变换与矩阵表示的演变

这是线性代数从“静态矩阵”向“动态变换”跨越的关键。

核心问题

当 $U$的基底从${\alpha_i}$变为${\alpha’_i}$(过渡矩阵为 $P$),$V$的基底从${\beta_j}$变为${\beta’_j}$(过渡矩阵为 $Q$)时,映射 $\mathscr{A}$ 的矩阵如何变化?

变换定理

若 $\mathscr{A}$在原基底下的矩阵为$A$,则在新基底下的矩阵为:

$$ \mathbf{B} = Q^{-1} A P $$

证明推导

  1. 关系式 1:$\mathscr{A}(\alpha_1 \dots \alpha_n) = (\beta_1 \dots \beta_m)A$

  2. 基变换:$(\alpha’_1 \dots \alpha’_n) = (\alpha_1 \dots \alpha_n)P$;$(\beta’_1 \dots \beta’_m) = (\beta_1 \dots \beta_m)Q \implies (\beta_1 \dots \beta_m) = (\beta’_1 \dots \beta’_m)Q^{-1}$

  3. 代入计算

$$ \begin{aligned} \mathscr{A}(\alpha'_1 \dots \alpha'_n) &= \mathscr{A}(\alpha_1 \dots \alpha_n)P \\ &= (\beta_1 \dots \beta_m)AP \\ &= (\beta'_1 \dots \beta'_m)Q^{-1}AP \end{aligned} $$

在线性变换的语境下,就自然出现了所谓相似,$A=PQP^{-1}$ 。相似描述的实际上也就是同一个线性变换在不同基的表现。

在最美妙的选取下,就会出现所谓标准型,分块地写成单位阵和0。