高中学习向量时,便常听老师说要有基底思想,要学会用一组基表示所有向量。
到了学习线代,基底仍然是非常好的化抽象为具象的手段。一个抽象的线性映射往往让人无从下手,设出基底,我们才能看到一个个的可感的对象。
通常的处理方法是取一组基,扩充到全空间,然后分析。对于多个空间的情形,我们往往设出最小的空间,然后逐个扩大,这样通常是易于叙述的。
准备:基扩充定理
设 $V$ 是一个有限维向量空间,$n = \dim(V)$。
若向量组 ${\alpha_1, \alpha_2, \dots, \alpha_m}$是$V$ 中的一个线性无关组,则:
必有 $m \le n$;
若 $m < n$,则必存在 $n-m$个向量$\alpha_{m+1}, \dots, \alpha_n \in V$,使得向量组 ${\alpha_1, \dots, \alpha_m, \alpha_{m+1}, \dots, \alpha_n}$构成$V$ 的一个基。
证明:
设初始线性无关组为 $S_m = {\alpha_1, \dots, \alpha_m}$。
如果 $S_m$已经能张成$V$(即 $\text{span}(S_m) = V$),那么根据定义,$S_m$就是$V$ 的一个基,此时扩充过程结束。
如果 $S_m$不能张成$V$,则必然存在一个向量 $\beta \in V$,使得 $\beta \notin \text{span}(S_m)$。
从而我们可以把 $\beta$加入$S_m$构成一个新的线性无关的向量组,下面只需证明这个过程可以通过有限步张成全空间,也就是只要证明一个$n$维空间至多有$n$ 个无关向量。
使用反证法,设 $V$有$n+1$ 个无关向量,考虑
$$ \sum_{i=1}^{n} \lambda_i \alpha_i + \lambda_{n+1} \beta=0 $$
那么方程数多于未知数, $\lambda$有一组非零解,若$\lambda_{n+1}=0$,则与 $S_m$线性无关矛盾,故$\lambda_{n+1} \neq 0$,从而移项可知 $\beta$可以被$S_m$ 表出,矛盾。
从而知道一个 $n$维空间至多有$n$ 个线性无关的向量,故过程只需要有限步。
从而原命题成立。
扩充示例1:秩-零化度定理
考虑一个线性映射 $\mathcal{A} : V \to W$,我们总有:
$$ dim(Im(\mathcal{A}))+dim(Ker(\mathcal{A}))=dim(V) $$
证明:
我们取 $Ker(\mathcal{A})$的一组基${\alpha_1, \alpha_2 … \alpha_k}$,将其扩充为 $V$的一组基${\alpha_1, \alpha_2 … \alpha_k, \alpha_{k+1}, \alpha_{n}}$,接下来用$\mathcal{A}$ 作用这组基,得到:
$$ \mathcal{A}({\alpha_1, \alpha_2 ... \alpha_k, \alpha_{k+1}, \alpha_{n}})=(0,0...0, \mathcal{A}\alpha_{k+1}, \mathcal{A}\alpha_{n}) $$
我们要证明原定理,也只要证明后面的 $n-k$个向量能构成$\mathcal{A}$ 的像空间的基。
首先,$\forall \beta \in V$,由于${\alpha_1, \alpha_2 … \alpha_k, \alpha_{k+1}, \alpha_{n}}$是$V$ 的基,我们有:
$$ \beta=\sum_{i=1}^n \lambda_i\alpha_i $$
用 $\mathcal{A}$ 作用在两侧,得到:
$$ \mathcal{A}\beta=\sum_{i=k+1}^n \lambda_i\mathcal{A}\alpha_i $$
也就是,对于 $\forall \mathcal{A}\beta \in V$其都可以被$\mathcal{A}\alpha_{k+1},…, \mathcal{A}\alpha_{n}$表出,只需证$\mathcal{A}\alpha_{k+1},…, \mathcal{A}\alpha_{n}$线性无关即可说明他们构成 $Im\mathcal{A}$ 的基,我们考虑:
$$ \sum_{i=k+1}^n \lambda_i\mathcal{A}\alpha_i=0 $$
利用线性,可以提出 $\mathcal{A}
$$ $\sum_{i=k+1}^n \lambda_i\mathcal{A}\alpha_i=\mathcal{A}\sum_{i=k+1}^n \lambda_i\alpha_i=0 $$
这说明
$$ \sum_{i=k+1}^n \lambda_i\alpha_i \in Ker(A) $$
也就是说,这可以被 $Ker(A)$ 的基表出:
$$ \sum_{i=k+1}^n \lambda_i\alpha_i=\sum_{i=1}^k \lambda_i\alpha_i $$
移项得到:
$$ \sum_{i=k+1}^n \lambda_i\alpha_i-\sum_{i=1}^k \lambda_i\alpha_i=0 $$
利用 $V$中基的线性无关性知,上式成立当且仅当$\forall i, \lambda_i=0$,这正是 $\mathcal{A}\alpha_{k+1},…, \mathcal{A}\alpha_{n}$ 线性无关的等价条件。从而我们就完成了证明。
扩充示例2:矩阵乘积秩的维数定理证明
定理表述
设矩阵 $A$的列数等于矩阵$B$的行数。记$B$的列空间为$V$,$A$的解空间(零空间)为$W$。则有:
$$ \text{rank}(B) = \text{rank}(AB) + \dim(V \cap W) $$
证明过程
1. 构造基向量
将 $V \cap W$的一组基$\alpha_1, \cdots, \alpha_r$扩充成$B$的列空间$V$ 的一组基:
$$ \alpha_1, \cdots, \alpha_r, \beta_1, \cdots, \beta_s $$
显然,此时有:
- $\dim(V \cap W) = r$$\text{rank}(B) = \dim(V) = r + s$ 我们目标是证明$\text{rank}(AB) = s$### 2. 确定$AB$ 列空间的生成组
由于 $B$的列组与$\alpha_1, \cdots, \alpha_r, \beta_1, \cdots, \beta_s$ 等价,根据矩阵乘法性质,$AB$的列组与$A\alpha_1, \cdots, A\alpha_r, A\beta_1, \cdots, A\beta_s$ 等价。
又因为 $\alpha_i \in W$($A$的解空间),故有$A\alpha_1 = \cdots = A\alpha_r = \mathbf{0}$。
因此,$AB$ 的列空间可由剩余向量生成:
$$ \text{Range}(AB) = \text{span}\{ A\beta_1, \cdots, A\beta_s \} $$
3. 证明 $A\beta_1, \cdots, A\beta_s$ 线性无关
设有线性组合:
$$ k_1 A\beta_1 + \cdots + k_s A\beta_s = \mathbf{0} $$
根据线性映射性质,可得:
$$ A(k_1 \beta_1 + \cdots + k_s \beta_s) = \mathbf{0} $$
这说明向量 $\sum_{i=1}^s k_i \beta_i$既在$A$的解空间$W$中,又在$B$的列空间$V$ 中。
因此,它属于交集 $V \cap W$,可由其基向量 $\alpha_1, \cdots, \alpha_r$ 线性表示:
$$ k_1 \beta_1 + \cdots + k_s \beta_s = l_1 \alpha_1 + \cdots + l_r \alpha_r $$
移项得:
$$ k_1 \beta_1 + \cdots + k_s \beta_s - l_1 \alpha_1 - \cdots - l_r \alpha_r = \mathbf{0} $$
注意到 $\alpha_1, \cdots, \alpha_r, \beta_1, \cdots, \beta_s$是$V$ 的基(线性无关),故其系数必全为 0:
$$ k_1 = \cdots = k_s = 0 $$
由此得 $A\beta_1, \cdots, A\beta_s$ 线性无关。
4. 结论
既然 $A\beta_1, \cdots, A\beta_s$线性无关且生成$AB$的列空间,则它们构成$AB$ 列空间的基。故:
$$ \text{rank}(AB) = s $$
代入之前的等式:
$$ \text{rank}(B) = r + s = \dim(V \cap W) + \text{rank}(AB) $$
移项得:
$$ \text{rank}(AB) = \text{rank}(B) - \dim(V \cap W) \quad $$
扩充示例3:和空间的维度公式
$$ dim(V)+dim(W)=dim(V\cap W)+dim(V+ W) $$
其中 $V + W = {v + w \mid v \in V, w \in W}$是包含$V$和$W$ 的最小向量空间。
证明步骤
设定交集的基:
设 $\dim(V \cap W) = k$,取其基为 ${u_1, \dots, u_k}$。扩张基空间:
- 扩张为 $V$ 的基:${u_1, \dots, u_k, v_1, \dots, v_m}$,则 $\dim(V) = k + m$。
- 扩张为 $W$ 的基:${u_1, \dots, u_k, w_1, \dots, w_n}$,则 $\dim(W) = k + n$。
确定和空间的基:
证明集合 $B = {u_1, \dots, u_k, v_1, \dots, v_m, w_1, \dots, w_n}$是$V+W$ 的基。
生成性:显然 $V+W$中的任意元素都能被$B$ 线性表示。
线性无关性:设
$$ \sum a_i u_i + \sum b_j v_j + \sum c_l w_l = 0 $$
变形得:$\sum c_l w_l = -(\sum a_i u_i + \sum b_j v_j)$。
等式左边属于 $W$,右边属于 $V$,因此该向量属于 $V \cap W$。
这意味着左边的 $\sum c_l w_l$必须能被$\{u_1, \dots, u_k\}$线性表示。由于$\{u_i, w_l\}$是$W$的基,是线性无关的,所以所有的$c_l$必须为$0$。以此类推,所有系数均为 $0$。
- 代数等式验证:
$$ \begin{aligned} \dim(V) + \dim(W) &= (k + m) + (k + n) \\ &= k + (k + m + n) \\ &= \dim(V \cap W) + \dim(V + W) \end{aligned} $$
扩充示例4:特征值代数重数$\ge$几何重数
我们设 $\lambda$是矩阵$A$的一个特征值,代数重数即$\det(A-\lambda I)=0$中$\lambda$的重根数,几何重数即满足$(A-\lambda I)\alpha=0$的$\alpha$个数。我们总有代数重数$\ge$ 几何重数。
证明:
取出 $\lambda$对应的特征子空间的一组基,$\alpha_1,…,\alpha_k$,$k$ 即几何重数,把基扩充到全空间,得到$\alpha_1,…,\alpha_n$。我们用 $A$ 作用:
$$ A(\alpha_1,...,\alpha_n)=(\alpha_1,...,\alpha_n)\begin{pmatrix} \lambda I_k & B \\ O & C \end{pmatrix} $$
从而 $A$相似于$\begin{pmatrix} \lambda I_k & B \ O & C \end{pmatrix}$,从而他们特征多项式相同,考虑其特征多项式:
$$ det\begin{pmatrix} (\lambda-x) I_k & B \\ O & C \end{pmatrix} $$
展开即知至少有 $\lambda$的$k$次方项,结合未知的$C$即知,有代数重数$\ge$ 几何重数。
换基与过渡矩阵
1. 过渡矩阵的定义
设 $\alpha_1, \alpha_2, \dots, \alpha_n$与$\beta_1, \beta_2, \dots, \beta_n$是线性空间$V$ 的两组基。
若基 $\beta$可以由基$\alpha$ 线性表示:
$$ \begin{cases} \beta_1 = b_{11}\alpha_1 + b_{12}\alpha_2 + \dots + b_{1n}\alpha_n \\ \beta_2 = b_{21}\alpha_1 + b_{22}\alpha_2 + \dots + b_{2n}\alpha_n \\ \quad \dots \quad \dots \\ \beta_n = b_{n1}\alpha_1 + b_{n2}\alpha_2 + \dots + b_{nn}\alpha_n \end{cases} $$
则从基 ${\alpha_i}$到基${\beta_i}$的过渡矩阵$B$ 定义为:
$$ (\beta_1 \dots \beta_n) = (\alpha_1 \dots \alpha_n) \underbrace{\begin{bmatrix} b_{11} & b_{21} & \dots & b_{n1} \\ b_{12} & b_{22} & \dots & b_{n2} \\ \vdots & \vdots & B & \vdots \\ b_{1n} & b_{2n} & \dots & b_{nn} \end{bmatrix}}_{B} $$
[!cite] 注意
过渡矩阵 $B$的第$j$列是新基$\beta_j$在旧基$\alpha$ 下的坐标。
双向转换关系
如果从 $\alpha$到$\beta$的过渡矩阵是$B$,从 $\beta$到$\alpha$的过渡矩阵是$A$,则:
- $(\alpha_1 \dots \alpha_n) = (\beta_1 \dots \beta_n) A$* 结合$(\beta_1 \dots \beta_n) = (\alpha_1 \dots \alpha_n) B$
- 可得:$(\alpha_1 \dots \alpha_n) = (\alpha_1 \dots \alpha_n) BA \implies BA = I_n$
- 因此:**$A = B^{-1}$
2. 坐标变换公式
定理: 若向量 $\alpha$在基$\alpha_1, \dots, \alpha_n$下的坐标为$X$,从旧基到新基 $\beta_1, \dots, \beta_n$的过渡矩阵为$B$,则 $\alpha$在新基下的坐标为$B^{-1}X$。
推导过程:
$$ \begin{aligned} \alpha &= [\alpha_1 \dots \alpha_n] X \\ &= ([\beta_1 \dots \beta_n] B^{-1}) X \\ &= [\beta_1 \dots \beta_n] (B^{-1}X) \end{aligned} $$
3. 基的判定定理
定理: 设 $\alpha_1, \dots, \alpha_n$是线性空间$V$ 的一组基,$B$是$n$ 阶方阵。
令:
$$ (\beta_1 \dots \beta_n) = (\alpha_1 \dots \alpha_n) B $$
则:
[!important] 结论
$\beta_1, \dots, \beta_n$是$V$的基$\iff$ $B$ 可逆
充分性:右乘 $B^{-1}$即知,必要性:从而向量组$\beta_i$表出基$\alpha_i$,利用1中双向转换关系即知。
线性映射、矩阵与基
研究一个线性映射,只要看基的像
考虑线性映射 $\mathcal{A} : V \to M$,我们要考虑一个任意的 $\beta \in V$的映射结果,可以先用基底表示:
$$ \beta = \sum \lambda_i\alpha_i $$
然后在两边用 $\mathcal{A}$ 作用,得到:
$$ \mathcal{A}\beta=\sum\lambda_i(\mathcal{A}\alpha_i) $$
从而我们只要知道基的像,也就可以确定任意 $\beta \in V$ 的像。
线性映射可以用矩阵表示
在线性空间 $V$中,同一个线性映射$\mathcal{A}$,在不同的基下会对应不同的矩阵。
设 $\alpha_1, \dots, \alpha_n$是$V$的一组基。线性映射$\mathcal{A}$ 对基向量的作用可以表示为:
$$ \mathcal{A}(\alpha_j) = \sum_{i=1}^n a_{ij}\alpha_i $$
写成矩阵形式:
$$ \mathcal{A}(\alpha_1, \dots, \alpha_n) = (\alpha_1, \dots, \alpha_n) A $$
这里的 $A$就是映射$\mathcal{A}$在基${\alpha_i}$ 下的矩阵。
矩阵 $A$的第$j$列,就是第$j$个基向量的像$\mathcal{A}(\alpha_j)$ 在原基底下的坐标。
线性映射之间的“逻辑运算”可以完美转化为矩阵之间的“代数运算”。这使得复杂的几何研究可以变成简单的算术:
设 $\mathcal{A}, \mathcal{B}$是$V$上的线性变换,在基$\alpha$下的矩阵分别为$A, B$,则:
线性组合: $k\mathcal{A} + m\mathcal{B}$对应的矩阵是$kA + mB$。
复合映射: $\mathcal{A} \circ \mathcal{B}$(先做 $\mathcal{B}$再做$\mathcal{A}$)对应的矩阵是 $AB$。
- 注意: 矩阵乘法的顺序与映射复合的顺序一致,这正是矩阵乘法定义得如此“奇怪”的根本原因。
逆映射: 若 $\mathcal{A}$可逆,其逆映射$\mathcal{A}^{-1}$对应的矩阵是$A^{-1}$。
相似矩阵的由来:换基公式
定理:设线性映射 $\mathcal{A}$在基${\alpha_i}$下的矩阵为$A$,在基 ${\beta_i}$下的矩阵为$A’$。如果从 ${\alpha_i}$到${\beta_i}$的过渡矩阵是$B$,那么:
$$ A' = B^{-1}AB $$
想象你要计算 $\mathcal{A}$对一个向量的作用,但你手里只有新基下的坐标$X’$:
$B X’$:先将新坐标还原回旧基坐标(因为 $A$ 只认旧基)。
$A (B X’)$:在旧基下执行线性映射的操作。
$B^{-1} (A B X’)$:将操作后的结果重新转换回新基下的坐标。
这就是为什么矩阵相似 的定义是 $A’ = P^{-1}AP$。所谓相似矩阵,其实就是同一个线性映射在不同基下的不同“化身”。
既然同一映射在不同基下矩阵不同,我们自然会问:能否找到一组基,使得矩阵 $A’$ 尽可能简单?
对角化: 如果能找到一组基,使得 $A’$ 是对角矩阵,那么这组基就是特征向量基。
若尔当形(Jordan Form): 如果不能对角化,这组基就是广义特征向量基。
同时,在连续函数方面,我们同样可以选取漂亮的基。
傅里叶多项式、勒让德多项式与切比雪夫多项式
我们定义对于函数的内积:
$$ (f(x),g(x))=\int_{-1}^1 f(x)g(x)dx $$
那么我们同样可以进行类似向量的操作,只不过现在是无穷维向量(定义域内有无穷多值),于是我们一个自然的想法是能不能用 $1,x,x^2…x^n..$来作为一组基,但实际上这个基对应于$Hilbert$ 矩阵,并不是一个好矩阵。如同对向量那样,如果我们选取正交基,是非常美妙的,对应的系数只要做内积就可以得到。
傅里叶多项式
对于周期函数,我们便可以选取 $sinx, cosx, sin2x, cos2x…$ 作为基,可以验证这是一组正交基,那么便可以做投影:
$$ f(x)=c_{1}sinx+c_{2}cosx+c_{3}sin2x+c_4cos2x+... $$
我们要求解系数,只需要两边做内积,例如:
$$ c_1=\frac{\int_{-1}^1f(x)\cdot sinxdx}{\int_{-1}^1sinx \cdot sinxdx} $$
这样就求出了对应的系数,还是很方便的。
勒让德多项式
如果我们想要正交基,我们通常从已有的基底做施密特正交化,我们在函数这里同样这么干:
1. 准备工作
定义区间:通常选取 $[-1, 1]$(在这个区间上得到的称为标准勒让德多项式)。
定义内积:$\langle f, g \rangle = \int_{-1}^{1} f(x)g(x) dx$。
原始基向量:$v_0 = 1, v_1 = x, v_2 = x^2, \dots$
2. 施密特正交化步骤
第一步:确定第一个基 $P_0$直接取$P_0(x) = v_0 = 1$。
第二步:构造 $P_1$我们需要从$v_1 = x$中减去它在$P_0$ 方向上的投影:
$$ P_1(x) = x - \frac{\langle x, P_0 \rangle}{\langle P_0, P_0 \rangle} P_0 $$
计算内积:$\langle x, 1 \rangle = \int_{-1}^{1} x dx = 0$(奇函数在对称区间积分为 0)。
结论:$P_1(x) = x$。
第三步:构造 $P_2$我们需要从$v_2 = x^2$中减去它在$P_0$和$P_1$ 方向上的投影:
$$ P_2(x) = x^2 - \frac{\langle x^2, P_0 \rangle}{\langle P_0, P_0 \rangle} P_0 - \frac{\langle x^2, P_1 \rangle}{\langle P_1, P_1 \rangle} P_1 $$
$\langle x^2, P_0 \rangle = \int_{-1}^{1} x^2 \cdot 1 dx = \left[ \frac{1}{3}x^3 \right]{-1}^{1} = \frac{2}{3}$2.$\langle P_0, P_0 \rangle = \int{-1}^{1} 1 \cdot 1 dx = 2$3.$\langle x^2, P_1 \rangle = \int_{-1}^{1} x^2 \cdot x dx = 0$(奇函数积分为 0)
代入公式:$P_2(x) = x^2 - \frac{2/3}{2}(1) - 0 = \mathbf{x^2 - \frac{1}{3}}$
3. 归一化与标准形式
数学家为了方便(让 $P_n(1) = 1$),通常会对结果进行缩放。
- 对于 $P_2(x) = x^2 - \frac{1}{3}$,乘以 $\frac{3}{2}$ 得到:$\mathbf{P_2(x) = \frac{1}{2}(3x^2 - 1)}$。
以此类推,你会得到:
- $P_0(x) = 1$-$P_1(x) = x$-$P_2(x) = \frac{1}{2}(3x^2 - 1)$-$P_3(x) = \frac{1}{2}(5x^3 - 3x)$
这就得到了勒让德多项式,这时做投影就仍然只需要做内积就行,方便得多。
切比雪夫多项式
$$ T_n(\cos \theta) = \cos(n\theta) $$
简单来说,就是 $n$ 倍角公式对应的多项式,由于三角函数的正交性,这同样是正交基:
$$ \int_{0}^{\pi} \cos(m\theta) \cos(n\theta) d\theta = 0 \quad (m \neq n) $$
同时,切比雪夫在数值分析中优于勒让德,因为我们可以利用 $FFT$ 大幅优化计算速度。