线性空间的度量:双线性函数与多重线性函数的代数具象化
在理解了线性泛函(对偶空间)如何通过“选择器”去提取向量的单维特征后,我们很自然地会面临一个更现实的代数问题:如何在线性空间中引入“度量”? 传统的向量空间只定义了加法和数乘,它本身是“盲目”的,无法直接探讨长短、夹角或投影。为了在抽象的 $K$-线性空间 $V$ 中建立这种几何直觉,我们需要让两个向量通过某种映射产生一个标量,这便是双线性函数(Bilinear Function)的逻辑起点。
基本概念与表示
概念的拆解与动机:从单变量到双变量的线性泛化
我们不能直接把两个向量塞进一个普通的线性泛函里,因为线性泛函的输入只有一个。如果我们希望映射 $f: V \times V \to K$ 能够兼容原空间的线性结构,最朴素的直觉就是“控制变量”——当固定其中一个向量时,它对另一个向量的表现必须是线性的。
这便导出了双线性函数的严格定义。若映射 $f: V \times V \to K$ 满足以下两条双分配律与数乘齐次性:
对第一个变量线性(左线性):
$f(k\alpha + l\beta, , \gamma) = kf(\alpha, \gamma) + lf(\beta, \gamma)$2. 对第二个变量线性(右线性):$f(\gamma, , k\alpha + l\beta) = kf(\gamma, \alpha) + lf(\gamma, \beta)$对于任意的向量$\alpha, \beta, \gamma \in V$以及标量$k, l \in K$均成立,则称$f$为$V$ 上的双线性函数。
构造动机: 这种双向的线性维持,保证了我们可以像做多项式乘法一样去展开复杂的向量组合。它是内积(Inner Product)的代数抽象,剥离了正定性等几何束缚,仅保留了最基础的代数运算相容性。
矩阵化表征的推导:如何记录一个双线性函数?
一个抽象的双线性映射可能非常复杂,我们不可能穷举 $V \times V$中无数的向量对。如同线性变换可以通过基底化身为矩阵一样,我们自然会问:双线性函数都长什么样子?如何简洁地记录一个双线性函数$f$?
答案极其纯粹:只需记录空间的一组基以及 $f$ 在这组基下的矩阵。
完整的表征推导
设有限维线性空间 $V$的一组基为${\alpha_1, \alpha_2, \dots, \alpha_n}$。在这组基下,任意两个向量 $\alpha$和$\beta$ 都可以被唯一地坐标化:
$$ \alpha = \sum_{i=1}^n x_i \alpha_i, \quad \beta = \sum_{j=1}^n y_j \alpha_j $$
其对应的坐标列向量分别记为:
$$ X = [x_1, x_2, \dots, x_n]^T, \quad Y = [y_1, y_2, \dots, y_n]^T $$
现在,我们让双线性函数 $f$ 作用在这一对向量上。利用其双线性的展开性质,推导如水到渠成般展开:
- 代入基底表示:
$$ f(\alpha, \beta) = f\left(\sum_{i=1}^n x_i \alpha_i, , \sum_{j=1}^n y_j \alpha_j\right) $$
- 利用左线性,将第一项的求和与系数提出来:
$$ f(\alpha, \beta) = \sum_{i=1}^n x_i f\left(\alpha_i, , \sum_{j=1}^n y_j \alpha_j\right) $$
- 利用右线性,将第二项的求和与系数提出来:
$$ f(\alpha, \beta) = \sum_{i=1}^n \sum_{j=1}^n x_i y_j f(\alpha_i, \alpha_j) $$
关键顿悟(The Key Insight): 仔细端详最终的求和式 $\sum_{i=1}^n \sum_{j=1}^n x_i y_j f(\alpha_i, \alpha_j)$。在这个算式中,$x_i$和$y_j$ 是由输入向量完全决定的,而 $f(\alpha_i, \alpha_j)$则是完全由函数本身和基底决定的常数。这意味着,只要我们知道了这$n \times n$ 个标量的值,整个双线性函数的行为就被彻底锁定了。
为了将这个双重求和结构抽象为现代矩阵语言,我们定义一个矩阵 $A \in M_n(K)$,其第 $i$行第$j$ 列的元素为:
$$ a_{ij} = f(\alpha_i, \alpha_j) $$
这个矩阵 $A$被称为$f$在基${\alpha_1, \dots, \alpha_n}$ 下的度量矩阵(Metric Matrix)。
借助度量矩阵,上述双重求和结构可以完美地改写为矩阵乘法的级联形式:
$$ \begin{aligned} f(\alpha, \beta) &= [x_1, x_2, \dots, x_n] \begin{bmatrix} f(\alpha_1, \alpha_1) & f(\alpha_1, \alpha_2) & \cdots & f(\alpha_1, \alpha_n) \\ f(\alpha_2, \alpha_1) & f(\alpha_2, \alpha_2) & \cdots & f(\alpha_2, \alpha_n) \\ \vdots & \vdots & \ddots & \vdots \\ f(\alpha_n, \alpha_1) & f(\alpha_n, \alpha_2) & \cdots & f(\alpha_n, \alpha_n) \end{bmatrix} \begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{bmatrix} \\ &= \mathbf{X^T A Y} \end{aligned} $$
双线性函数对应的空间
空间结构的升华:从函数到同构的向量空间
当我们固定了一组基后,每一个双线性函数 $f$都唯一对应一个度量矩阵$A$。这种一一对应不仅仅是数据上的映射,它完美地保持了代数运算的内部结构。
1. 双线性函数的代数运算
如果我们将两个双线性函数 $f$和$g$相加,或者对$f$进行数乘$k$,其结果依然是一个双线性函数。在矩阵层面上,这种运算表现得极为协调:
- 加法: $(f+g)(\alpha, \beta) := f(\alpha, \beta) + g(\alpha, \beta) = X^T A Y + X^T B Y = \mathbf{X^T (A + B) Y}$- 数乘:$(kf)(\alpha, \beta) := k f(\alpha, \beta) = k (X^T A Y) = \mathbf{X^T (kA) Y}$
这说明,$V$ 上的所有双线性函数在加法和数乘下构成了一个新的线性空间,我们将其记为 $T_2(V)$。
2. 矩阵空间的同构
上述推导揭示了一个深刻的代数事实:固定基底后,双线性函数空间 $T_2(V)$与矩阵空间$M_n(K)$ 是同构的(Isomorphic)。
$$ f \in T_2(V) \longleftrightarrow A \in M_n(K) $$
这种同构带来了维度的直接对等。因为 $n$阶方阵空间$M_n(K)$的维度显而易见是$n^2$,所以我们可以直接判定双线性函数空间的维度:
$$ \dim T_2(V) = n^2 $$
视角的更进一步:多重线性函数的自然延展
当我们不再满足于“两个向量”的相互作用,而是希望探究 $r$ 个向量之间的多维线性依赖关系时,双线性函数就自然地演变成了多重线性函数(Multilinear Function)。
设 $f: V^r = V \times V \times \dots \times V \to K$是一个定义在$r$个线性空间笛卡尔积上的函数。如果它对单独每一个变量都保持线性(即在其余$r-1$个变量固定时,对剩下的那一个变量表现为线性泛函),则称$f$是$V$ 上的 $r$-重线性函数。
用代数式表达即为,在第 $i$ 个位置上满足:
$$ f(\dots, , \alpha + \beta, , \dots) = f(\dots, , \alpha, , \dots) + f(\dots, , \beta, , \dots) $$
$$ f(\dots, , k\alpha, , \dots) = k f(\dots, , \alpha, , \dots) $$
当我们把双线性函数的“两个变量”外推到 $r$个变量时,我们面对的是一个映射$f: V^r \to K$。如何记录这样一个宏观映射?
完整的表征推导
设有限维线性空间 $V$的一组基为${\alpha_1, \alpha_2, \dots, \alpha_n}$。对于 $r$个任意输入的向量$\beta_1, \beta_2, \dots, \beta_r \in V$,它们在这组基下的坐标展开分别为:
$$ \beta_k = \sum_{i=1}^n x_k^{(i)} \alpha_i \quad (1 \le k \le r) $$
其中 $x_k^{(i)}$表示第$k$个向量在第$i$个基向量$\alpha_i$ 前的系数。
现在,让 $f$作用在这一组向量上。由于$f$ 对每一个变量都满足线性,我们可以像抽丝剥茧一样,逐层将求和号与坐标系数提取出来:
$$ f(\beta_1, \beta_2, \dots, \beta_r) = f\left(\sum_{i_1=1}^n x_1^{(i_1)} \alpha_{i_1}, \, \sum_{i_2=1}^n x_2^{(i_2)} \alpha_{i_2}, \, \dots, \, \sum_{i_r=1}^n x_r^{(i_r)} \alpha_{i_r}\right) $$
利用完全分配律(多重线性),所有的求和号被堆叠到最外层,所有的坐标系数被级联相乘:
$$ f(\beta_1, \beta_2, \dots, \beta_r) = \sum_{1 \le i_1, \dots, i_r \le n} x_1^{(i_1)} x_2^{(i_2)} \cdots x_r^{(i_r)} f(\alpha_{i_1}, \alpha_{i_2}, \dots, \alpha_{i_r}) $$
构造动机:
此时,宏观函数的行为完全坍缩在了这 $n^r$ 个固定的标量值上:
$$ b_{i_1 i_2 \dots i_r} = f(\alpha_{i_1}, \alpha_{i_2}, \dots, \alpha_{i_r}) \in K $$
在双线性函数($r=2$)中,这组常数排列成一个二维矩阵 $a_{ij}$;而在 $r$-重线性函数中,这 $n^r$个常数构成了一个高阶阵列——这便是现代数学与数据科学中“张量(Tensor)”的代数具象。它说明,正如双线性函数全体构成空间$T_2(V)$,全体系数运算同样保持加法与数乘相容,构成多重线性函数空间 $T_r(V)$。
对偶的桥梁:伴随映射的诞生
回到双线性函数 $f: V \times V \to K$。如果我们换一种视角看它:不把它看作两个向量的“熔炉”,而是看作一个“转换器”——当我塞入一个固定的向量 $\alpha$ 时,剩下的那个位置不就变成了一个只吃一个向量的线性泛函了吗?
这便导出了伴随映射(Induced Mapping)的构造。对于每个固定的 $\alpha \in V$,我们定义两个 $V$上的线性泛函(即$V^*$ 中的元素):
- 左泛函(固定左变量): $\alpha_L: V \to K, \quad \alpha_L(\beta) := f(\alpha, \beta)$- 右泛函(固定右变量):$\alpha_R: V \to K, \quad \alpha_R(\beta) := f(\beta, \alpha)$由此,我们自然地诱导出了两个从原空间$V$到对偶空间$V^*$ 的宏观线性映射:
$$ \psi_L: V \to V^*, \quad \alpha \mapsto \alpha_L $$
$$ \psi_R: V \to V^*, \quad \alpha \mapsto \alpha_R $$
这两个映射分别被称为左映射与右映射。它们是双线性函数特有的“触手”,将具体向量转化为了对偶世界的泛函。
空间的盲区:左根空间与右根空间
既然 $\psi_L$和$\psi_R$ 是线性映射,根据线性代数的核心直觉,我们必须立刻考察它们的核空间(Kernel)。那些被它们映射为对偶空间零元素的向量,代表了什么?
1. 根空间的定义
左根(Left Radical): 若 $\alpha \in \text{Ker},\psi_L$,意味着对于任意的 $\beta \in V$,都有 $\alpha_L(\beta) = f(\alpha, \beta) = 0$。我们称 $\alpha$为$f$的一个左根。全体左根构成的子空间$\text{Ker},\psi_L$称为$f$ 的左根空间。
右根(Right Radical): 若 $\alpha \in \text{Ker},\psi_R$,意味着对于任意的 $\beta \in V$,都有 $\alpha_R(\beta) = f(\beta, \alpha) = 0$。我们称 $\alpha$为$f$的一个右根。全体右根构成的子空间$\text{Ker},\psi_R$称为$f$ 的右根空间。
几何直觉: 根空间里的向量是度量意义下的“隐形人”或“绝对正交者”。一个左根向量 $\alpha$放在左边时,无论右边换成空间的任何向量,度量结果全部为$0$。它与整个空间“绝缘”了。
2. 矩阵形式下的显式表征
如果我们固定基底,将双线性函数写成度量矩阵 $A$,那么寻找根空间就完美地等价于解经典的齐次线性方程组。
设向量 $\alpha$在基下的坐标为$X$。
既然对于所有 $Y$都有$X^T A Y = 0$,那么必然有 $X^T A = 0$,转置过来即为 $A^T X = 0$。
同理,对于右根,所有 $Y$都有$Y^T A X = 0$,必然有 $A X = 0$。
这导出了极其漂亮的度量定理:
- 左根空间 $= {(\alpha_1 \dots \alpha_n)X \mid A^T X = 0}$- 右根空间$= {(\alpha_1 \dots \alpha_n)X \mid A X = 0}$因为矩阵$A$ 的行列秩相等($\text{rank}(A) = \text{rank}(A^T)$),根据秩-零度定理(Rank-Nullity Theorem),齐次方程组的解空间维度被瞬间锁定:
$$ \text{左根维数} = \text{右根维数} = n - \text{rank}(A) $$
关键顿悟(The Key Insight): 尽管由于 $A$ 可能是不对称的,导致左根空间和右根空间在几何上是不同的子空间,但它们的维度在绝对数值上永远相等。
完美的度量:非退化双线性函数与同构
如果一个度量空间里存在那些与谁做运算都为 $0$ 的“根向量”(除了零向量本身),这个度量就是有缺陷的(退化的)。为了建立完美的几何结构,我们希望空间的盲区尽量小。
定义: 若 $f$的左、右根空间都是零子空间(即只有零向量能与全空间保持正交),则称$f$ 是非退化双线性函数(Non-degenerate Bilinear Function)。
核心等价定理
结合上述所有推导,以下四个条件达成了代数上的完全等价:
$$ f \text{ 非退化} \iff f \text{ 的度量矩阵 } A \text{ 满秩 } (\text{rank}(A)=n) $$
$$ \iff \psi_L: V \to V^* \text{ 是线性同构} $$
$$ \iff \psi_R: V \to V^* \text{ 是线性同构} $$
置信度评级:高(对偶映射与满秩的等价性构成了有限维线性空间度量理论的基石)。
结构评估与对偶破缺
这个定理极为深刻。在通常情况下,线性空间 $V$和它的对偶空间$V^$ 虽然同维,但是它们之间*不存在自然的(不依赖基底的)同构。
然而,一旦我们在 $V$上指定了一个非退化双线性函数$f$,这个函数就赋予了空间一种内在的度量结构,从而强行在 $V$和$V^*$之间建立了一个不依赖外部基底的选择的自然同构$\psi$:
$$ f(\alpha, \beta) = \big(\psi(\alpha)\big)(\beta) $$
反之,给定了任意一个同构 $\psi: V \to V^*$,我们就能自然地定义一个非退化的双线性度量。
换基
在线性空间的代数框架中,非退化双线性函数成功建立起了原空间与对偶空间的桥梁。然而,坐标化始终依赖于特定基底的选择。一旦我们将视角从单一的静止基底拓展到基底的动态跃迁(基底变换),双线性函数所蕴含的深层代数性质便在矩阵空间中引发了一场剧烈的对称性分化。这促使我们重新审视对称、反对称的几何本质,并最终借助多重线性函数完成对“行列式”这一终极代数不变量的宏观建构。
基底的跃迁:度量矩阵的合同法则(Congruence)
当我们改变空间 $V$的基底时,双线性函数$f$ 本身作为几何实体保持不变,但其“身份证”——度量矩阵,必须遵循特定的演化规律。
1. 完整的合同公式推导
设线性空间 $V$中存在两组不同的基,它们通过过渡矩阵$P$ 达成联系:
$$ (\beta_1, \dots, \beta_n) = (\alpha_1, \dots, \alpha_n) P $$
设向量 $\alpha, \beta \in V$在新基${\beta_i}$下的坐标列向量分别为$X, Y$。根据基底变换与坐标变换的逆反关系,它们在旧基 ${\alpha_i}$下的坐标将通过$P$进行线性映射,分别表现为$PX$和$PY$。
现在,让双线性函数 $f$ 作用于这对向量。我们在旧基的框架下将其展开:
$$ f(\alpha, \beta) = (PX)^T A (PY) $$
利用矩阵乘法的转置分配律 $(PX)^T = X^T P^T$,代数式自然地组合为:
$$ f(\alpha, \beta) = X^T (P^T A P) Y $$
构造动机与代数升华:
因为新基底下的度量矩阵 $B$必须满足定义式$f(\alpha, \beta) = X^T B Y$,而在有限维空间中这种矩阵表征是唯一的,因此我们被迫得到新旧度量矩阵之间的跃迁法则:
$$ B = P^T A P $$
这种形如 $B = P^T A P$的矩阵关系,被称为合同(Congruence)。这与线性变换在基变换下的相似(Similarity)关系$P^{-1}AP$ 截然不同。它深刻地表明:双线性函数是比线性变换更深层的几何结构,它的合同律保护的是两向量相互作用的度量不变量,而非映射的特征值。
对称性的分化:对称与反对称的代数破缺
在合同法则的演化下,有两类特殊的矩阵表现出了无与伦比的结构稳定性:对称矩阵与反对称矩阵。这对应了双线性函数的两类核心物理形态。
1. 对称与反对称的定义
对称双线性函数: 满足 $f(\alpha, \beta) = f(\beta, \alpha), \quad \forall \alpha, \beta \in V$。在任意基底下的度量矩阵均满足 $A = A^T$。
反对称双线性函数: 满足 $f(\alpha, \beta) = -f(\beta, \alpha), \quad \forall \alpha, \beta \in V$。在任意基底下的度量矩阵均满足 $A = -A^T$。
2. 特征非 2 域($\text{ch } K \neq 2$)下的代数约束
在讲义中频繁出现一个技术性前提:$\text{ch } K \neq 2$(域的特征不等于 2,即 $1+1 \neq 0$)。在这个健康的域上,反对称性拥有一个完美的等价刻画:
$$ f \text{ 反对称} \iff f(\alpha, \alpha) = 0, \quad \forall \alpha \in V $$
$\Longrightarrow$方向的证明: 设$f$反对称,令$\beta = \alpha$,则有 $f(\alpha, \alpha) = -f(\alpha, \alpha)$。移项得 $2f(\alpha, \alpha) = 0$。因为 $\text{ch } K \neq 2$,所以 $2 \neq 0$,从而必有 $f(\alpha, \alpha) = 0$。
$\Longleftarrow$方向的证明(极化恒等式动机): 若对任意向量都有自作用为$0$,考察 $f(\alpha + \beta, \alpha + \beta) = 0$。利用双线性完全展开:
$$ f(\alpha, \alpha) + f(\alpha, \beta) + f(\beta, \alpha) + f(\beta, \beta) = 0 $$
代入自作用为 $0$ 的条件,中间两项被迫满足:$f(\alpha, \beta) + f(\beta, \alpha) = 0 \implies f(\alpha, \beta) = -f(\beta, \alpha)$。
范例深剖:连续空间与矩阵空间的度量具象
为了让抽象的对称性落地,讲义给出了两个在分析学与量子代数中至关重要的实例:
1. 函数空间 $C[a, b]$ 上的内积
设 $V = C[a, b]$ 为闭区间上的连续函数空间,定义:
$$ f(h, g) = \int_a^b h(x)g(x)dx $$
由于实数乘法的交换律 $h(x)g(x) = g(x)h(x)$,该函数显然满足对称性。同时,若 $h \neq 0$,则 $f(h, h) = \int_a^b h^2(x)dx > 0$,满足正定性。这说明正定的对称双线性函数在无穷维空间的具体化就是内积。
2. 矩阵空间 $M_{m,n}(\mathbb{R})$ 上的 Frobenius 内积
设 $V = M_{m,n}(\mathbb{R})$,定义:
$$ f(A, B) = \text{tr}(A^T B) $$
利用迹的性质 $\text{tr}(M) = \text{tr}(M^T)$,我们有 $\text{tr}(A^T B) = \text{tr}((A^T B)^T) = \text{tr}(B^T A) = f(B, A)$,证明了其对称性。当 $A \neq 0$ 时,$f(A, A) = \text{tr}(A^T A) = \sum_{i,j} a_{ij}^2 > 0$,构成了矩阵空间内天然的能量度量。
从反对称 $n$-重线性函数到行列式
现在,我们将基底变换、反对称性以及多重线性函数这三根线条拧在一起,去见证行列式的自然诞生。
考虑 $K^n$空间上的一个 反对称$n$-重线性函数 $f: K^n \times \dots \times K^n \to K$。这意味着输入 $n$ 个列向量,只要其中任意两列相同,函数值就瞬间归零。
1. 完整的交错展开推导
我们将输入的 $n$ 个列向量排列成一个方阵的各列:
$$ A = [a_{ij}] = [\mathbf{a_1}, \mathbf{a_2}, \dots, \mathbf{a_n}] $$
让每个列向量在标准基 ${\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n}$ 下进行线性组合展开:
$$ \mathbf{a_j} = \sum_{i=1}^n a_{ij} \varepsilon_i $$
代入 $n$-重线性函数 $f$,利用我们在上一章推导的多重线性完全展开法则:
$$ f(\mathbf{a_1}, \mathbf{a_2}, \dots, \mathbf{a_n}) = f\left(\sum_{i_1=1}^n a_{i_1 1}\varepsilon_{i_1}, \, \dots, \, \sum_{i_n=1}^n a_{i_n n}\varepsilon_{i_n}\right) = \sum_{1 \le i_1, \dots, i_n \le n} a_{i_1 1} a_{i_2 2} \dots a_{i_n n} f(\varepsilon_{i_1}, \varepsilon_{i_2}, \dots, \varepsilon_{i_n}) $$
反对称性的强力剪枝:
在上述庞大的 $n^n$项求和中,只要指标序列$(i_1, i_2, \dots, i_n)$中存在任何两个数字相同,由于$f$的反对称性(两列相同则值为 0),该项立刻坍缩为 0。因此,存活下来的项,其指标序列必须是$1, 2, \dots, n$的一个全排列$\sigma$。
对于任意一个排列 $\sigma = (i_1, i_2, \dots, i_n)$,我们可以通过有限次对换将其恢复为标准顺序 $(1, 2, \dots, n)$。由于 $f$ 是反对称的,每次对换都会导致函数值改变一次符号:
$$ f(\varepsilon_{i_1}, \varepsilon_{i_2}, \dots, \varepsilon_{i_n}) = \text{sgn}(i_1 i_2 \dots i_n) f(\varepsilon_1, \varepsilon_2, \dots, \varepsilon_n) $$
其中 $\text{sgn}$ 为排列的符号(偶排列为 1,奇排列为 -1)。
将这一结果代回求和式,将共同的常数项 $f(\varepsilon_1, \dots, \varepsilon_n)$ 提取到最外层:
$$ f(\mathbf{a_1}, \dots, \mathbf{a_n}) = f(\varepsilon_1, \dots, \varepsilon_n) \sum_{\sigma \in S_n} \text{sgn}(\sigma) a_{\sigma(1) 1} a_{\sigma(2) 2} \dots a_{\sigma(n) n} $$
2. 行列式的定义化身
仔细观察留在求和号内部的式子:$\sum_{\sigma \in S_n} \text{sgn}(\sigma) a_{\sigma(1) 1} \dots a_{\sigma(n) n}$,这不偏不倚,恰好就是矩阵 $A$ 的Leibniz 行列式定义!
这导出了极其震撼的代数结论:
$$ f(\mathbf{a_1}, \dots, \mathbf{a_n}) = f(\varepsilon_1, \dots, \varepsilon_n) \cdot \det(A) $$
核心结构透视:
如果我们将标准基底下的输出值规范化(Normalize)为 $f(\varepsilon_1, \dots, \varepsilon_n) = 1$,那么这个独特的反对称 $n$-重线性函数 $f$ 本身,就是行列式(Determinant)。
这揭示了行列式的本质几何动机:它不是一堆杂乱的交叉相乘,而是定义在 $n$维向量空间上的、唯一的、交错的、能够测量$n$ 维超平行多面体定向体积的顶阶微分形式(Top-form)。
终点与新起点:对称矩阵的合同标准型
在完成了反对称性向高维行列式的跃迁后,将目光重新投回对称双线性函数。既然普通的度量矩阵会随着基底变换做 $P^T A P$ 的合同演化,我们自然想要寻求一个“最简单、最干净”的基底,使得在这个基底下度量矩阵的表现达到极致。
这便是对称双线性函数的标准型定理:
设 $\text{ch } K \neq 2$,对于任意对称双线性函数 $f$,在空间 $V$中必然存在一组极其完美的基底,使得$f$ 在该基底下的度量矩阵变成一个对角矩阵(Diagonal Matrix)。此时,交叉项全部消失,双线性函数化身为最纯粹的加权平方式:
$$ f(\alpha, \beta) = d_1 x_1 y_1 + d_2 x_2 y_2 + \dots + d_n x_n y_n $$
在实数域 $\mathbb{R}$ 上,将度量矩阵化为对角标准型有三种经典路径:
正交替换法(Orthogonal Transformation): 借助实对称矩阵特征值理论,不仅合同而且相似,保持几何轴向(实数域特有)。
拉格朗日配方法(Lagrange’s Method): 纯粹代数层面的消元与完全平方构造,具有极高的普适性。
成对的初等行、列变换: 对矩阵 $A$施加初等行变换的同时,必须立刻施加完全相同的初等列变换,以此来维持$P^T A P$ 的合同结构。
那么说完理论层面,我们看看如何具体计算。
算法流的构建:成对初等变换
为了求解可逆过渡矩阵 $P$使得$P^T A P = D$ 成为对角矩阵,拉格朗日配方法在矩阵语言下的最佳映射就是成对初等变换法(Simultaneous Row and Column Operations)。
1. 伴随记录矩阵的构造动机
在线性变换的相似对角化中,我们利用增广矩阵 $[A \mid I]$进行初等行变换来求逆矩阵。但在双线性函数的合同变换中,由于$P$同时以转置$P^T$(左乘,对应行变换)和 $P$(右乘,对应列变换)的形式作用于 $A$,传统的单侧增广失去了效力。
为了在动态变换中同时追踪度量矩阵的演化和过渡矩阵 $P$ 的累积,我们必须构建一个双层垂直伴随矩阵:
$$ \begin{bmatrix} A \\ -- \\ I \end{bmatrix} $$
上半部分:放置待消元的度量矩阵 $A \in M_n(K)$。
下半部分:放置初始单位阵 $I \in M_n(K)$,用于像计数器一样“拓印”所有的列变换。
2. “步调一致”的运算律
在操作该伴随阵时,必须遵循以下绝对铁律:
每对上半部分 $A$施加一次初等行变换(如第$j$行加上第$i$行的$k$倍),必须立刻对整个矩阵的列施加完全相同的初等列变换(第$j$列加上第$i$列的$k$ 倍)。
由于下半部分仅参与列变换,当上半部分的 $A$历经一系列成对变换最终被榨干为对角阵$D$时,下半部分便完美地从$I$蜕变为了所需的过渡矩阵$P$。
3. 经典范例的具象演算与细节补充
$$ A = \begin{bmatrix} 1 & 2 & -2 \\ 2 & 4 & -2 \\ -2 & -2 & 0 \end{bmatrix} $$
步骤 1:利用主元 $a_{11}=1$ 清空第一行与第一列的非对角元
行变换:第 2 行减去第 1 行的 2 倍,第 3 行加上第 1 行的 2 倍。
列变换:立刻执行第 2 列减去第 1 列的 2 倍,第 3 列加上第 1 列的 2 倍。
经过这一轮对称的消元清洗,伴随矩阵演化为:
$$ \begin{bmatrix} A \\ -- \\ I \end{bmatrix} \sim \begin{bmatrix} 1 & 0 & 0 \\ 0 & 0 & 2 \\ 0 & 2 & -4 \\ -- & -- & -- \\ 1 & -2 & 2 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} $$
步骤 2:死锁突破——对角元全零的几何错位(关键顿悟)
仔细观察此时的第 2 行第 2 列元素 $a_{22} = 0$,而交叉项 $a_{23} = a_{32} = 2 \neq 0$。我们无法用现存的第 2 行主元去消去第 3 行。算法在此处发生了假死。
为了突破这个盲区,使用通用错位算法:
若某个对角元 $a_{ii}=0$,但同一行(列)里存在非零元 $a_{ij} = a$。则通过成对变换:将第 $i$行加上第$j$行的$k$倍,并立刻将第$i$列加上第$j$列的$k$ 倍。
我们来看这个操作对原本为 0 的对角元施加了怎样的代数魔法。利用双线性展开,新的对角元将变为:
$$ a_{ii}' = a_{ii} + k a_{ji} + k a_{ij} + k^2 a_{jj} = 0 + 2ka + k^2 b $$
其中 $b = a_{jj}$。只要我们选取适当的 $k$(通常取 $k=1$或$-1$),就能保证 $2ka + k^2 b \neq 0$,从而强行将零对角元激活为非零主元。
在当前范例中:
行变换:第 2 行加上第 3 行的 $1$倍(此时$k=1$)。
列变换:立刻第 2 列加上第 3 列的 $1$ 倍。
让我们看看上半部分矩阵的右下角 $2 \times 2$ 子块发生了什么变异:
$$ \begin{bmatrix} 0 & 2 \\ 2 & -4 \end{bmatrix} \xrightarrow{\text{r}_2 + \text{r}_3} \begin{bmatrix} 2 & -2 \\ 2 & -4 \end{bmatrix} \xrightarrow{\text{c}_2 + \text{c}_3} \begin{bmatrix} \mathbf{2} & -2 \\ -2 & -4 \end{bmatrix} $$
原本是 0 的主元成功被激活为了 2!此时整个伴随阵变为:
$$ \begin{bmatrix} 1 & 0 & 0 \\ 0 & 2 & -2 \\ 0 & -2 & -4 \\ -- & -- & -- \\ 1 & 0 & 2 \\ 0 & 1 & 0 \\ 0 & 1 & 1 \end{bmatrix} $$
步骤 3:盖棺定论的终消元
现在的对角元为 $2$。
行变换:第 3 行加上第 2 行的 $1$ 倍。
列变换:第 3 列加上第 2 列的 $1$ 倍。
伴随阵最终凝聚为:
$$ \begin{bmatrix} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & -6 \\ -- & -- & -- \\ 1 & 2 & 4 \\ 0 & 1 & 1 \\ 0 & 1 & 2 \end{bmatrix} $$
为了让系数更加美观,对基底进行一次等比例缩放(对第 2 行/列同时乘以 $\frac{1}{\sqrt{2}}$ 或移项配方调整),最终输出的标准答案为:
$$ D = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -4 \end{bmatrix}, \quad P = \begin{bmatrix} 1 & -1 & 2 \\ 0 & 1 & 0 \\ 0 & 1/2 & 1 \end{bmatrix} $$
对应的几何新基底 $\beta = \alpha P$ 显式表达为:
$$ \beta_1 = \alpha_1, \quad \beta_2 = -\alpha_1 + \alpha_2 + \frac{1}{2}\alpha_3, \quad \beta_3 = 2\alpha_1 + \alpha_3 $$
在该基底下,原本错综复杂的双线性函数化为了清爽的纯平方和度量:
$$ f(\alpha, \beta) = x_1 y_1 + x_2 y_2 - 4x_3 y_3 $$
反对称的极化:辛结构与全同构分类
当我们把完全相同的成对初等变换法则施加给反对称双线性函数时,整个代数景观发生了一次惊人的跨越。对称矩阵试图追求的是“对角化”,而反对称矩阵由于其天然的对角线全零属性($\text{ch } K \neq 2$时$f(\alpha,\alpha)=0$),其合同演化的终点导向了一种被称为辛标准型(Symplectic Canonical Form)的块状交错结构。
1. 反对称矩阵的合同标准型定理
设 $V$是数域$K$上的$n$ 维线性空间,$f(\alpha, \beta)$是$V$上的反对称双线性函数。则必然存在$V$的一组极其特殊的基底,使得$f$的度量矩阵呈现为如下的分块对角阵$E$:
$$ E = \begin{bmatrix} \begin{matrix} 0 & 1 \\ -1 & 0 \end{matrix} & & & \\ & \ddots & & \\ & & \begin{matrix} 0 & 1 \\ -1 & 0 \end{matrix} & \\ & & & \begin{matrix} 0 & & \\ & \ddots & \\ & & 0 \end{matrix} \end{bmatrix} $$
核心结论披露:
每一个非零的分块都是一个 $2 \times 2$的标准交错矩阵$\begin{bmatrix} 0 & 1 \ -1 & 0 \end{bmatrix}$。这说明非退化的反对称双线性函数,其对应的空间维度必然是偶数($2r$ 维)。
剩余的部分全部由零补齐。如果整个函数是非退化的,则零块彻底消失,整个矩阵由 $r$个这样的$2 \times 2$ 辛块级联而成。
2. 坐标视角的解析表达
在这组完美的基底下,我们若观察双线性函数的显式多项式展开,它会表现为一种成对咬合的交错对:
$$ f(\alpha, \beta) = X^T E Y = (x_1 y_2 - x_2 y_1) + (x_3 y_4 - x_4 y_3) + \dots + (x_{2r-1} y_{2r} - x_{2r} y_{2r-1}) $$
每一对 $(x_{2k-1}, x_{2k})$与$(y_{2k-1}, y_{2k})$之间都在进行着类似二维决定式(面积)的交错运算。这在物理学中具有极为深刻的动机——这正是哈密顿力学(Hamiltonian Mechanics)中相空间(Phase Space)里位置量$q$与动量$p$ 的正则对偶结构。
全等价推论
从反对称标准型中,我们可以直接收割一个关于矩阵空间的终极推论:
推论:设 $A, B$是数域$K$上的两个$n$ 级反对称矩阵,则:
$$ A \text{ 与 } B \text{ 合同} \iff \text{rank}(A) = \text{rank}(B) $$
批判性对比评估(对称 vs 反对称):
这个推论展示了反对称世界异乎寻常的纯粹性。
在对称矩阵的世界里,两个矩阵想要合同,在实数域 $\mathbb{R}$上不仅要求秩相同,还要求正负惯性指数完全一致(Sylvester 惯性定理);在复数域$\mathbb{C}$ 上才仅要求秩相同。
然而在反对称矩阵的世界里,无论你在什么域上(只要 $\text{ch } K \neq 2$),“秩”是唯一的合同不变量。因为任何反对称矩阵在合同意义下都只能演化为由它的秩 $2r$所唯一决定的标准型$E$。只要秩相等,它们就能通过标准型作为中介,跨越空间的迷雾达成完美的合同。
在完成了双线性函数在特定基底下的矩阵化以及非退化诱导同构的讨论后,我们站在了一个更本质的代数分水岭前。后半部分我们的视角从“作为函数的双线性”极化为“作为几何对象的二次型”,并随后引出了现代代数学中最伟大的核心构造之一——张量积(Tensor Product)。
这一章的演进不仅是为了寻找基底,而是为了彻底解决一个代数上的宿命难题:如何将“多重非线性映射”转化为标准的“单变量线性映射”?
几何的投影:对称双线性函数与二次型的极化等价
在 $\text{ch } K \neq 2$的数域上,对称双线性函数$f(\alpha, \beta)$与一个纯粹的单变量非线性函数——二次型(Quadratic Form)$Q(\alpha)$ 达成了结构上的完全绑定。
1. 极化恒等式(Polarization Identity)的推导
定义一个映射 $Q: V \to K$,其通过对称双线性函数 $f$ 的自作用给出:
$$ Q(\alpha) := f(\alpha, \alpha) $$
由于 $f$在具体基底下的表征为$X^T A Y$,那么 $Q(\alpha)$ 在该基底下的显式表达即为齐次二次多项式:
$$ Q(\alpha) = X^T A X $$
如果我们只被赋予了 $Q(\alpha)$这个函数,我们能否逆向重构出原本的双线性度量$f(\alpha, \beta)$?
利用 $f$的对称性与双线性,我们考察两个不同向量和的二次能级$Q(\alpha + \beta)$:
$$ \begin{aligned} Q(\alpha + \beta) &= f(\alpha + \beta, \, \alpha + \beta) \\ &= f(\alpha, \alpha) + f(\alpha, \beta) + f(\beta, \alpha) + f(\beta, \beta) \\ &= Q(\alpha) + 2f(\alpha, \beta) + Q(\beta) \end{aligned} $$
移项并两边同时除以 2(此步强烈依赖 $\text{ch } K \neq 2$),我们便优雅地解出了核心通道:
$$ f(\alpha, \beta) = \frac{1}{2}\big(Q(\alpha + \beta) - Q(\alpha) - Q(\beta)\big) $$
构造动机:
极化恒等式表明,二次型与对称双线性函数是一体两面。在几何上,这意味着只要知道了整个空间中所有向量的“长度平方”(二次型),就能唯一恢复出任意两向量的“内积与夹角”(双线性函数)。
如果我们在一组基下将向量表示为坐标列向量 $X, Y$,那么对称双线性函数可以写为 $f(\alpha, \beta) = X^T A Y$(其中 $A$ 为对称度量矩阵)。
通过上述相同的代数展开,动机在矩阵层面表现为:
$$ \begin{aligned} Q(\alpha + \beta) &= (X+Y)^T A (X+Y) \\ &= X^T A X + X^T A Y + Y^T A X + Y^T A Y \\ &= X^T A X + 2X^T A Y + Y^T A Y \quad (\text{因为标量 } Y^T A X = (Y^T A X)^T = X^T A Y) \\ &= Q(\alpha) + 2X^T A Y + Q(\beta) \end{aligned} $$
因此,$X^T A Y = \frac{1}{2}{Q(\alpha + \beta) - Q(\alpha) - Q(\beta)}$。坐标表达与几何抽象完美契合。
构造双线性函数空间的基
动机
已知有限维线性空间 $V$的对偶空间$V^$(由所有线性泛函组成)有一组对偶基 ${\alpha_1^, \dots, \alpha_n^*}$。现在我们考虑 $V$上所有双线性函数构成的线性空间,记为$T_2(V)$。
我们希望为 $T_2(V)$ 找到一组自然且直观的基。
一个线性泛函 $\xi^* \in V^$ 只能吞掉一个向量。为了让它吞掉两个向量并产生双线性,最朴素的想法就是*把两个线性泛函乘起来。
泛函张量积 $\xi^* \otimes \eta^*$ 的定义
对于 $\xi^, \eta^ \in V^$,定义它们在 $V \times V$上的一个函数$\xi^ \otimes \eta^*$,其作用规则为:
$$ (\xi^* \otimes \eta^*)(\alpha, \beta) = \xi^*(\alpha) \cdot \eta^*(\beta) $$
由于 $\xi^$和$\eta^$各自都是线性的,它们乘在一起后,对$\alpha$和$\beta$分别满足分配律与数乘公理,因此$\xi^* \otimes \eta^$必然是一个双线性函数(即$\xi^ \otimes \eta^* \in T_2(V)$)。
基的完备性推导与度量矩阵的秩
设 ${\alpha_1, \dots, \alpha_n}$是$V$ 的一组基,${\alpha_1^, \dots, \alpha_n^}$ 是其对应的对偶基。
我们让构造出来的元素 $\alpha_i^* \otimes \alpha_j^*$去作用基向量对$(\alpha_k, \alpha_s)$:
$$ (\alpha_i^* \otimes \alpha_j^*)(\alpha_k, \alpha_s) = \alpha_i^*(\alpha_k) \cdot \alpha_j^*(\alpha_s) = \delta_{ik} \delta_{js} $$
这个性质非常漂亮,它意味着 $\alpha_i^* \otimes \alpha_j^$是一个*精准的选择器:它只有在输入恰好是第$i$个和第$j$ 个基向量时输出 1,其余情况全部为 0。
因此,如果我们将 $\alpha_i^* \otimes \alpha_j^$视为$T_2(V)$中的元素,它们在基向量上的度量矩阵就是*基础矩阵$E_{ij}$(即只有 $(i,j)$ 处为 1,其余为 0 的矩阵)。
因为 $E_{ij}$构成了矩阵空间$M_n(K)$的基,且$T_2(V)$与$M_n(K)$ 同构,所以:
$$ \{\alpha_i^* \otimes \alpha_j^* \mid 1 \le i, j \le n\} \text{ 构成了双线性函数空间 } T_2(V) \text{ 的一组基} $$
任何一个双线性函数 $f \in T_2(V)$ 都可以唯一地展开为:
$$ f = \sum_{i,j} f(\alpha_i, \alpha_j) \alpha_i^* \otimes \alpha_j^* $$
补充思考:单一乘积项的矩阵特征
若取任意两个普通的线性泛函 $\xi^* = \sum a_i \alpha_i^$和$\eta^ = \sum b_j \alpha_j^$,它们通过张量积组合成一个特殊的双线性函数 $\xi^ \otimes \eta^*$。它在基 ${\alpha_1, \dots, \alpha_n}$ 下的度量矩阵是什么样子的?
根据定义,第 $(i,j)$个基向量对的作用结果为$\xi^(\alpha_i)\eta^(\alpha_j) = a_i b_j$。
所以其余子式的度量矩阵为:
$$ [a_i b_j] = \begin{bmatrix} a_1 \\ \vdots \\ a_n \end{bmatrix} \begin{bmatrix} b_1 & \cdots & b_n \end{bmatrix} $$
这是一个典型的列向量乘以行向量的形式。它的矩阵秩必然为 1。这意味着,单一的泛函乘积形如 $\xi^* \otimes \eta^*$ 只能表达极其特殊的、退化的双线性函数,而通用的双线性函数必须通过这些秩 1 矩阵的线性组合(求和)来生成。
为此,我们也称 $T_2(V)$空间为$V^$与$V^$的张量积空间,记作$V^* \otimes V^* = T_2(V)$。
从双线性映射到抽象张量积空间
1. 从“双线性函数”到“双线性映射”:动机
在上面,我们的双线性函数输出的是标量(数域 $K$中的数)。现在我们要把这个概念泛化:如果输出的不是数字,而是一个全新的线性空间$W$ 中的向量呢?这就是双线性映射。
定义:设 $U, V, W$是$K$-线性空间。若映射 $\varphi: U \times V \to W$ 满足对每个元分别保持线性:
- $\varphi(k\alpha + l\beta, \gamma) = k\varphi(\alpha, \gamma) + l\varphi(\beta, \gamma)$2.$\varphi(\gamma, k\alpha + l\beta) = k\varphi(\gamma, \alpha) + l\varphi(\gamma, \beta)$则称$\varphi$是由$U \times V$到$W$ 的双线性映射。
2. 用“自然同构”刻画张量积空间 $U \otimes V$
双线性映射虽然有用,但它结构太松散(带有两个自变量的乘积分配律)。在数学中,我们更倾向于研究线性的东西。我们能否构造一个足够大的新空间,把“双线性映射”变成这个新空间上的“线性映射”?
通过对 $V$与对偶空间$V^{}$ 的自然同构进行泛化,数学家给出了张量积空间的公理化刻画:
定理:任何有限维 $K$-线性空间 $U$和$V$,都存在一个唯一的线性空间(记为 $U \otimes V$)以及一个特定的双线性映射 $\tau: U \times V \to U \otimes V$(通常将 $\tau(\alpha, \beta)$记作$\alpha \otimes \beta$),使得以下性质成立:
若 ${\alpha_1, \dots, \alpha_m}$是$U$ 的一组基,${\beta_1, \dots, \beta_n}$是$V$ 的一组基,则所有形式化乘积:
$$ \{\alpha_i \otimes \beta_j \mid 1 \le i \le m, 1 \le j \le n\} \text{ 构成 } U \otimes V \text{ 的一组基} $$
3. 维数关系与结论
由于 $U \otimes V$的基底是由$U$的基和$V$ 的基两两组合而成的,我们可以直接清点基向量的个数:
$$ \dim(U \otimes V) = (\dim U) \cdot (\dim V) $$
这一结论极其漂亮,它将两个独立空间以乘法的方式复合在一起,形成了现代代数学中一切多重线性代数(张量分析)的基石。
第一部分:张量积空间 $U \otimes V$ 的显式定义
1. 构造的动机:如何让两个“纯向量”相乘?
在前面的讨论中,我们已经知道如何将两个线性泛函相乘得到一个双线性函数。但现在的任务相反:给定两个普通的线性空间 $U$和$V$,如何不借助外界多余的结构,直接让其中的向量 $\alpha \in U$和$\beta \in V$做“乘法”$\alpha \otimes \beta$?
数学家利用了“双重对偶”的思想:向量空间 $U$中的一个向量$\alpha$,可以自然地看作是其对偶空间 $U^$上的一个线性泛函(即$\alpha(\xi^) = \xi^*(\alpha)$)。
既然 $\alpha$和$\beta$ 可以伪装成线性泛函,那么我们就可以模仿上一节的做法,将它们作为泛函“乘”起来。
2. 显式定义
我们将 $U$与$V$ 的张量积空间定义为:
$$ U \otimes V \triangleq T_2(U^*, V^*) $$
也就是说,$U \otimes V$本质上是定义在对偶空间对$U^* \times V^*$ 上的所有双线性函数构成的空间。
对于任给的向量对 $(\alpha, \beta) \in U \times V$,我们构造一个具体的双线性函数 $\alpha \otimes \beta \in T_2(U^, V^)$,其作用规则定义为:
$$ (\alpha \otimes \beta)(\xi^*, \eta^*) \triangleq \xi^*(\alpha) \eta^*(\beta), \quad \forall \xi^* \in U^*, \eta^* \in V^* $$
这里通过将 $\alpha, \beta$分别看成$U^$与$V^$上的线性泛函,使这个定义完全合法。我们称双线性函数$\alpha \otimes \beta$为向量$\alpha$与$\beta$ 的张量积。
第二部分:张量积运算的性质与基底证明
1. 双线性映射特性的验证
我们有了映射 $\otimes: U \times V \to U \otimes V, (\alpha, \beta) \mapsto \alpha \otimes \beta$。容易验证,它是一个双线性映射。这意味着它对两个自变量分别满足分配律与数乘交织律:
左分配律:$(\alpha + \beta) \otimes \gamma = \alpha \otimes \gamma + \beta \otimes \gamma$
右分配律:$\alpha \otimes (\beta + \gamma) = \alpha \otimes \gamma + \alpha \otimes \gamma$
数乘结合律:$(k\alpha) \otimes \beta = k(\alpha \otimes \beta) = \alpha \otimes (k\beta)$
2. 基底的完备性推导(核心证明)
定理:设 ${\alpha_1, \dots, \alpha_m}$是$U$ 的一组基,${\beta_1, \dots, \beta_n}$是$V$的一组基。则${\alpha_i \otimes \beta_j \mid 1 \le i \le m, 1 \le j \le n}$构成$U \otimes V$ 的一组基。
【证明步骤与动机】
引入对偶结构:为了研究 $\alpha_i \otimes \beta_j$的行为,我们引入它们对应的对偶基。设${\alpha_1^, \dots, \alpha_m^} \in U^$和${\beta_1^, \dots, \beta_n^} \in V^$ 分别是原空间基底的对偶基。
基底对的作用:让构造的张量积基底去吞对偶基向量对 $(\alpha_k^, \beta_s^)$:
$$ (\alpha_i \otimes \beta_j)(\alpha_k^*, \beta_s^*) = \alpha_k^*(\alpha_i) \cdot \beta_s^* (\beta_j) = \delta_{ik} \delta_{js} $$
这表明,双线性函数 $\alpha_i \otimes \beta_j$在基底对下的度量矩阵恰好是矩阵空间中的基础矩阵$E_{ij}$(即只有 $(i,j)$ 处为 1,其余为 0)。
同构过渡:因为双线性函数空间 $T_2(U^, V^)$与度量矩阵空间$M_{m,n}(K)$是同构的,而基础矩阵$E_{ij}$构成了$M_{m,n}(K)$的一组基,所以这$m \times n$个张量积元素$\alpha_i \otimes \beta_j$也必然构成$U \otimes V$ 的一组基。
任意元素的展开:任意一个属于张量积空间的双线性函数 $f \in T_2(U^, V^)$ 都可以唯一地表示为:
$$ f = \sum_{i,j} f(\alpha_i^*, \beta_j^*) \, \alpha_i \otimes \beta_j $$
这实际上与之前的泛函张量积是完全一样的路数。
第三部分:从具体二元运算到抽象泛性(Universal Property)的过渡
1. 统一视角:常见的双线性映射
在多元代数中,我们其实已经接触过非常多满足“双线性”的二元运算,例如:
三维欧氏空间中的向量叉积:$\vec{a} \times \vec{b}$,满足对两边向量的加法分配律。
矩阵环 $M_n(K)$(或 $K$-代数)中的矩阵乘法:$A \cdot B$,满足 $A(B+C) = AB + AC$以及$(kA)B = k(AB)$。
这些运算表面上形态各异,但其底层逻辑完全一致:它们都是从一个笛卡尔积空间 $U \times V$ 出发,映射到一个目标线性空间的双线性映射。
2. 更高级的数学动机:寻找“最原始的模型”
既然有这么多双线性映射,数学家提出了一个极具野心的宏观问题:
给定一个线性空间 $V$,如何用线性映射去刻画从 $V \times V$ 产生的所有双线性映射?
这些五花八门的双线性映射背后,有没有一个最原始、最通用的“母体模型”?
这就迫使我们跳出具体的对偶空间显式构造,走向范畴论中的泛性刻画(Universal Property)。张量积空间就是这个“最原始的模型”,它能够把结构复杂的“双线性映射”,完美地“线性化”为新空间上的普通线性映射。这一刻画将在接下来的“泛性刻画”中展开。
张量积的泛性定义、唯一性与存在性证明
第一部分:张量积的泛性刻画(Universal Property)
1. 核心动机:将“双线性”化为“线性”
在传统线性代数中,线性映射是最容易研究的对象。然而,双线性映射 $\psi: U \times V \to W$的底层空间是笛卡尔积$U \times V$,它不是一个线性的代数复合体(例如,$\psi(\alpha+\beta, \gamma+\delta)$ 无法直接拆成简单的线性项)。
为了解决这个不便,数学家的核心动机是:能否构造一个“中转站”空间(记为 $U \otimes V$),把所有的双线性映射都归结为这个中转站上的“普通线性映射”? 这样,整个多重线性代数就可以全部退化为普通的线性代数来处理。

2. 泛性定理与公理化定义
定理(张量积的泛性定义):任意给定的 $K$-线性空间 $U$和$V$,存在一个线性空间(记作 $U \otimes V$)以及一个从原空间出发的“纯净”双线性映射 $\varphi: U \times V \to U \otimes V$。它们组成的二元组 $(U \otimes V, \varphi)$ 满足以下公理化条件:
若 $\psi$是从$U \times V$到任意$K$-线性空间 $W$的双线性映射,则存在且仅存在唯一的一个线性映射$\sigma: U \otimes V \to W$,使得以下交换图表成立(即满足映射复合 $\psi = \sigma \circ \varphi$):
直观理解:
$(U \otimes V, \varphi)$是$U \times V$发出的所有双线性映射的 “第一站”。它是最纯净、最具有代表性的双线性结构。只要知道了第一站的行为,通过线性映射$\sigma$,你就能唯一的还原出通往任何终点空间 $W$的双线性映射$\psi$。也就是说:研究 $U \times V$上的双线性映射,等价于研究$U \otimes V$ 上的线性映射。
第二部分:张量积在同构意义下的“唯一性”证明
1. 证明的动机
既然泛性是用一种“宏观行为(图表交换)”来定义一个对象的,那么首要解决的问题就是:满足这个行为的空间是唯一的吗?如果换一个人构造,会不会构造出完全不同的代数结构?
数学家利用了范畴论中非常经典的“正反合(交换图表交织)”方法,来证明张量积在同构意义下是唯一的。
2. 完备推导步骤
设 $(U \otimes V, \varphi)$和$(Z, \psi)$是$U, V$ 的两组同时满足泛性条件的张量积。
- 第一步(顺推):将 $(Z, \psi)$视为定义中的任意双线性映射,而$(U \otimes V, \varphi)$视为张量积母体。根据泛性,存在唯一的线性映射$\sigma: U \otimes V \to Z$,使得:
$$ \psi = \sigma \circ \varphi $$
- 第二步(逆推):反过来,将 $(U \otimes V, \varphi)$视为任意双线性映射,而$(Z, \psi)$视为张量积母体。根据泛性,存在唯一的线性映射$\tau: Z \to U \otimes V$,使得:
$$ \varphi = \tau \circ \psi $$
- 第三步(复合与自反):将两式互相代入,有:
$$ \psi = \sigma \circ (\tau \circ \psi) = (\sigma \circ \tau) \circ \psi $$
$$ \varphi = \tau \circ (\sigma \circ \varphi) = (\tau \circ \sigma) \circ \varphi $$
对应的交换图表如下:

第四步(利用唯一性一锤定音):
如果我们把 $\psi$映射到自身$\psi: U \times V \to Z$,根据泛性,能使图表交换的线性映射是唯一的。显然,恒等映射 $\text{id}_Z$ 满足条件。
但是第三步中我们发现 $\sigma \circ \tau$ 也满足条件($(\sigma \circ \tau) \circ \psi = \psi$)。
由于这种线性映射的唯一性,这两个映射必须相等:
$$ \sigma \circ \tau = \text{id}_Z $$
同理可证:
$$ \tau \circ \sigma = \text{id}_{U \otimes V} $$
结论:$\sigma$与$\tau$互为逆映射,因此$\sigma: U \otimes V \to Z$ 是一个线性同构。这说明任何满足泛性的张量积空间在代数结构上是完全相同的。
第三部分:有限维线性空间张量积的“存在性”与具体基底验证
唯一性证明完毕后,我们必须要确定这样的空间切实存在。对于有限维空间,我们可以直接利用上一节构造的双线性泛函空间 $T_2(U^, V^)$ 作为其实体模型,并验证它完全符合上述泛性公理。
1. 实体模型的引入与双线性验证
定义具体空间 $U \otimes V = T_2(U^, V^)$。定义具体的初始映射为:
$$ \varphi: U \times V \to U \otimes V, \quad (\alpha, \beta) \mapsto \alpha \otimes \beta $$
其中 $(\alpha \otimes \beta)(\xi^, \eta^) = \xi^(\alpha)\eta^(\beta)$。
极易验证 $\varphi$满足对各项自变量的加法分配律与数乘交织律,因此$\varphi$ 确为双线性映射。
2. 利用基底证明该模型满足泛性(核心推导)
要证明这个具体模型满足泛性,我们需要对任意双线性映射 $\psi: U \times V \to W$,显式地构造出那个唯一的线性映射 $\sigma: U \otimes V \to W$。
取基底与对偶基:设 ${\alpha_1, \dots, \alpha_m}$和${\beta_1, \dots, \beta_n}$分别是$U, V$ 的基。由前述知识可知,${\alpha_i \otimes \beta_j}$构成了具体空间$T_2(U^, V^)$ 的一组基。
显式规定线性映射的像:
普通线性代数定理告诉我们:一个线性映射只要规定好它在一组基上的取值,这个线性映射就被唯一确定。
因此,为了强行让 $\sigma(\varphi(\alpha_i, \beta_j)) = \psi(\alpha_i, \beta_j)$成立,我们别无选择,必须直接定义$\sigma$ 在基底上的取值为:
$$ \sigma(\alpha_i \otimes \beta_j) \triangleq \psi(\alpha_i, \beta_j), \quad \forall i, j $$
由于 ${\alpha_i \otimes \beta_j}$是基,这样一个线性映射$\sigma: U \otimes V \to W$ 存在且唯一。
验证任意向量的图表交换性:
由于线性映射 $\sigma \circ \varphi$与双线性映射$\psi$在基向量对${\alpha_i}$与${\beta_j}$ 上的作用结果完全一致,两边的度量矩阵项完全相同。根据线性扩张原理,它们在全空间的所有任意向量上必然也处处相等:
$$ \sigma \circ \varphi = \psi $$
总结:这完成了逻辑的闭环——我们不仅通过宏观的“泛性”公理规定了张量积应该具有的完美形态,还通过具体的“对偶空间双线性泛函”在有限维情况下完美地把这个空间实现了出来。