LOADING

加载过慢请开启缓存 浏览器默认开启

Logic の 博客

一小块凝固的时间

2.曲线积分、曲面积分

2026/4/19

之前的积分区域还算好看,但有时候我们需要在曲线、曲面上积分。

第一型曲线积分

1. 第一型曲线积分的定义

对于空间曲线 $L$,若其参数方程为:

$$ \begin{cases} x = x(t) \\ y = y(t) \\ z = z(t) \end{cases} \quad t \in [\alpha, \beta], \quad \beta > \alpha $$

且满足 $x, y, z \in C^1([\alpha, \beta])$(一阶连续可导),且切向量 $(x’(t), y’(t), z’(t)) \neq \vec{0}$。

则函数 $f(x, y, z)$沿曲线$L$ 的第一型曲线积分为:

$$ \int_L f(x, y, z) \, ds = \int_{\alpha}^{\beta} f(x(t), y(t), z(t)) \sqrt{[x'(t)]^2 + [y'(t)]^2 + [z'(t)]^2} \, dt $$

关键点: 积分路径是从 $A$点到$B$ 点,强调“无折返”。


2. 参数变换的不变性

引入新参数 $\tau$的情况。设$t = t(\tau)$,其中 $\tau \in [a, b]$。

情况 ①:$t’(\tau) > 0$(正向变换)

此时 $t(a) = \alpha$,$t(b) = \beta$。积分变换后:

$$ \int_a^b f(P(t(\tau))) \sqrt{[x'(t)]^2 + [y'(t)]^2 + [z'(t)]^2} \cdot t'(\tau) \, d\tau $$

情况 ②:$t’(\tau) < 0$(逆向变换)

此时 $t(a) = \beta$,$t(b) = \alpha$。虽然积分限颠倒了,但由于弧微分 $ds$包含绝对值项$|t’(\tau)|$,最终结果依然保持一致:

$$ \int_a^b f(P(t(\tau))) \sqrt{(x')^2 + (y')^2 + (z')^2} \cdot |t'(\tau)| \, d\tau $$

这是第一型曲线积分的特性,无方向性,正着走反着走结果一样。

第二型曲线积分

一、 物理背景:变力做功

第二型曲线积分最直观的物理来源是计算一个变力 $\vec{F}$沿曲线$L$所做的功$W$。

  • 离散化思想:将曲线划分为 $n$个微小段$\Delta \vec{r}_i$,在每一小段上力近似不变。

$$ W \approx \sum_{i=1}^{n} \vec{F}_i \cdot \Delta \vec{r}_i $$

  • 极限过程:当切分无限细时,得到精确的功:

$$ W = \int_{L} \vec{F}(x, y, z) \cdot d\vec{r} $$


二、 核心性质

类似其他积分:

  1. 线性(Linearity)

$$ \int_{L} (a\vec{F} + b\vec{G}) \cdot d\vec{r} = a\int_{L} \vec{F} \cdot d\vec{r} + b\int_{L} \vec{G} \cdot d\vec{r} $$

  1. 有向性(Directionality):这是与第一型积分最大的区别。

$$ \int_{A \to B} \vec{F} \cdot d\vec{r} = -\int_{B \to A} \vec{F} \cdot d\vec{r} $$

结论:积分结果取决于路径的方向,方向反转,结果取负。

  1. 分段可加性

    若路径 $C$由$C_1$和$C_2$ 首尾相连组成,则:

$$ \int_{C} \vec{F} \cdot d\vec{r} = \int_{C_1} \vec{F} \cdot d\vec{r} + \int_{C_2} \vec{F} \cdot d\vec{r} $$


三、 定义与表达形式

第二型曲线积分通常有三种等价的数学面孔:

  • 向量形式:$\int_{L} \vec{F} \cdot d\vec{r}$

  • 坐标形式(分量形式)

    设 $\vec{F} = (P, Q, R)$,位移元 $d\vec{r} = (dx, dy, dz)$,则:

$$ \int_{L} P \, dx + Q \, dy + R \, dz $$

  • 与第一型的转换(投影形式)

$$ \int_{L} \vec{F} \cdot d\vec{r} = \int_{L} (|\vec{F}| \cos \theta) \, ds $$

其中 $\theta$ 是力场与曲线切线方向的夹角。


四、 计算方法:参数化法

将曲线积分转化为定积分的核心步骤是 “统一变量”

已知条件

  • 曲线 $L$ 的参数方程:$x=x(t), y=y(t), z=z(t)$

  • 参数范围:$t: \alpha \to \beta$(注意:$\alpha$对应起点$A$,$\beta$对应终点$B$)

计算步骤

  1. 计算微分项:$dx = x’(t)dt, \quad dy = y’(t)dt, \quad dz = z’(t)dt$

  2. 代入积分式:

$$ \int_{L} \vec{F} \cdot d\vec{r} = \int_{\alpha}^{\beta} \left[ P(x(t), y(t), z(t))x'(t) + Q(\dots)y'(t) + R(\dots)z'(t) \right] dt $$


计算第二型积分时,不需要像第一型那样在根号下平方求和,也不强制要求积分下限小于上限,积分限必须严格遵循路径的起点到终点

最后我们指出第一型曲线积分与第二型曲线积分之间的联系。虽然两类曲线积分的定义不同,但在一定条件下可以互相转化。

当曲线 $L$ 用参数方程

$$ \begin{cases} x = x(t), \\ y = y(t), \quad \alpha \le t \le \beta \\ z = z(t), \end{cases} $$

表出时,$(x’(t), y’(t), z’(t))$ 是曲线的切向量,因而

$$ d\mathbf{r} = (dx, dy, dz) = (x'(t), y'(t), z'(t)) dt $$

也是切向量,且其方向与积分路径的方向一致。又 $d\mathbf{r}$ 的模正好是弧微分,即

$$ |d\mathbf{r}| = \sqrt{(dx)^2 + (dy)^2 + (dz)^2} = ds $$

设 $d\mathbf{r}$的方向余弦为$\cos\alpha, \cos\beta, \cos\gamma$,则有

$$ (\cos\alpha, \cos\beta, \cos\gamma) = \frac{d\mathbf{r}}{|d\mathbf{r}|} = \left( \frac{dx}{ds}, \frac{dy}{ds}, \frac{dz}{ds} \right) $$

由此得

$$ dx = \cos\alpha ds, \quad dy = \cos\beta ds, \quad dz = \cos\gamma ds $$


因而

$$ \int_{\widehat{AB}} P dx + Q dy + R dz = \int_{\widehat{AB}} (P \cos\alpha + Q \cos\beta + R \cos\gamma) ds $$

其中 $\cos\alpha, \cos\beta, \cos\gamma$为曲线$\widehat{AB}$ 上各点的切线(且其方向与积分方向一致)的方向余弦。

上式刻画了两类曲线积分的关系。需要注意的是,式中 $\cos\alpha, \cos\beta, \cos\gamma$ 与曲线的方向有关。当曲线的方向改变时,$\cos\alpha, \cos\beta, \cos\gamma$ 都要改变符号。

对于平面曲线,上述公式变成下列形式:

$$ \int_{\widehat{AB}} P dx + Q dy = \int_{\widehat{AB}} (P \cos\alpha + Q \cos\beta) ds $$

其中 $\cos\alpha, \cos\beta$是曲线$\widehat{AB}$上各点处与$\widehat{AB}$ 同方向的切线的方向余弦。


从曲线漫步到曲面攀升,我们实际上是将“一元参数化”升级为了“二元映射”。核心矛盾:如何将弯曲的、在三维空间中延展的面积,准确地投影(或拉回)到平坦的二维参数平面上?

我们可以把这个过程拆解为两个阶段:从最直观的“投影法”,到更具一般性的“参数映射法”。


第一型曲面积分

对于一个显式定义的曲面 $S: z = f(x, y)$,其积分区域在 $xy$平面上的投影为$D$。

$$ \iint_S F(x, y, z) \, dS $$

即为第一型曲面积分,$dS$ 是面积微元,并不带有方向。

1. 面积微元的几何补偿

想象曲面上的一块极其微小的面积 $dS$。如果你直接用它在底面上的投影 $d\sigma = dx dy$ 来代替它,你显然低估了它的实际大小,因为曲面是有“斜度”的。

推导的核心在于:

$$ dS = \sqrt{1 + f_x^2 + f_y^2} \, d\sigma $$

这里的根号项本质上是割线(Secant) 的概念(这坨实际上就是一个叉乘)。如果 $\gamma$是曲面法向量与$z$ 轴正方向的夹角,那么:

$$ dS = \frac{d\sigma}{|\cos \gamma|} $$

这是一种“投影补偿”。你站在高处俯瞰(投影到 $D$),必须乘以一个放大系数,才能还原出斜坡的真实面积。具体的公式如下:

2. 计算公式

$$ \iint_S F(x, y, z) \, dS = \iint_D F(x, y, f(x, y)) \sqrt{1 + f_x^2 + f_y^2} \, dx dy $$

为什么是根号下那一坨呢,实际上还是从叉乘得到,一如重积分。


二、 参数化曲面:微观线性化

当曲面不再是简单的 $z=f(x, y)$,而是更广义的参数方程 $\vec{r}(u, v) = (x(u, v), y(u, v), z(u, v))$ 时,投影法就失效了。这时需要用到叉积推导

1. 局部切平面的“拉伸”

在 $(u, v)$平面上一个小矩形$du \cdot dv$,映射到空间中会变成一个近似的平行四边形。

  • 其两条边向量分别为切向量:$\vec{r}_u du$和$\vec{r}_v dv$。

  • 这一小块面积 $dS$ 恰好等于这两个向量叉积的模:

$$ dS = |\vec{r}_u \times \vec{r}_v| \, du dv $$

2. 雅可比行列式的几何化

定义 $A, B, C$ :

$$ A = \frac{\partial(y, z)}{\partial(u, v)}, \quad B = \frac{\partial(z, x)}{\partial(u, v)}, \quad C = \frac{\partial(x, y)}{\partial(u, v)} $$

最终的面积微元系数即为 $\sqrt{A^2 + B^2 + C^2}$。这与曲线积分中的 $\sqrt{x’^2 + y’^2}$ 在结构上具有高度的自洽性。这看起来有点难算,可以换一个办法算,也许会好算一点。

为了避开复杂的叉积行列式计算,我们引入了三个标量函数。设参数曲面为 $\vec{r}(u, v)$,其偏导向量(切向量)为 $\vec{r}_u$和$\vec{r}_v$:

  • $E = \vec{r}_u \cdot \vec{r}_u = x_u^2 + y_u^2 + z_u^2$:衡量 $u$ 方向的长度拉伸。

  • $F = \vec{r}_u \cdot \vec{r}_v = x_u x_v + y_u y_v + z_u z_v$:衡量 $u, v$ 参数线之间的夹角(正交性)。

  • $G = \vec{r}_v \cdot \vec{r}_v = x_v^2 + y_v^2 + z_v^2$:衡量 $v$ 方向的长度拉伸。

然后利用:

$$ |\vec{r}_u \times \vec{r}_v|^2 = |\vec{r}_u|^2 |\vec{r}_v|^2 (1 - \cos^2 \theta) = |\vec{r}_u|^2 |\vec{r}_v|^2 - (\vec{r}_u \cdot \vec{r}_v)^2 $$

这也就说明:

$$ A^2 + B^2 + C^2 = EG - F^2 $$

那我们就不需要去算行列式叉乘,只要算算点积和平方和,一般来说会好算一点。

$$ S = \iint_{D'} \sqrt{EG - F^2} \, du dv $$

示例

求球面的表面积。

1. 建模:从空间到投影面

首先选取上半球面作为研究对象。

  • 曲面方程:$z = f(x, y) = \sqrt{R^2 - x^2 - y^2}$。

  • 投影区域 $D$:球面在 $xy$平面上的投影是一个圆盘$x^2 + y^2 \leq R^2$。


2. 计算面积微元的“修正系数”

这是最关键的一步。为了求得 $dS = \sqrt{1 + f_x^2 + f_y^2} , dA$,我们需要计算偏导数:

  • $f_x = \frac{-x}{\sqrt{R^2 - x^2 - y^2}}$-$f_y = \frac{-y}{\sqrt{R^2 - x^2 - y^2}}$

代入根号项进行化简:

$$ 1 + f_x^2 + f_y^2 = 1 + \frac{x^2}{R^2 - x^2 - y^2} + \frac{y^2}{R^2 - x^2 - y^2} = \frac{R^2}{R^2 - x^2 - y^2} $$

因此,面积微元为:

$$ dS = \frac{R}{\sqrt{R^2 - x^2 - y^2}} \, dx dy $$


3. 积分转化:极坐标的优雅

直接在直角坐标系下积分会非常痛苦,于是引入极坐标变换($x = r\cos\theta, y = r\sin\theta$):

  • 雅可比行列式补偿:$dx dy \to r , dr d\theta$。

  • 被积函数简化:分母变为 $\sqrt{R^2 - r^2}$。

上半球面积 $S_{\text{up}}$ 的计算过程如下:

$$ S_{\text{up}} = \int_0^{2\pi} d\theta \int_0^R \frac{R}{\sqrt{R^2 - r^2}} r \, dr $$

利用凑微分法 $\int \frac{r}{\sqrt{R^2 - r^2}} dr = -\sqrt{R^2 - r^2}$:

  • 内层积分结果:$[-R\sqrt{R^2 - r^2}] \Big|_0^R = 0 - (-R^2) = R^2$。

  • 外层积分结果:$2\pi \cdot R^2$。

最后,由于这只是上半球,全球面面积 $S_{\text{total}} = 2 \cdot 2\pi R^2 = \mathbf{4\pi R^2}$。


三、 第二型曲面积分:通量的定向

法向量 $\vec{n}$ 为第二型积分埋下了伏笔。

  • 物理本质:流体穿过曲面的通量。

  • 核心差异:第二型积分是有方向的(侧的概念)。

  • 联系公式

$$ \iint_S \vec{F} \cdot d\vec{S} = \iint_S (\vec{F} \cdot \vec{n}) \, dS $$

这说明第二型积分本质上是向量场在曲面法向上的投影权重

法向量如何计算呢,我们考虑两条切线的叉积即可。

$$ \vec{n}=\frac{\vec{r_u}\times \vec{r_v}}{|\vec{r_u}\times \vec{r_v}|} $$

如果显示写出 $z=f(x,y)$比较容易且好算,取$u=x,v=y$ ,那么:

$$ \vec{r_u}=(1,0,f_x),\vec{r_v}=(0,1,f_y) $$

就不难得到法向量:

$$ \vec{n}=\frac{(-f_x,-f_y,1)}{\sqrt{1+f_x^2+f_y^2}} $$

这样会好看不少。当然,我们还是直接考虑一般的情形,代入 $\vec{n}$ 看看:

$$ \iint_S \vec{F} \cdot d\vec{S} = \iint_S (\vec{F} \cdot \vec{n}) \, dS=\iint_S\vec{F}\cdot (\vec{r_u}\times\vec{r_v})d\sigma $$

注意到 $dS$和$d\sigma$的比例系数恰好是$\vec{n}$的分母,也即叉积的模,从而刚好约掉,我们只需要在平整的$u,v$ 平面做一个二重积分就好了。不过仍然需要算个叉积,有点麻烦。

我们可以把形式做的 $fancy$一点,假设$\vec{F} = (P, Q, R)$,参数方程为 $\vec{r}(u, v) = (x(u,v), y(u,v), z(u,v))$,那么混合积可以直接写成:

$$ \iint_{D} \begin{vmatrix} P & Q & R \\ \frac{\partial x}{\partial u} & \frac{\partial y}{\partial u} & \frac{\partial z}{\partial u} \\ \frac{\partial x}{\partial v} & \frac{\partial y}{\partial v} & \frac{\partial z}{\partial v} \end{vmatrix} du dv $$

或者写成分量形式:

$$ \iint_{D} \left( P \frac{\partial(y, z)}{\partial(u, v)} + Q \frac{\partial(z, x)}{\partial(u, v)} + R \frac{\partial(x, y)}{\partial(u, v)} \right) du dv $$

为什么教材常常看到 $P , dydz + Q , dzdx + R , dxdy$呢,为什么写$dydz$而并非$dzdy$呢,实际上这应该是外微分,具体我们会在后面讨论。可以如此简单地考虑,按照$y-z$的顺序叉积刚好是$x$ 正方向,其余坐标同理。

那么具体计算就没什么好说的,完全就是走流程,算叉积,点乘,积分。不过需要注意方向以及对称性化简。

我们可以不动脑子,换球坐标,直接算叉乘然后点乘积分。
也可以考虑对称性,发现法向在上半区和 $dxdy$的方向(即$z$轴)相反,下半区法向则与$z$ 轴点积是正的,于是利用对称性,$z$会变一个号,其他都不变,所以变成两倍的在上半区的积分。然后把$z$写成$f(x,y)$,因为这里只有$dxdy$,所以刚好点乘对应乘$1$ ,然后积分即可。

阅读全文

3.格林,高斯与斯托克斯公式

2026/4/19

对于二维、三维的重积分,我们有没有类似一维的牛顿莱布尼茨公式,有没有类似的分部积分操作呢?

梯度定理

设 $\phi(\vec{r})$ 是一个定义在空间区域上的标量场($C^1$ 连续可微),$L$是空间中从点$A$到点$B$ 的一条光滑曲线,则:

$$ \int_{L} \nabla \phi \cdot d\vec{r} = \phi(B) - \phi(A) $$

这里的 $\nabla \phi \cdot d\vec{r}$就是标量场的全微分$d\phi$。

证明:
设空间曲线 $L$的参数方程为$\vec{r}(t) = (x(t), y(t), z(t))$,其中 $t \in [t_A, t_B]$。

对应地,起点 $A = \vec{r}(t_A)$,终点 $B = \vec{r}(t_B)$。

1. 展开左侧的线积分

根据线积分的定义,我们将 $d\vec{r}$写成$\frac{d\vec{r}}{dt} dt$:

$$ \int_{L} \nabla \phi \cdot d\vec{r} = \int_{t_A}^{t_B} \left( \nabla \phi(\vec{r}(t)) \cdot \frac{d\vec{r}}{dt} \right) dt $$

2. 链式法则的逆运用

观察括号内的点积项。根据多元函数复合求导的链式法则(Chain Rule)

$$ \frac{d}{dt} \phi(\vec{r}(t)) = \frac{\partial \phi}{\partial x} \frac{dx}{dt} + \frac{\partial \phi}{\partial y} \frac{dy}{dt} + \frac{\partial \phi}{\partial z} \frac{dz}{dt} $$

这恰好就是 $\nabla \phi \cdot \frac{d\vec{r}}{dt}$。

所以,积分式可以简化为:

$$ \int_{t_A}^{t_B} \frac{d}{dt} \phi(\vec{r}(t)) \, dt $$

3. 回归一元牛顿-莱布尼茨公式

现在,这就是一个最标准的一元函数对导数的积分。根据微积分基本定理:

$$ \int_{t_A}^{t_B} \frac{d}{dt} \phi(\vec{r}(t)) \, dt = \phi(\vec{r}(t_B)) - \phi(\vec{r}(t_A)) $$

代入终点 $B$和起点$A$ 的坐标,得证:

$$ \int_{L} \nabla \phi \cdot d\vec{r} = \phi(B) - \phi(A) $$


不管里面多复杂,总之满足如此的条件我们就只需要管边界值,这给予了十分的便利。
那么对于一般一些的函数有什么类似的方法写成边界值吗?或者我们看这样一个积分:

烦人的积分

求空间曲线积分:

$$ I = \oint_L (z^2 - y^2)dx + (x^2 - z^2)dy + (y^2 - x^2)dz $$

其中 $L$为球面$x^2 + y^2 + z^2 = 1$在第一卦限的边界,方向为$A(1,0,0) \to B(0,1,0) \to C(0,0,1) \to A$。


怎么办,要分成三段算吗,很麻烦诶。实际上可以利用所谓的 Stokes 公式转化成面积分从而简化,我们先直接给出 Stokes 公式体验一下,后续会详细一些地论述。

解题步骤

1. 旋度计算 (Curl)

设向量场 $\mathbf{F} = (P, Q, R) = (z^2 - y^2, x^2 - z^2, y^2 - x^2)$。根据 Stokes 公式 $\oint_L \mathbf{F} \cdot d\mathbf{r} = \iint_\Sigma (\nabla \times \mathbf{F}) \cdot d\mathbf{S}$,计算旋度:

$$ \nabla \times \mathbf{F} = \begin{vmatrix} \mathbf{i} & \mathbf{j} & \mathbf{k} \\ \frac{\partial}{\partial x} & \frac{\partial}{\partial y} & \frac{\partial}{\partial z} \\ z^2-y^2 & x^2-z^2 & y^2-x^2 \end{vmatrix} $$

  • $x$ 分量:$\frac{\partial R}{\partial y} - \frac{\partial Q}{\partial z} = 2y - (-2z) = 2(y+z)$

  • $y$ 分量:$\frac{\partial P}{\partial z} - \frac{\partial R}{\partial x} = 2z - 0 = 2z$(注意此处$R$不含$x$,且 $\mathbf{j}$项需取负号):应该是$2z - (-2x) = 2(z+x)$

  • $z$ 分量:$\frac{\partial Q}{\partial x} - \frac{\partial P}{\partial y} = 2x - (-2y) = 2(x+y)$

得到:$\nabla \times \mathbf{F} = (2(y+z), 2(z+x), 2(x+y))$。

2. 选取积分曲面 $\Sigma$取$\Sigma$为球面$x^2 + y^2 + z^2 = 1$在第一卦限的部分。其单位外法向量为$\mathbf{n} = (x, y, z)$。

计算 $(\nabla \times \mathbf{F}) \cdot \mathbf{n}$:

$$ (\nabla \times \mathbf{F}) \cdot \mathbf{n} = 2(y+z)x + 2(z+x)y + 2(x+y)z = 4(xy + yz + zx) $$

3. 利用对称性化简

由于曲面 $\Sigma$在第一卦限关于$x, y, z$ 完全对称,积分可以简化为:

$$ I = \iint_\Sigma 4(xy + yz + zx) dS = 12 \iint_\Sigma xy \, dS $$

4. 坐标投影与积分

在球面上,利用参数方程 $x = \sin\phi \cos\theta, y = \sin\phi \sin\theta, dS = \sin\phi , d\phi d\theta$。

第一卦限范围:$\theta \in [0, \pi/2], \phi \in [0, \pi/2]$。

$$ \iint_\Sigma xy \, dS = \int_0^{\pi/2} \sin\theta \cos\theta \, d\theta \int_0^{\pi/2} \sin^3\phi \, d\phi $$

  • $\theta$ 部分:$\int_0^{\pi/2} \sin\theta \cos\theta , d\theta = \left[ \frac{1}{2}\sin^2\theta \right]_0^{\pi/2} = \frac{1}{2}$

  • $\phi$ 部分:$\int_0^{\pi/2} \sin^3\phi , d\phi = \frac{2}{3}$(利用$\sin^3\phi = \sin\phi(1-\cos^2\phi)$ 或 Walli’s 公式)

5. 最终结果

$$ I = 12 \times \left( \frac{1}{2} \times \frac{2}{3} \right) = 12 \times \frac{1}{3} = \mathbf{4} $$

可以看到,虽然还是有一定的计算量,但我们不需要算三条线,这大约很让人宽慰,至少在我感觉是如此。可以看到, Stokes 公式实际上把边界的积分转化为内部的积分,但这有时候会带来相当的便利。下面,我们先看 Stokes 的二维版本,也就是所谓 Green 公式。


格林公式

$$ \oint_{\partial D^+}Pdx+Qdy=\iint_D(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y})dxdy $$

下面我们给出证明:

第一阶段:特殊区域(单连通、凸区域)的证明

我们首先证明在一个标准区域(例如在 $y$方向上由两条函数曲线$y = \phi_1(x)$和$y = \phi_2(x)$ 围成的区域)内,公式的半部分成立。

1. 目标等式

证明关于 $P$ 的分量:

$$ \oint_{\partial D^+} P \, dx = \iint_D -P_y \, dx \, dy $$

2. 推导过程

利用微积分基本定理,对二重积分进行累次积分:

$$ \begin{aligned} \iint_D \frac{\partial P}{\partial y} \, dx \, dy &= \int_a^b \left( \int_{\phi_1(x)}^{\phi_2(x)} \frac{\partial P}{\partial y} \, dy \right) dx \\ &= \int_a^b [P(x, \phi_2(x)) - P(x, \phi_1(x))] \, dx \end{aligned} $$

对应的边界曲线积分 $\oint_{\partial D^+} P , dx$ 分为四部分:

  • 底边和顶边:沿 $y=\phi_1(x)$的积分为$\int_a^b P(x, \phi_1(x)) , dx$;沿 $y=\phi_2(x)$(反向)为 $-\int_a^b P(x, \phi_2(x)) , dx$。

  • 侧边:由于侧边上 $dx = 0$,故积分为 0。

合并即得:

$$ \oint_{\partial D^+} P \, dx = -\iint_D P_y \, dx \, dy $$

同理可证 $\oint_{\partial D^+} Q , dy = \iint_D Q_x , dx , dy$。


第二阶段:复杂区域的拆解

如果区域 $D$形状复杂(非凸或非标准),我们通过辅助线将其切割成若干个小标准区域$D_1, D_2, \dots, D_n$。

  • 体积分相加:$\iint_D = \sum \iint_{D_i}$。

  • 线积分抵消:当你把所有小区域的边界积分 $\oint_{\partial D_i^+}$相加时,内部的辅助线会被经过两次,且方向相反,因此内部积分全部抵消,只剩下最外层的边界$\partial D^+$。


第三阶段:多连通区域(有洞的区域)

正向边界的定义

  • 规则:当你沿着边界前进时,区域 $D$ 始终在你的左侧

  • 结论:对于多连通区域,外边界 $L_0$是逆时针的,而内部的所有“洞”边界$L_i$ 必须是顺时针的。


通过在洞与外边界之间拉起“切口”线(辅助线),多连通区域可以被看作一个复杂的单连通区域,从而使格林公式依然成立:

$$ \oint_{\partial D^+} P \, dx + Q \, dy = \sum_{i=0}^n \oint_{L_i} P \, dx + Q \, dy = \iint_D (Q_x - P_y) \, dx \, dy $$

应用

例如,可以利用格林公式(Green’s Theorem) 的一个精巧推论来计算平面图形的面积。

这种方法的本质是:将“对面积的积分”转化为“沿边界的环流积分”,这在处理复杂边界时往往比直接做二重积分更优雅。

格林公式求面积

根据格林公式:

$$ \oint_{\partial D^+} (P \, dx + Q \, dy) = \iint_D \left( \frac{\partial Q}{\partial x} - \frac{\partial P}{\partial y} \right) \, dA $$

如果我们巧妙地构造 $P$和$Q$,使得 $\frac{\partial Q}{\partial x} - \frac{\partial P}{\partial y} = 1$,那么右侧的二重积分就直接等于区域 $D$的面积$S(D)$。

采用最对称的一种构造:

  • 令 $P = -\frac{1}{2}y, \quad Q = \frac{1}{2}x$

  • 验证:$\frac{\partial Q}{\partial x} - \frac{\partial P}{\partial y} = \frac{1}{2} - (-\frac{1}{2}) = 1$

由此得到面积计算公式

$$ S(D) = \iint_D \, dx \, dy = \frac{1}{2} \oint_{\partial D^+} (x \, dy - y \, dx) $$

只要沿着一个图形走一圈,就能知道包住的面积,想想还是很神奇的。

椭圆面积的计算

计算区域 $D = { \frac{x^2}{a^2} + \frac{y^2}{b^2} \le 1 }$ 的面积。

步骤一:参数化边界

椭圆边界 $\partial D^+$ 的参数方程为:

$$ \begin{cases} x = a \cos \theta \\ y = b \sin \theta \end{cases} \quad (\theta \in [0, 2\pi]) $$

对应的微分项为:

$$ \begin{cases} dx = -a \sin \theta \, d\theta \\ dy = b \cos \theta \, d\theta \end{cases} $$

步骤二:代入环流量积分

将参数化后的项代入公式:

$$ \begin{aligned} S(D) &= \frac{1}{2} \oint_{\partial D^t} (x \, dy - y \, dx) \\ &= \frac{1}{2} \int_{0}^{2\pi} \left[ (a \cos \theta)(b \cos \theta \, d\theta) - (b \sin \theta)(-a \sin \theta \, d\theta) \right] \\ &= \frac{1}{2} \int_{0}^{2\pi} (ab \cos^2 \theta + ab \sin^2 \theta) \, d\theta \\ &= \frac{1}{2} ab \int_{0}^{2\pi} (\cos^2 \theta + \sin^2 \theta) \, d\theta \end{aligned} $$

步骤三:得出结论

利用三角恒等式 $\cos^2 \theta + \sin^2 \theta = 1$:

$$ S(D) = \frac{1}{2} ab \int_{0}^{2\pi} 1 \, d\theta = \frac{1}{2} ab \cdot 2\pi = \pi ab $$

多么美妙。
但是格林公式显然需要函数可导,万一区域里出了个叛徒不可导怎么办?这就是所谓奇点。我们先抛出这个问题:

$P = \frac{-(x+y)}{x^2+y^2}$,$Q = \frac{x-y}{x^2+y^2}

$$ $\oint_C Pdx + Qdy = \iint_D \left( \frac{\partial Q}{\partial x} - \frac{\partial P}{\partial y} \right) dA $$

如果 $D$ 包含了原点怎么办呢?是不是用不了格林公式?请听下回分解。


高斯公式

从格林公式,我们可以玩出一个新公式,减号看起来有点不对称,如果把环路积分变成减号,相应的面积分也就变成加号了:

$$ \oint_{L} (P dy - Q dx) = \iint_{D} (P_x + Q_y) \, dx dy $$

这也就是二维的高斯公式。二维高斯公式建立了闭合曲线上的法向通量与区域内散度累积之间的关系。我们可以把左侧的积分写成点积,然后加上一个fancy的符号 $\nabla$ 。$\nabla$ 可以看做向量$(\frac{\partial}{\partial x},\frac{\partial}{\partial y},\frac{\partial}{\partial z})

$$ $\oint_{L} (\vec{v} \cdot \vec{n}^+) \, ds = \iint_{D} (\nabla \cdot \vec{v}) \, dx dy $$

泊松方程解的唯一性

我们可以拿上述的二维高斯公式整点活。

设 $u \in C^2(D)$,$L = \partial D$(其中 $\vec{n}$ 为单位外法向量)。

根据散度定理(高斯公式在二维的体现):

$$ \oint_L (\nabla u \cdot \vec{n}) \, ds = \iint_D (\nabla \cdot (\nabla u)) \, dx dy = \iint_D \Delta u \, dx dy $$

(注:此处 $\Delta u = u_{xx} + u_{yy}$ 为拉普拉斯算子)


设定:

令 $u = \tilde{f}^2$,则其梯度与拉普拉斯算子分别为:

  • $\nabla u = 2\tilde{f} \nabla \tilde{f}$-$\Delta u = 2|\nabla \tilde{f}|^2 + 2\tilde{f} \Delta \tilde{f}$

代入:

$$ \oint_L (\tilde{f} \nabla \tilde{f}) \cdot \vec{n} \, ds = \iint_D (|\nabla \tilde{f}|^2 + \tilde{f} \Delta \tilde{f}) \, dx dy $$

若左边积分项为 $0$且$\Delta \tilde{f} = 0$,则推导出:

$$ \iint_D |\nabla \tilde{f}|^2 \, dx dy = 0 $$

Poisson 方程描述:

在区域 $D$ 内满足:

$$ \begin{cases} \Delta f = h & \text{在 } D \text{ 内} \\ f = g & \text{在 } \partial D \text{ 上} \end{cases} $$

唯一性证明思路:

假如有两个解 $f_1, f_2$,记误差函数 $\tilde{f} = f_1 - f_2$,则 $\tilde{f}$ 满足:

$$ \begin{cases} \Delta \tilde{f} = 0 & \text{在 } D \text{ 内} \\ \tilde{f} = 0 & \text{在 } \partial D \text{ 上} \end{cases} $$

结合前述推导,由于 $\iint_D |\nabla \tilde{f}|^2 , dx dy = 0$,在连续性条件下必有 $\nabla \tilde{f} = 0$,即 $\tilde{f}$为常数。又因边界处$\tilde{f}=0$,故在全域内 $\tilde{f} = 0$,即 $f_1 = f_2$(解是唯一的)


4. 第二类曲线积分与路径无关性

命题:

设 $D$ 是单连通区域,$P, Q \in C^1(D)$。

以下两个论断等价:

  1. 路径无关性: 曲线积分 $\int_A^B P , dx + Q , dy$与连接$A, B$的路径无关(其中$A, B \in D$)。

  2. 环路动量为零: 对 $D$ 内任意分段光滑的闭曲线(Jordan 闭曲线)$L$,均有:

$$ \oint_L P \, dx + Q \, dy = 0 $$


斯托克斯公式的证明

设 $P, Q, R \in C^1(S)$,我们要证明:

$$ \oint_{L^+} \vec{F} \cdot d\vec{r} = \iint_{S^+} (\nabla \times \vec{F}) \cdot \vec{n}^+ \, dS $$

1. 证明目标分解

只需证明分量形式:

$$ \oint_{L^+} P \, dx = \iint_{S^+} (P_z \, dz \wedge dx - P_y \, dx \wedge dy) $$

这里的 $\wedge$是所谓外微分,这在后续笔记中将简单提到,可以先简单理解成代表了方向的$dzdx$ 。

2. 参数化表达

引入参数方程 $(u, v) \to \vec{r}(u, v)$,其中:

$$ \begin{cases} x = x(u, v) \\ y = y(u, v) \\ z = z(u, v) \end{cases} $$

对应的法向量微元 $\vec{du} \wedge \vec{dv} \approx \vec{n}^+ , dS$。

3. 推导过程

利用复合函数求导法则与格林公式:

$$ \begin{aligned} \oint_{L^+} P \, dx &= \oint_{L^{'+}} P(x_u \, du + x_v \, dv) \\ &= \oint_{L^{'+}} (P x_u) \, du + (P x_v) \, dv \\ &= \iint_{D'} \left[ (P x_v)_u - (P x_u)_v \right] \, du \, dv \\ &= \iint_{D'} (P_u x_v - P_v x_u) \, du \, dv \\ &= \iint_{D'} \left[ (P_x x_u + P_y y_u + P_z z_u) x_v - (P_x x_v + P_y y_v + P_z z_v) x_u \right] \, du \, dv \\ &= \iint_{D'} \left[ -P_y (x_u y_v - x_v y_u) + P_z (z_u x_v - z_v x_u) \right] \, du \, dv \\ &= \iint_{D'} (P_z B + (-P_y) C) \, du \, dv \end{aligned} $$

其中:

  • $C = \frac{\partial(x, y)}{\partial(u, v)} = x_u y_v - x_v y_u$-$B = \frac{\partial(z, x)}{\partial(u, v)} = z_u x_v - z_v x_u$

对比即知与

$$ \iint_{S^+} (P_z \, dz \wedge dx - P_y \, dx \wedge dy) $$

一致。同理可证明其他分量也满足该形式,故斯托克斯公式得证。


无旋场、无散场

无旋、无散场有一定的美好的性质,但对于一个任意的函数,往往并不能直接满足无旋、无散,如何应用我们得到的性质呢?实际上我们可以做一个分解。


Hodge 分解定理证明(三维区域 $\Omega$)

1. 分解目标的设定

设 $\vec{F} \in C^1(\Omega)$,我们要寻找 $\vec{F}_1, \vec{F}_2$ 使得:

  1. 分解性:$\vec{F} = \vec{F}_1 + \vec{F}_2 = \nabla u + \nabla \times \vec{G}$

  2. 场特性:$\nabla \times \vec{F}_1 = 0$(无旋);$\nabla \cdot \vec{F}_2 = 0$且在边界上$\vec{F}_2 \cdot \vec{n} = 0$(无源且切向)。

  3. 正交性:$\iiint_{\Omega} \vec{F}_1 \cdot \vec{F}_2 , dV = 0$

2. 构造过程(引入 Neumann 边界)

为了确定 $\vec{F}_1 = \nabla u$,我们利用 $\vec{F}_2$ 的无源特性:

$$ \nabla \cdot \vec{F}_2 = \nabla \cdot (\vec{F} - \nabla u) = 0 \implies \nabla^2 u = \nabla \cdot \vec{F} $$

这就是在 $\Omega$ 内的 Poisson 方程。为了保证分解的唯一性并消除边界干扰,我们引入 Neumann 边界条件

$$ \left. \frac{\partial u}{\partial n} \right|_{\partial \Omega} = \nabla u \cdot \vec{n} = \vec{F} \cdot \vec{n} $$

  • 存在性:根据偏微分方程理论,上述边值问题的解 $u$ 存在且在差一个常数的意义下唯一。

  • 推论:确定了 $u$ 之后,$\vec{F}_1 = \nabla u$唯一确定,则$\vec{F}_2 = \vec{F} - \vec{F}_1$自动满足$\nabla \cdot \vec{F}_2 = 0$。

3. 正交性证明(核心计算)

验证 $\vec{F}_1$与$\vec{F}_2$的$L^2$ 内积为 0:

$$ \begin{aligned} \iiint_{\Omega} \vec{F}_1 \cdot \vec{F}_2 \, dV &= \iiint_{\Omega} \nabla u \cdot \vec{F}_2 \, dV \\ &= \iiint_{\Omega} \left[ \nabla \cdot (u \vec{F}_2) - u (\nabla \cdot \vec{F}_2) \right] \, dV \\ &= \iint_{\partial \Omega} u (\vec{F}_2 \cdot \vec{n}) \, dS - \iiint_{\Omega} u (\nabla \cdot \vec{F}_2) \, dV \end{aligned} $$

根据构造条件:

  • 由 Poisson 方程知 $\nabla \cdot \vec{F}_2 = 0$,故体积分项为 0

  • 由 Neumann 边界条件知 $\vec{F}_2 \cdot \vec{n} = (\vec{F} - \nabla u) \cdot \vec{n} = 0$,故面积分项为 0

结论:$\iiint_{\Omega} \vec{F}_1 \cdot \vec{F}_2 , dV = 0$,证明了分解的正交性。

阅读全文

4.奇点

2026/4/19

问题

考虑向量场 $\vec{F} = \left( \frac{-y}{x^2+y^2}, \frac{x}{x^2+y^2} \right)$:

  • 数学陷阱:计算可知 $\frac{\partial Q}{\partial x} = \frac{\partial P}{\partial y} = \frac{y^2-x^2}{(x^2+y^2)^2}$,看起来场是“无旋”的。

  • 直觉误区:如果直接套用格林公式,结论似乎应该是环流量为 $0$。

  • 事实:但在原点 $(0,0)$处,函数分母为$0$,场不存在。如果闭合曲线包围了原点,实际积分为 $2\pi$而非$0$。当然,如果不包含原点,积分便恒为 $0$ 。


处理策略:“挖洞”法 (Excising the Singularity)

当区域 $D$内包含奇点时,格林公式的前提(函数在区域内$C^1$ 连续)不再满足。此时需要手动构造一个多连通区域

  1. 构造内边界:以奇点为圆心,取一个极小的半径 $\epsilon$,构造一个闭合圆周 $\Gamma_{\epsilon}$ 将奇点“挖掉”。

  2. 应用公式:在剩下的区域 $D \setminus D_{\epsilon}$ 内,场是处处连续的,可以应用格林公式:

$$ \iint_{D \setminus D_{\epsilon}} (Q_x - P_y) \, dA = \oint_{L^+} \vec{F} \cdot d\vec{r} + \oint_{\Gamma_{\epsilon}^-} \vec{F} \cdot d\vec{r} = 0 $$

  1. 结果转化:这说明外部大环的积分等于内部小圆周的积分(换了一下 $\Gamma$ 的环流方向):

$$ \oint_{L^+} Pdx+Qdy = \oint_{\Gamma_{\epsilon}^+} Pdx+Qdy $$


计算:参数化极限

对于上述圆形小边界 $\Gamma_{\epsilon}$,利用极坐标极易计算:

  • 令 $x = \epsilon \cos\theta, y = \epsilon \sin\theta$。

  • 代入积分式:$\int_0^{2\pi} \frac{-\epsilon \sin\theta (-\epsilon \sin\theta) + \epsilon \cos\theta (\epsilon \cos\theta)}{\epsilon^2} d\theta = \int_0^{2\pi} 1 , d\theta = 2\pi$。

  • 结论:只要曲线包围了该奇点,无论曲线形状如何,积分值永远是 $2\pi$。

那如果曲线只包含了半个奇点呢?如果只包含了四分之一个奇点呢?
直觉上,把积分上限变一下就好了(

半覆盖或特定角度($\alpha$)—— 分段积分或不完全环绕

  • $\pi$的情况:如果路径仅在半个平面内围绕奇点旋转(例如从极角$0$到$\pi$),线积分的结果往往对应于张角的弧度值。

  • $\alpha$的情况:在更一般的情况下,如果边界曲线在奇点处张开的角度为$\alpha$,积分结果将直接正比于这个局部几何角

虽然说不清楚严谨过程,但这是对的(

Maxwell 方程其一

格林公式会碰到奇点,高斯公式呢?

阅读全文

6.外微分初探

2026/4/19

庞加莱引理

$$ d(d\omega)=0 $$

1. 第一性原理:算符的对易与抵消

在最基础的坐标表示下,假设 $\omega$是一个$0$-形式(即标量函数 $f$),那么:

$$ df = \sum \frac{\partial f}{\partial x_i} dx_i $$

当我们再作用一次 $d$:

$$ d(df) = \sum_{i,j} \frac{\partial^2 f}{\partial x_j \partial x_i} dx_j \wedge dx_i $$

这里发生了两个关键的抵消机制:

  • 解析对称性:根据 Clairaut 定理(或 Schwarz 定理),对二阶全微分而言,求导顺序无关,即 $\frac{\partial^2 f}{\partial x_j \partial x_i} = \frac{\partial^2 f}{\partial x_i \partial x_j}$。

  • 代数反对称性:外积(Wedge product)定义了 $dx_j \wedge dx_i = -dx_i \wedge dx_j$。

对称的系数乘以反对称的基底,求和之后必然为 $0$。这就像是在天平两端放上了完全抵消的砝码,这种消失是逻辑上的必然。

2. 几何直观:边界的边界

如果你偏好直观,庞加莱引理对应的几何事实是:“边界的边界为空”(The boundary of a boundary is empty),即 $\partial(\partial M) = 0$。

根据斯托克斯定理(Stokes’ Theorem):

$$ \int_M d\omega = \int_{\partial M} \omega $$

如果我们把 $d\omega$替换为$d(d\omega)$:

$$ \int_M d(d\omega) = \int_{\partial M} d\omega = \int_{\partial(\partial M)} \omega $$

因为一个区域的边缘(比如球面的边缘)是不存在的,所以右边恒等于 $0$。为了保持数学体系的自洽,左边的 integrand $d^2\omega$必须恒为$0$。

阅读全文

8.常微分方程 II

2026/4/19

解的唯一性和存在性

一阶常微分方程的初值问题

$$ \frac{dy}{dx} = f(x, y), \quad y(x_0) = y_0 $$

已知条件

  1. 函数 $f(x, y)$在某个包含点$(x_0, y_0)$ 的闭矩形区域

$$ R = \{ (x, y) \in \mathbb{R}^2 : |x - x_0| \leq a, |y - y_0| \leq b \} $$

上连续。因此,根据闭区间上连续函数的性质,$f$在$R$上有界,即存在常数$M > 0$,使得对所有 $(x, y) \in R$,有 $|f(x, y)| \leq M$。

  1. 函数 $f(x, y)$在$R$上关于变量$y$满足 Lipschitz 条件:存在常数$L > 0$,使得对于任意 $(x, y_1) \in R$和$(x, y_2) \in R$,都有

$$ |f(x, y_1) - f(x, y_2)| \leq L |y_1 - y_2| $$

在上述条件下,存在唯一的函数 $y = \phi(x)$,定义在某个包含 $x_0$的区间$I$ 上,满足该微分方程及初始条件。

证明

朴素地,我们考虑两边积分,得到:

$$ y=y_0+\int_{x_0}^x f(t,y)dt $$

这就转化为一个所谓积分方程,如何进一步求解呢?利用 Neumann 方法的思想,想到通过迭代或许可以逼近解。先随便猜一个解,例如常值函数 $\phi_0(x)\equiv y_0$ ,这是唯一确定的值,尽管不满足微分方程,我们可以用方程修正结果,我们考虑这样的迭代:

$$ \phi_{n+1}(x) = y_0 + \int_{x_0}^{x} f(t, \phi_n(t)) \, dt, \quad n = 0, 1, 2, \dots $$

这样,如果序列 $\phi_n$ 收敛,那么这个极限也就满足积分方程,从而满足微分方程,这样就可做了。

确保良定义

那么首先,我们知道的约束是 $|x-x_0|\le a$,以及$|\phi_n(x)-y_0|\le b$,那么通过归纳法寻找$h$。假设对$n$ 及之前都满足约束,下一步:

$$ |\phi_{n+1}(x)-y_0|=| \int_{x_0}^x f(t,\phi_n(x))dt | \le \int_{x_0}^x|f(t,\phi_n(x))|dt\le M|x-x_0| $$

那么,为了让 $\phi_{n+1}(x)-y_0\le b$,只要$M|x-x_0|\le b$即可,那么只要选择$Mh\le b$,也就是$h\le b/M$。同时$h$也要满足$h\le a$,那么综合就得到$h=min(a,\frac{b}{M})$。从而在$[x_0-h,x_0+h]$ 上定义都是良的,且图像保持在矩形区域内。

估计相邻迭代

从 $n=1$ 开始:

$$ |\phi_1(x) - \phi_0(x)| = \left| \int_{x_0}^{x} f(t, y_0) \, dt \right| \leq M |x - x_0| $$

对于一般的 $n \geq 1$,利用迭代定义和 Lipschitz 条件,

$$ \begin{aligned} |\phi_{n+1}(x) - \phi_n(x)| &= \left| \int_{x_0}^{x} [f(t, \phi_n(t)) - f(t, \phi_{n-1}(t))] \, dt \right| \\ &\leq \int_{x_0}^{x} |f(t, \phi_n(t)) - f(t, \phi_{n-1}(t))| \, dt \end{aligned} $$

利用 Lipschitz 条件:

$$ \leq L \left| \int_{x_0}^{x} |\phi_n(t) - \phi_{n-1}(t)| \, dt \right| $$

推导
让我们尝试计算前几项来寻找规律。

  • 已知:$|\phi_1(x) - \phi_0(x)| \leq M |x - x_0|$- 计算$|\phi_2(x) - \phi_1(x)|$:

$$ |\phi_2(x) - \phi_1(x)| \leq L \left| \int_{x_0}^{x} M |t - x_0| \, dt \right| = M L \frac{|x - x_0|^2}{2} $$

  • 计算 $|\phi_3(x) - \phi_2(x)|$:

$$ |\phi_3(x) - \phi_2(x)| \leq L \left| \int_{x_0}^{x} M L \frac{|t - x_0|^2}{2} \, dt \right| = M L^2 \frac{|x - x_0|^3}{3!} $$

对于所有 $n \geq 1$和$x \in I$,有以下估计成立:

$$ |\phi_n(x) - \phi_{n-1}(x)| \leq \frac{M L^{n-1}}{n!} |x - x_0|^n \leq \frac{M L^{n-1}}{n!} h^n $$

证明存在性

考虑级数

$$ \sum_{n=1}^{\infty} \max_{x \in I} |\phi_n(x) - \phi_{n-1}(x)| $$

根据估计,这个级数的每一项都被 $\frac{M L^{n-1}}{n!} h^n$ 所控制。

考虑数值级数 $\sum_{n=1}^{\infty} \frac{M L^{n-1}}{n!} h^n$。我们可以用比值判别法来检验其收敛性:

$$ \lim_{n \to \infty} \frac{\frac{M L^n}{(n+1)!} h^{n+1}}{\frac{M L^{n-1}}{n!} h^n} = \lim_{n \to \infty} \frac{L h}{n+1} = 0 $$

由于极限为 0(小于 1),该数值级数收敛。

根据 Weierstrass M-判别法,由于函数项级数的每一项在区间 $I$上的绝对值都被一个收敛的正项级数的对应项所控制,因此该函数项级数在$I$ 上一致收敛

结论
这意味着 Picard 迭代序列 ${\phi_n(x)}$在区间$I$上一致收敛于一个极限函数,记作$\phi(x)$。由于每个 $\phi_n$都是连续的,且收敛是一致的,极限函数$\phi(x)$ 也是连续的。

回忆迭代公式:

$$ \phi_{n+1}(x) = y_0 + \int_{x_0}^{x} f(t, \phi_n(t)) \, dt $$

对等式两边取极限 $n \to \infty$。
左边直接趋于 $\phi(x)$。
对于右边,将极限号移入积分号内,即:

$$ \lim_{n \to \infty} \int_{x_0}^{x} f(t, \phi_n(t)) \, dt = \int_{x_0}^{x} \lim_{n \to \infty} f(t, \phi_n(t)) \, dt = \int_{x_0}^{x} f(t, \phi(t)) \, dt $$

这说明 $\phi(x)$ 满足积分方程,从而是初值问题的一个解。存在性得证。

证明唯一性

推导
假设存在另一个函数 $\psi(x)$ 也满足积分方程:

$$ \psi(x) = y_0 + \int_{x_0}^{x} f(t, \psi(t)) \, dt $$

考虑两个解之差的绝对值 $u(x) = |\phi(x) - \psi(x)|$。将两者满足的积分方程相减并取绝对值:

$$ u(x) = \left| \int_{x_0}^{x} [f(t, \phi(t)) - f(t, \psi(t))] \, dt \right| \leq \left| \int_{x_0}^{x} |f(t, \phi(t)) - f(t, \psi(t))| \, dt \right| $$

再次应用 Lipschitz 条件:

$$ u(x) \leq L \left| \int_{x_0}^{x} |\phi(t) - \psi(t)| \, dt \right| = L \left| \int_{x_0}^{x} u(t) \, dt \right| $$

现在我需要从这个积分不等式推导出 $u(x) \equiv 0$。不失一般性,考虑 $x \geq x_0$的情况。定义$U(x) = \int_{x_0}^{x} u(t) , dt$。那么 $U’(x) = u(x)$。上述不等式变为:

$$ U'(x) \leq L \cdot U(x) $$

移项得 $U’(x) - L U(x) \leq 0$。两边乘以积分因子 $e^{-Lx}$:

$$ \frac{d}{dx} \left( e^{-Lx} U(x) \right) \leq 0 $$

这说明函数 $e^{-Lx} U(x)$在$x \geq x_0$上是单调不增的。在$x = x_0$ 处,$U(x_0) = \int_{x_0}^{x_0} u(t) , dt = 0$。因此,对于所有 $x \geq x_0$,有 $e^{-Lx} U(x) \leq 0$。但由于 $e^{-Lx} > 0$且$U(x) = \int_{x_0}^{x} u(t) , dt \geq 0$,我们得出 $U(x) \leq 0$且$U(x) \geq 0$,故 $U(x) = 0$。

由于 $U(x) = 0$,其导数 $u(x) = U’(x)$也必然为 0(此处$u$是连续的)。所以$u(x) \equiv 0$,即 $\phi(x) = \psi(x)$对所有$x \geq x_0$成立。对于$x \leq x_0$ 的情况,论证类似。

结论:唯一性得证。

如果从高阶的视角来看,我们可以采用所谓 $Banach$ 不动点定理,简单理解就是一个压缩映射在所谓完备度量空间存在唯一不动点。压缩映射指的是映射值的差小于原来的差,也就是映射后两个点距离变小了。完备度量空间是什么且不管。这样的话,也可以清楚地梳理整个证明。

先转化为积分方程,选取合适的区间长度(足够小),让积分方程对应的映射是一个压缩映射(就如上面选一个 $h$ ),然后就可以应用不动点定理。

n 阶线性常微分方程的解结构

这部分确立了线性方程解的基本框架。

  • n 阶线性齐次 ODE:指出若存在 $n$个线性无关的特解$\psi_1, \dots, \psi_n$,则通解可表示为它们的线性组合 $y = C_1\psi_1 + \dots + C_n\psi_n$。此类方程无奇解

  • n 阶非齐次线性 ODE:其通解结构为 $y = \psi^* + C_1\psi_1 + \dots + C_n\psi_n$,其中 $\psi^*$ 是非齐次方程的一个特解。

  • 核心工具预告Wronski 行列式 (Wronskian),用于判定函数组的线性相关性。

二阶线性 ODE 与存在唯一性定理

将讨论具体化到二阶情形。

  • 标准形式

    • 非齐次:$y’’ + p(x)y’ + q(x)y = f(x)$

    • 齐次:$y’’ + p(x)y’ + q(x)y = 0$

  • 解的存在唯一性定理

    若系数 $p(x), q(x)$及$f(x)$在区间$[a, b]$ 上连续,则对于初值问题($x_0 \in [a, b]$),方程在区间上存在且仅有一个唯一的解。

Wronski 行列式的定义与判定

开始推导判定解是否线性无关的数学判据。

  • 定义:对于两个解 $\psi_1, \psi_2$,定义其 Wronski 行列式为:

$$ W(x) = \begin{vmatrix} \psi_1 & \psi_2 \\ \psi_1' & \psi_2' \end{vmatrix} $$

  • 定理核心:$\psi_1, \psi_2$在$(a, b)$上线性无关的充要条件是$W(x) \neq 0$(对于区间内任意 $x$)。

线性相关性的逻辑证明

板书展示了必要性与充分性的证明思路。

  • 反证法/直接推导

    • 若 $\psi_1, \psi_2$线性相关,则存在不全为零的常数$k_1, k_2$使得$k_1\psi_1 + k_2\psi_2 \equiv 0$。

    • 求导得到方程组,由线性代数基础可知,其系数行列式 $W(x)$ 必然恒等于 0。

  • 引申:探讨了 $W(x) \equiv 0$ 与解的线性相关性之间的必然联系。

结论的收束与验证

利用初值问题的唯一性完成最后的逻辑闭环。

  • 唯一性应用

    • 构造一个函数 $Y(x) = C_1\psi_1(x) + C_2\psi_2(x)$。

    • 若 $W(x_0) = 0$,则可以找到一组不全为零的 $C_1, C_2$使得在某点$x_0$ 处的初值为 0。

    • 根据唯一性定理,如果初值为 0 且满足齐次方程,该解在整个区间内必然恒等于 0($Y(x) \equiv 0$)。

  • 最终判定:由此证明了在 ODE 框架下,只要在一点处 $W(x_0) = 0$,则解组必然线性相关;反之若线性无关,则 $W(x)$ 在区间内处处不为 0。

上面的推导中,我们发现只是假定一个点 $W(x)$为$0$就会得到处处为$0$ ,这实际上对线性微分方程都成立。

Wronskian行列式

1. 核心背景

设有一个二阶齐次线性微分方程:

$$ y'' + P(x)y' + Q(x)y = 0 $$

假设 $\varphi_1, \varphi_2$ 是该方程的两个解。

2. 推导逻辑拆解

  • 朗斯基行列式的定义

    首先定义 $W(x)$ 为这两个解的行列式:

$$ W(x) = \begin{vmatrix} \varphi_1 & \varphi_2 \\ \varphi_1' & \varphi_2' \end{vmatrix} = \varphi_1 \varphi_2' - \varphi_2 \varphi_1' $$

  • 对 $W(x)$ 求导

    利用导数的乘法法则(或行列式求导法则):

$$ W'(x) = (\varphi_1 \varphi_2'' + \varphi_1' \varphi_2') - (\varphi_2 \varphi_1'' + \varphi_2' \varphi_1') = \varphi_1 \varphi_2'' - \varphi_2 \varphi_1'' $$

  • 利用原方程进行代换

    因为 $\varphi_1, \varphi_2$满足原方程,可以提取出二阶导数项:$\varphi_i’’ = -P(x)\varphi_i’ - Q(x)\varphi_i$代入后,包含$Q(x)$ 的项会互相抵消,剩下:

$$ W'(x) = \varphi_1 (-P \varphi_2' - Q \varphi_2) - \varphi_2 (-P \varphi_1' - Q \varphi_1) = -P(x) (\varphi_1 \varphi_2' - \varphi_2 \varphi_1') $$

即:

$$ W'(x) = -P(x)W(x) $$

  • 求解一阶线性方程

    这是一个典型的一阶可分离变量微分方程,整理得 $W’(x) + P(x)W(x) = 0$。

    通过积分因子法或分离变量法得到通解:

$$ W(x) = C e^{-\int P(x) dx} $$

若给定初始点 $x_0$,则表达式为:

$$ W(x) = W(x_0) e^{-\int_{x_0}^x P(t) dt} $$


3. 关键结论与直觉

$W$ 不变号”是这个理论在定性分析上的核心价值。

  • 定号性: 由于指数函数 $e^{f(x)}$永远大于零,因此$W(x)$的正负完全取决于初始值$W(x_0)$。

  • 线性无关性的保持: 只要在某一点 $x_0$处两个解线性无关(即$W(x_0) \neq 0$),那么在 $P(x)$ 连续的区间内,它们在任何点都线性无关。反之,如果一点为零,则处处为零。

通解结构定理

  • 核心结论: 若 $\varphi_1, \varphi_2$线性无关,则它们的线性组合$y = C_1\varphi_1 + C_2\varphi_2$ 包含所有解

  • 这意味着这组解构成了解空间的一组基,方程的通解空间是一个二维向量空间。


逻辑推导

为什么上述线性组合能覆盖所有解:

  1. 构造初值问题: 假设方程 $(\star)$有一个任意解$u(x)$。在某点 $x_0$,它满足初值 $y(x_0) = u(x_0)$和$y’(x_0) = u’(x_0)$。

  2. 确定系数: 考虑线性代数方程组:

$$ \begin{cases} C_1\varphi_1(x_0) + C_2\varphi_2(x_0) = u(x_0) \\ C_1\varphi_1'(x_0) + C_2\varphi_2'(x_0) = u'(x_0) \end{cases} $$

因为 $\varphi_1, \varphi_2$线性无关,所以该方程组的行列式(即$W(x_0)$)不为零。根据克莱姆法则,必然存在唯一的一组解 $(C_1^, C_2^)$。

  1. 唯一性收网: * 令 $y(x) = C_1^\varphi_1(x) + C_2^\varphi_2(x)$,它显然也是原方程的解。

    • 由于 $y(x)$和$u(x)$在$x_0$ 点的初值完全相同,根据微分方程解的唯一性定理,必然有 $u(x) \equiv y(x)$
阅读全文

7.常微分方程 I

2026/4/19

微分方程实际上对学过物理的人而言,是相当熟悉的事情,但如何严格化则还应归属于数学,尽管就应用而言,直觉可以解决大部分问题(

从场论到微分方程

在场论中,我们讨论了所谓散度无旋,旋度无源:

$$ \nabla\times(\nabla u)=0,\ \nabla \cdot (\nabla \times G)=0 $$

以及一个函数可以漂亮地分解成某个散度和某个旋度:

$$ F=\nabla u+\nabla \times G $$

Maxwell 方程

如雷贯耳的$Maxwell$方程组的微分形式,实际上就是用$\nabla$ 的语言写成的。这也在场论中提到过。

$$ \begin{cases} \nabla \cdot E = \rho \\ \nabla \cdot B = 0 \\ \nabla \times E = -B_t \\ \nabla \times B = J + E_t \end{cases} $$

正如上面所说,我们可以试着把 $E$ 拆解:

$$ E = \nabla (-U) + \nabla \times\int B\, dt $$

物理上,大概就是静电场和涡旋电场,分别由电势的梯度和变化的磁场产生。
能不能消掉 $B$,得到一个只含$E$ 的方程呢?

波动方程的推导 (Derivation of Wave Equation)

1. 基础方程

推导始于真空(或无源项 $J=0, \rho=0$)中的麦克斯韦方程组:

  • 法拉第感应定律: $\nabla \times E = -B_t$- 安培-麦克斯韦定律:$\nabla \times B = E_t$(注:此处简化了系数,并假设无源$J=0$)
2. 数学推导步骤

对法拉第定律两边同时取旋度(Curl)

$$ \nabla \times (\nabla \times E) = -(\nabla \times B)_t $$

左侧(利用矢量算子恒等式):

$$ \nabla \times (\nabla \times E) = \nabla(\nabla \cdot E) - \Delta E $$

关键点: 在无源区域(真空),由于 $\nabla \cdot E = 0$(由高斯定律得出),左侧简化为 $-\Delta E$

右侧(代入安培定律):

$$ -(\nabla \times B)_t = -(E_t)_t = -E_{tt} $$

3. 最终结论:波动方程

将左右两项合并并消去负号,得到电磁波在空间的演化规律:

$$ E_{tt} = \Delta E $$

展开即为:

$$ E_{tt} = E_{xx} + E_{yy} + E_{zz} $$

物理意义: 这正是一个典型的波动方程(Wave Equation)。它表明电场(和磁场)不需要介质,可以通过自身场的变化在空间中以波的形式传播。

可以看到,这样一个方程全是 $E$ 的导数所满足的方程,也就是物理直觉上的微分方程。数学上如何描述呢,我们先从简单的情形开始——常微分方程,即不带偏导数的微分方程。

常微分方程 (ODE)

基本定义

设定 $x$ 为一个自变量,$y$为因变量,以及$y$的各阶导数$y’, y’’, \dots, y^{(n)}$。

定义($n$ 阶 ODE):

$$ F(x, y, y', \dots, y^{(n)}) = 0 \quad (\star) $$

满足该等式的方程称为一个 $n$ 阶常微分方程

定义(解):

若函数 $y(x)$在区间$[a, b]$上满足方程$(\star)$,则称 $y(x)$为该方程在区间$[a, b]$ 上的一个


2. 示例

一阶模型:指数衰减

$$ m'(t) = -a m(t) $$

  • 解的形式: $m(t) = C e^{-at} \quad (\forall C \in \mathbb{R})$- 特性: 解存在且不唯一(取决于常数$C$)。

二阶模型:简谐振动

$$ x''(t) = -k x(t) $$

  • 也许可以注意到的解: $x(t) = \sin(t)$或$x(t) = \cos(t)$- 注意到方程的线性,于是找到比较一般的解:$x(t) = C_1 \cos(t) + C_2 \sin(t) \quad (\forall C_1, C_2 \in \mathbb{R})$

这个比较一般的解,我们称为通解。

通解 (General Solution) 的定义

对于含有 $n$个相互独立的任意常数$C_1, C_2, \dots, C_n$的解函数组$y(x; C_1, C_2, \dots, C_n)$,若满足以下两个条件:

  1. 独立性: 常数 $C_1, C_2, \dots, C_n$在区间$x \in [a, b]$ 上是相互独立的。

  2. 有效性: 对于每一组固定的 $C_1, \dots, C_n$,函数 $y(x, C_1, \dots, C_n)$在$[a, b]$上均满足方程$(\star)$。

则称 $y(x; C_1, \dots, C_n)$为方程$(\star)$ 的一个 通解
固定常数后的函数也就被称为特解,例如简谐振动示例中的 $\sin(t)$就是取常数为$0,1$ 。


常数独立性 (Wronskian 行列式)

为了判断一组解是否能构成通解,需要引入线性无关性的判定:

定义(常数独立性):

对于函数组 $\psi(x, C_1, C_2, \dots, C_n)$,若 $C_1, \dots, C_n$在$x \in [a, b]$ 上线性独立,其充要条件通常涉及 Wronskian 行列式不为零:

$$ \left| \frac{\partial(\psi, \psi', \psi'', \dots, \psi^{(n-1)})}{\partial(C_1, C_2, C_3, \dots, C_n)} \right| \neq 0, \quad x \in [a, b] $$

逻辑闭环:

  • 一阶方程有一个待定常数 $C$。

  • 二阶方程有两个相互独立的待定常数 $C_1, C_2$。

  • n 阶方程则需要 $n$ 个线性独立的解来构造通解。

我们可以验证一下简谐振动的解是不是符合常数独立性。

验证:通解中常数的独立性

1. 设定函数形式

已知二阶方程的解函数族为:

$$ x(t, C_1, C_2) = C_1 \cos(t) + C_2 \sin(t), \quad \forall C_1, C_2 \in \mathbb{R} $$

对其求一阶导数(关于时间 $t$):

$$ x'(t, C_1, C_2) = -C_1 \sin(t) + C_2 \cos(t) $$

2. 构造行列式 (Wronskian 思想的变形)

为了验证 $C_1, C_2$ 的独立性,计算函数向量对常数向量的偏导数行列式:

$$ \left| \frac{D(x, x')}{D(C_1, C_2)} \right| = \begin{vmatrix} \frac{\partial x}{\partial C_1} & \frac{\partial x}{\partial C_2} \\ \frac{\partial x'}{\partial C_1} & \frac{\partial x'}{\partial C_2} \end{vmatrix} $$

3. 代入计算

将偏导数结果代入矩阵:

$$ = \begin{vmatrix} \cos(t) & \sin(t) \\ -\sin(t) & \cos(t) \end{vmatrix} $$

利用行列式计算规则 $ad - bc$:

$$ = \cos^2(t) - (-\sin^2(t)) $$

$$ = \cos^2(t) + \sin^2(t) $$

$$ = 1 \neq 0 $$


结论

由于该行列式的值为 1(恒不为零),根据判定准则,常数 $C_1$与$C_2$ 在解空间中是相互独立的。

这证明了 $x(t) = C_1 \cos(t) + C_2 \sin(t)$ 确实是该二阶微分方程的通解


一般的方程的解,我们也可以看成函数,那么也就有所谓隐函数,相应的,这里有所谓通积分。

通积分 (General Integral)

1. 定义

对于 $n$阶常微分方程$F(x, y, y’, \dots, y^{(n)}) = 0 \quad (\star)$,如果其通解是由一个隐函数方程给出的:

$$ \Phi(x, y; C_1, C_2, \dots, C_n) = 0 $$

若该等式在满足常数独立性的前提下,能够通过对 $x$求导等代数运算还原为原方程$(\star)$,则称该隐式方程为原方程的 通积分

核心区别:

  • 通解:通常指显式函数形式 $y = f(x, C_1, \dots, C_n)$。

  • 通积分:指隐式方程形式,不一定能轻易解出显式的 $y$。

实际上,也就是消除了 $y$ 的导数的影响,也就是解掉了微分。


2. 案例演示:圆族与微分方程

板书通过一个几何例子展示了通积分与微分方程的转换逻辑:

  • 微分方程: $x + y \cdot y’ = 0$- 通积分猜测:$x^2 + y^2 = C$ (这是一个以原点为圆心的圆族)

验证过程:

对隐式方程 $x^2 + y^2 = C$关于$x$ 求导:

  1. $\frac{d}{dx}(x^2) + \frac{d}{dx}(y^2) = \frac{d}{dx}(C)$2.$2x + 2y \cdot y’ = 0$

  2. 化简得:$x + y \cdot y’ = 0$

结论:

隐式方程 $x^2 + y^2 = C$是微分方程$x + y \cdot y’ = 0$ 的通积分。如果写成显式通解,则为:

$$ y = \pm \sqrt{C - x^2} $$


3. 几何直观

在坐标系中,这个通积分代表了一系列同心圆。微分方程 $y’ = -\frac{x}{y}$ 实际上描述了圆上任意一点的切线斜率必须与该点到原点的连线(半径)垂直。


会不会有解落在通解之外呢,或者说遍历通解中的常数也取不到某个解?

定义:奇解 (Singular Solution)

若函数 $y(x)$满足原方程$(\star)$,但它不包含在通解中(即无法通过给通解中的任意常数 $C$ 赋值来得到),则称其为方程的一个奇解

典型案例分析:$y^2 + (y’)^2 = 1$

1. 通解及其验证

给定微分方程:

$$ y(x)^2 + (y'(x))^2 = 1 $$

通解形式为:

$$ y(x) = \sin(x-c), \quad c \in \mathbb{R} $$

常数独立性验证:

通过对常数 $c$ 求偏导来判断其是否提供了一个有效的自由度:

$$ \partial_c y = -\cos(x-c) \not\equiv 0 $$

核心逻辑: 虽然在某些特定点该偏导数为零,但在区间内它不恒等于零,因此常数 $c$ 是独立的。


2. 奇解 (Singular Solutions)

观察方程结构,可以发现两个不包含在上述通解族中的特殊恒等解:

  • $y(x) \equiv 1$

  • $y(x) \equiv -1$

验证: 若 $y = \pm 1$,则 $y’ = 0$。代入原方程:$(\pm 1)^2 + 0^2 = 1$,等式成立。

由于这两个解无法通过给通解中的 $c$ 赋值得到($\sin$ 函数无法恒等于 1),它们被定义为该方程的奇解


包络与奇解 (Envelope and Singular Solution)

核心定义

针对 一阶常微分方程 (1st Order ODE)

若某个函数 $y(x)$ 在其曲线上:

  • 每一点 都与该方程通解族中的 某一个解 相切;

  • 且 $y(x)$ 本身也满足该微分方程。

则 $y(x)$ 为该方程的一个 奇解


为什么“相切”意味着“唯一性失效”?

从几何角度来看,包络线具有一种奇特的“重合”属性:

  1. 坐标相同: 在切点处,包络线与通解曲线的 $y$ 值一致。

  2. 斜率相同: 由于相切,它们的导数 $y’$ 也完全一致。

推论:

对于同一个初值点 $(x_0, y_0)$,现在出现了两条不同的积分曲线(包络线本身和穿过该点的通解曲线),它们在该点具有相同的斜率。这说明在该轨迹上,微分方程解的存在唯一性定理 遭到了破坏。


判别逻辑
  • 通解族: $\Phi(x, y, C) = 0$- 包络线方程: 通常通过联立以下方程组并消去参数$C$ 获得:

$$ \begin{cases} \Phi(x, y, C) = 0 \\ \frac{\partial \Phi}{\partial C} = 0 \end{cases} $$

  • 验证: 求出的包络线方程如果代入原 ODE 成立,且无法通过给 $C$ 赋值得到,则它就是奇解。

实际上奇解有无穷多个,就上面的例子而言,我们可以在 $y=-1$走一段,然后沿着三角函数走到$y=1$ ,然后再随便走……也许正如,当你看到一只蟑螂,屋子里已经满是蟑螂了(?)从另一个视角来看,通解甚至只是解的一小部分(


初值问题 (Cauchy 问题)

对于一个 $n$ 阶常微分方程,如何通过初始条件锁定唯一轨迹。

定义

对于 $n$ 阶 ODE:$F(x, y, y’, \dots, y^{(n)}) = 0$,寻找一个特解 $y(x)$使其满足如下$n$ 个初始条件:

$$ \begin{cases} y(0) = y_0 \\ y'(0) = y_1 \\ \dots \\ y^{(n-1)}(0) = y_{n-1} \end{cases} $$

其中 $y_0, y_1, \dots, y_{n-1}$ 为给定的初值

研究核心

对于 Cauchy 问题,数学家和物理学家最关心的三个维度:

  1. 存在性 (Existence): 是否真的能找到这样一个解?

  2. 唯一性 (Uniqueness): 是否有且仅有一个解?(对应了刚才讨论的“包络线/奇解”是否会破坏唯一性)。

  3. 长期行为 (Long-term Behavior): 随着自变量 $x$(通常是时间 $t$)的增加,解是趋于稳定、发散还是进入混沌状态?

怎么看存在性呢?

通解常数的独立性与逆映射 (Independence & Inverse Mapping)

1. 初值条件的方程组形式

对于一个包含 $n$个待定常数$C_1, \dots, C_n$的通解$y(x, C_1, \dots, C_n)$,给定初值 $(y_0, y_1, \dots, y_{n-1})$,我们可以建立如下方程组:

$$ \begin{cases} y(0, C_1, \dots, C_n) = y_0 \\ y'(0, C_1, \dots, C_n) = y_1 \\ \dots \\ y^{(n-1)}(0, C_1, \dots, C_n) = y_{n-1} \end{cases} $$

2. 核心判定:Jacobi 行列式

要使上述初值能够唯一地锁定一组常数 $(C_1, \dots, C_n)$,必须保证该映射在局部是可逆的。其判定条件为 Jacobi 行列式不为零:

$$ \left| \frac{D(y, y', \dots, y^{(n-1)})}{D(C_1, C_2, \dots, C_n)} \right| \neq 0 $$

  • 数学含义: 这一条件等价于常数的 独立性 (Independence)

  • 几何直观: 它保证了从“常数空间”到“初值空间”的映射是一个局部微分同胚。即对于每一组合理的初值,我们都能反向找到唯一对应的常数解。

3. 逆映射定理的视角

更抽象的映射描述:

  • 设映射 $g(\vec{C}) = \vec{u}$,其中 $\vec{C}$ 是常数向量,$\vec{u}$ 是初值向量。

  • 若 Jacobi 行列式非零,则根据 逆映射定理 (Inverse Function Theorem),存在逆映射:

$$ \vec{C} = g^{-1}(\vec{u}) $$

  • 这意味着:通解之所以能通过初值确定特解,本质上是因为常数的独立性保证了映射的可逆性。

通解的局限性

通解只是我们预期的一般的规律,除了上述的奇解之外,我们可以考虑:

$$ F(x,y,y')=0和G(x,y,y')=0 $$

我们把两个方程相乘就得到一个新的微分方程,这两个方程可以风马牛不相及,但是他们的通解都是新的方程通解,有两个通解?!

具体计算

变量分离法 (Separable Variables)

1. 基本形式

对于一阶常微分方程(First-order ODE),若其形式如下:

$$ y'(x) = f(x) \cdot g(y) $$

2. 解题步骤

  • 寻找常数解(平衡解):

    观察 $g(y)$是否有零点。即若存在常数$c_0$使得$g(c_0) = 0$,则 $y(x) = c_0$ 是原方程的一个解

  • 变量分离:

    若在某个区间上 $g(y) \neq 0$,则可将方程改写为:

$$ \frac{y'}{g(y)} = f(x) $$

3. 原理解析

设 $F’(x) = f(x)$,$G’(y) = \frac{1}{g(y)}$(假设 $g(y) \neq 0$)。

对上述分离后的方程两边关于 $x$ 求导/积分,可得隐式解:

$$ G(y(x)) = F(x) + C $$

若 $G$ 存在逆函数,则显式解为:

$$ y(x) = G^{-1}(F(x) + C) $$

验证:

利用复合函数求导法则:

$$ y'(x) = (G^{-1})'(F(x) + C) \cdot F'(x) = \frac{1}{G'(G^{-1}(F(x)+C))} \cdot f(x) = g(y) \cdot f(x) $$


例题演示

方程: $y’ = -xy$这里$f(x) = -x$,$g(y) = y$。

  1. 检查零点:

    令 $g(y) = y = 0$,得到 $y \equiv 0$ 是方程的一个特解

  2. 分离变量(假设 $y \neq 0$):

$$ \frac{y'}{y} = -x $$

  1. 两边积分:

$$ \int \frac{1}{y} dy = \int -x dx $$

$$ \ln|y| = -\frac{1}{2}x^2 + C $$

为了解出 $y$,对等式两边取指数:

$$ |y| = e^{-\frac{1}{2}x^2 + C} = e^C \cdot e^{-\frac{1}{2}x^2} $$

令 $\tilde{C} = e^C$(由于 $e^C > 0$,故 $\tilde{C} > 0$),则有:

$$ |y| = \tilde{C} e^{-\frac{1}{2}x^2} $$

去掉左边的绝对值符号,右边引入正负号:

$$ y = \pm \tilde{C} e^{-\frac{1}{2}x^2} $$

此时,系数 $\pm \tilde{C}$ 可以取遍所有非零实数。

注意到我们在步骤 ① 中发现的常数解 $y \equiv 0$

  • 如果我们允许上述式子中的系数取 0,那么这个式子就能涵盖 $y \equiv 0$。

  • 重新定义一个新的任意常数 $\hat{C}$,使其包含正数、负数以及零($\hat{C} \in \mathbb{R}$)。

最终,方程的**通解(General Solution)**写为:

$$ \mathbf{y(x) = \hat{C} e^{-\frac{1}{2}x^2}} $$

变量替换(Variable Substitution)

基本模型:

对于形如 $y’ = f(ax + by + c)$ 的微分方程:

  1. 令: $z = ax + by + c$2. 求导:$z’ = a + b \cdot y’ = a + b \cdot f(z)$3. 转化: 得到关于$z$ 的可分离变量方程:$z’ = a + b f(z)$

典型例题

方程: $y’ = \sin(x + y + 1)$

1. 变量替换

令 $z = x + y + 1$,则有 $z’ = 1 + y’$。

代入原方程得:

$$ z' = 1 + \sin(z) $$

2. 寻找奇异解(Equilibrium Solutions)

考察 $1 + \sin(z) = 0$ 的情况:

当 $z = 2k\pi + \frac{3}{2}\pi$ ($k \in \mathbb{Z}$) 时,$z’ = 0$。

反代回原变量,得到一组直线解

$y(x) = 2k\pi + \frac{3}{2}\pi - x - 1$

3. 通解计算(分离变量法)

当 $1 + \sin(z) \neq 0$ 时,进行积分:

$$ \int \frac{dz}{1 + \sin(z)} = \int 1 dx $$

  • 左侧积分推导:

    利用三角恒等式变换,积分为:

$$ -\frac{\cos(z)}{1 + \sin(z)} = \tan\left(\frac{z}{2} - \frac{\pi}{4}\right) $$

(注:利用了半角公式进行简化)

  • 得出结果:

$$ \tan\left(\frac{x + y + 1}{2} - \frac{\pi}{4}\right) = x + C $$

进一步整理得:

**$y = 2 \arctan(x + C) + \frac{\pi}{2} - x - 1$**

注意到,$y$可以加上$2k\pi$ 而不影响方程成立,所以实际上的通解为:

$$ y = 2 \arctan(x + C) + \frac{\pi}{2} - x - 1+2k\pi $$


关于解

该方程解的族群分布:

  • 特征: 解曲线被一系列斜率为 $-1$的平行直线(即奇异解$y = -x - 1 + 2k\pi + \frac{3}{2}\pi$)所分割。

  • 趋势: 在这些“隔离带”之间,通解曲线呈现出周期性的波动形态。当 $x \to \infty$ 时,解会无限趋近于这些特定的直线。


二,齐次

1. 识别模型

当微分方程可以表示为自变量与因变量比值的函数时:

$$ y' = f(x, y) = h\left(\frac{y}{x}\right) $$

2. 引入中间变量

令:

$$ u = \frac{y}{x} \implies y = x \cdot u $$

3. 求导变换

对 $y = xu$关于$x$ 求导(应用乘积法则):

$$ y' = (xu)' = x \cdot u' + u $$

4. 建立新方程

将上述结果代入原方程 $y’ = h(u)$:

$$ xu' + u = h(u) $$

整理得:

$$ u' = \frac{h(u) - u}{x} $$


逻辑拆解

  • 本质: 这种变换的精髓在于通过“比例化”将一个二元函数 $f(x, y)$塌缩为一元函数$h(u)$,从而将方程转化为可分离变量的形式:

$$ \frac{du}{h(u) - u} = \frac{dx}{x} $$

  • 适用场景: 如果方程中 $x$和$y$的每一项次数相同(齐次),那么它一定能化为$h(y/x)$ 的形式。

  • 潜在风险: 在后续积分过程中,需额外注意分母 $h(u) - u = 0$ 的情况,这通常对应于解空间中的射线(即平衡解)。


三,分式线性组合

一、 核心模型

方程形式为:

$$ y' = f\left( \frac{a_1 x + b_1 y + c_1}{a_2 x + b_2 y + c_2} \right) $$

这种方程的处理方式取决于分子、分母所代表的两条直线的几何关系,即行列式 $D = \begin{vmatrix} a_1 & b_1 \ a_2 & b_2 \end{vmatrix}$ 是否为零。


二、 情况 (a):相交直线($D \neq 0$)

当两条直线相交时,可以通过平移坐标原点到交点来消除常数项 $c_1$和$c_2$。

  1. 求交点: 解线性方程组 $\begin{cases} a_1 x + b_1 y + c_1 = 0 \ a_2 x + b_2 y + c_2 = 0 \end{cases}$,得到唯一解 $(x_0, y_0)$。

  2. 坐标平移: 令 $u = x - x_0, v = y - y_0$。

  3. 方程转化: 代入原方程后,常数项消失,方程变为:

$$ v'(u) = f\left( \frac{a_1 u + b_1 v}{a_2 u + b_2 v} \right) = f\left( \frac{a_1 + b_1(v/u)}{a_2 + b_2(v/u)} \right) $$

此时,方程转化为了标准的齐次方程,可用 $w = v/u$ 进一步求解。


三、 情况 (b):平行直线($D = 0$)

当两条直线平行时,意味着系数成比例:$(a_1, b_1) = \lambda(a_2, b_2)$。

  1. 比例简化: 此时分子和分母的线性部分是相关的。

$$ y' = f\left( \frac{(a x + b y) + c_1}{\lambda(a x + b y) + c_2} \right) = g(ax + by) $$

  1. 变量替换: 此时回到最简单的模式,令 $z = ax + by$

  2. 结果: 转化为可分离变量的方程进行计算。


总结与观察

这展示了数学处理中“化归”的思想:

  • 如果有交点,就通过“平移”消除常数项,化归为齐次方程

  • 如果无交点(平行),就通过“整体替换”化归为一元函数方程

至此,我们已经完整收集了一阶微分方程变量替换法的三大招式:

  1. $y’ = f(ax+by+c)$(整体替换)

  2. $y’ = h(y/x)$(齐次化替换)

  3. $y’ = f(\frac{L_1}{L_2})$(坐标平移/平行替换)

一阶线性 ODE(关于 $y, y’$ 线性)

1. 基本定义与分类

方程的标准形式为:

  • 非齐次方程: $y’ + P(x)y = Q(x)$—— 记作$(*)$- 齐次方程:$y’ + P(x)y = 0$—— 记作$(**)$

2. 解的结构理论

线性方程最迷人的地方在于其解的可叠加性:

  • 齐次解的线性性质: 若 $y_1, y_2$为$()$的两个解,则其线性组合$C_1y_1 + C_2y_2$亦为解。其通解具有$C\varphi(x)$ 的形式,且没有奇异解**。这不难验证,代入即可。

  • 通解结构公式:

    若 $\hat{y}$是非齐次方程$()$ 的一个*特解,$\varphi$是对应齐次方程$()$的一个非零解**,则$(*)$ 的通解可表示为:

$$ y = \hat{y} + C\varphi $$

直观理解: 这与线性代数中“非齐次线性方程组的通解 = 特解 + 齐次方程组通解”的逻辑完全一致。


齐次方程 $(**)$ 的求解推导

利用积分因子法求解齐次方程的过程:

  1. 构造原函数: 令 $F(x)$满足$F’(x) = P(x)$,即 $F(x) = \int P(x)dx$。

  2. 引入积分因子: 在方程 $(**)$两端同时乘以$e^{F(x)}$(显然 $e^{F(x)} \neq 0$):

$$ y'e^F + yF'e^F = 0 $$

  1. 逆用乘积导数法则:

$$ (ye^F)' = 0 $$

  1. 积分得出结论:

$$ ye^F = C \implies y(x) = Ce^{-F(x)} $$

即齐次方程的通解为:$y(x) = C e^{-\int P(x)dx}$

这实际上很符合直觉,正如 $y’+y=0$我们会猜解$y=e^{-x}$ 。 我们利用了指数求导不变来构造微分。又由于实际上每一步都是等价变换,所以没有奇解。

非齐次方程的求解——常数变易法 (Variation of Parameters)

1. 核心思想

对于齐次方程 $(**)$的通解$y = Ce^{-F(x)}$,我们大胆假设非齐次方程 $(*)$的通解具有相同的形式,但将常数$C$替换为待定函数$C(x)$:

$$ y = C(x)e^{-F(x)} $$

2. 求解过程

继续沿用积分因子 $e^{F(x)}$

  • 原方程: $y’ + P(x)y = Q(x)$——$(*)$- 乘积分因子: 左右同乘$e^{F(x)}$,其中 $F’(x) = P(x)$:

$$ y'e^F + yP(x)e^F = Q(x)e^F $$

  • 合并左端: 根据导数乘积法则的逆过程:

$$ (ye^F)' = Q(x)e^F $$

  • 两端积分:

$$ ye^{F(x)} = \int_{x_0}^x Q(\tilde{x})e^{F(\tilde{x})}d\tilde{x} + C $$


二、 一阶线性 ODE 的通用公式

通过上述推导,也就得到了最终的通解公式

$$ y(x) = \left( \int_{x_0}^x Q(\tilde{x})e^{F(\tilde{x})} d\tilde{x} + C \right) e^{-F(x)} $$

结构拆解:

  1. 特解部分: $e^{-F(x)} \int Q(x)e^{F(x)}dx$2. 齐次解部分:$Ce^{-F(x)}$

这同样步步等价,所以这并没有奇解,这是线性方程的优良性质。


示例:RL电路

1. 电路构成

  • 电源电动势: $E$- 电感:$L$- 电阻:$R$

2. 建立方程

根据基尔霍夫电压定律(KVL),电路的电压平衡方程为:

$$ L \cdot I'(t) + R \cdot I(t) = E $$

设定初始条件:$I(0) = 0$(即电路在 $t=0$ 时刻接通,初始电流为零)。


数学转化与求解

1. 标准化处理

为了套用一阶线性 ODE 的公式,将方程两端同除以 $L$:

$$ I' + \frac{R}{L}I = \frac{E}{L} $$

令常数 $P = \frac{R}{L}$,$Q = \frac{E}{L}$,方程简化为标准型:

$$ I' + PI = Q $$

2. 积分因子法求解

  • 积分因子: $e^{Pt}$- 变换:$(I \cdot e^{Pt})’ = Q e^{Pt}$- 积分:$I \cdot e^{Pt} = \frac{Q}{P} e^{Pt} + C$- 通解公式:$I(t) = \frac{Q}{P} + C e^{-Pt}$

带入物理量与初始条件

1. 代回物理参数

由于 $\frac{Q}{P} = \frac{E/L}{R/L} = \frac{E}{R}$,通解写为:

$$ I(t) = \frac{E}{R} + C e^{-\frac{R}{L}t} $$

2. 确定待定常数

代入初始条件 $I(0) = 0$:

$$ 0 = \frac{E}{R} + C \implies C = -\frac{E}{R} $$

3. 最终特解

$$ I(t) = \frac{E}{R} \left( 1 - e^{-\frac{R}{L}t} \right) $$


物理意义评估

  • 暂态响应: 指数项 $e^{-\frac{R}{L}t}$描述了电流从零开始增长的过程。电感$L$ 的存在产生了“反电动势”,阻碍了电流的突变。

  • 稳态电流: 当 $t \to \infty$时,指数项趋于$0$,电流趋于稳定值:

$$ I_{\text{steady}} = \frac{E}{R} $$

此时电感相当于短路,遵循基本的欧姆定律。


积分因子

一、 问题的引入:全微分方程

1. 基本形式

将微分方程写成对称形式:

$$ P(x, y)dx + Q(x, y)dy = 0 $$

2. 判定条件(恰当性检验)

如果存在一个函数 $u(x, y)$使得$du = P dx + Q dy = 0$,那么该方程称为全微分方程(或恰当方程)。其通解直接为:

$$ u(x, y) = C $$

根据全微分的性质,这要求满足:

$$ Q_x = P_y $$

(即 $\frac{\partial Q}{\partial x} = \frac{\partial P}{\partial y}$)


二、 非全微分方程与积分因子

如果 $N_x \neq M_y$,方程就不是全微分的。此时,我们寻找一个非零函数 $\mu(x, y)$,使得乘以它之后方程变得“恰当”:

$$ \mu M dx + \mu N dy = 0 \implies (\mu N)_x = (\mu M)_y $$

这里的 $\mu$ 被称为积分因子


三、 积分因子的求解推导(以一元因子为例)

寻找通用的 $\mu(x, y)$通常涉及偏微分方程,非常困难。寻找一元积分因子(仅与$x$或$y$ 有关)的捷径:

1. 展开判定式:

根据乘积求导法则,$(\mu N)_x = (\mu M)_y$ 展开为:

$$ \mu N_x + \mu_x N = \mu M_y + \mu_y M $$

整理得:

$$ \mu(N_x - M_y) = -\mu_x N + \mu_y M $$

2. 假设 $\mu = \mu(x)$:

此时 $\mu_y = 0$,方程简化为:

$$ \mu(N_x - M_y) = -\mu_x N $$

变形得到关于 $\mu$ 的可分离变量方程:

$$ \frac{\mu_x}{\mu} = -\frac{N_x - M_y}{N} $$

3. 求解结论:

如果右端项 $\frac{M_y - N_x}{N}$仅是$x$的函数,记为$F(x)$,那么积分因子为:

$$ \mu(x) = e^{\int F(x) dx} $$


补充情况:$\mu = \mu(y)$ 的判定

如果积分因子仅是 $y$的函数,推导过程与$x$ 对称:

  1. 判定条件: 考察表达式 $\frac{N_x - M_y}{M}$。

  2. 结论: 若该式仅与 $y$有关,记为$G(y)$,则有:

$$ \frac{\mu_y}{\mu} = \frac{N_x - M_y}{M} = G(y) $$

  1. 积分因子公式:

$$ \mu(y) = e^{\int G(y) dy} $$


二、 综合例题演练

方程: $(2xy^2 - y)dx + (x + 3y^3)dy = 0$其中$M = 2xy^2 - y$,$N = x + 3y^3$。

1. 恰当性检查

  • $M_y = 4xy - 1$-$N_x = 1$显然$M_y \neq N_x$,方程不是全微分方程。

2. 寻找积分因子(试错过程)

  • 尝试 $\mu(x)$:

    计算 $\frac{N_x - M_y}{N} = \frac{1 - (4xy - 1)}{x + 3y^3} = \frac{2 - 4xy}{x + 3y^3}$。

    结果含有 $y$,说明不存在仅与 $x$ 有关的积分因子。

  • 尝试 $\mu(y)$:

    计算 $\frac{N_x - M_y}{M} = \frac{1 - (4xy - 1)}{2xy^2 - y} = \frac{2(1 - 2xy)}{y(2xy - 1)} = -\frac{2}{y}$。

    结果仅与 $y$有关!满足条件,令$G(y) = -\frac{2}{y}$。

3. 计算积分因子

$$ \mu(y) = e^{\int -\frac{2}{y} dy} = e^{-2\ln|y|} = \frac{1}{y^2} $$

4. 转化与求解

方程两端同乘 $\frac{1}{y^2}$,得到新方程:

$$ \frac{2xy^2 - y}{y^2}dx + \frac{x + 3y^3}{y^2}dy = 0 $$

简化为:

$$ \left( 2x - \frac{1}{y} \right)dx + \left( \frac{x}{y^2} + 3y \right)dy = 0 $$

验证可知,此时 $P_y = \frac{1}{y^2}$,$Q_x = \frac{1}{y^2}$,已变为全微分方程。

5. 最终通解

对 $P$关于$x$积分,对$Q$关于$y$ 积分并合并(注意去重):

$$ u(x, y) = x^2 - \frac{x}{y} + \frac{3}{2}y^2 = C $$

另外,注意到 $y \equiv 0$ 时,$M=0$同时$dy=0$ ,那么这时候方程也成立。

齐次方程的特殊积分因子

核心定理:

对于齐次微分方程 $M(x, y)dx + N(x, y)dy = 0$(即 $M, N$为同次数的齐次函数),如果$xM + yN \neq 0$,则该方程的一个积分因子为:

$$ \mu(x, y) = \frac{1}{xM + yN} $$

证明:

1. 核心工具:欧拉齐次函数定理

根据齐次函数的性质,若 $f(x, y)$是$n$ 次齐次的,则满足:

$$ x \frac{\partial f}{\partial x} + y \frac{\partial f}{\partial y} = n f $$

具体到我们的函数:

  • (1) $x M_x + y M_y = n M$- (2)$x N_x + y N_y = n N$

2. 判定目标

我们需要证明,乘以 $\mu$后的方程$\frac{M}{xM+yN}dx + \frac{N}{xM+yN}dy = 0$ 满足全微分条件:

$$ \frac{\partial}{\partial y} \left( \frac{M}{xM + yN} \right) = \frac{\partial}{\partial x} \left( \frac{N}{xM + yN} \right) $$


3. 分步求偏导

左侧(对 $y$ 求偏导):

应用商法则 $\left(\frac{u}{v}\right)’ = \frac{u’v - uv’}{v^2}$,设分母 $D = xM + yN$:

$$ \frac{\partial}{\partial y} \left( \frac{M}{D} \right) = \frac{M_y (xM + yN) - M \frac{\partial}{\partial y}(xM + yN)}{D^2} $$

展开分母的偏导项 $\frac{\partial D}{\partial y} = x M_y + N + y N_y$:

$$ \text{分子} = M_y(xM + yN) - M(x M_y + N + y N_y) $$

$$ = x M M_y + y M_y N - x M M_y - MN - y M N_y $$

消去 $x M M_y$,得到:

$$ \text{分子}_L = y M_y N - MN - y M N_y \quad \dots (\alpha) $$

右侧(对 $x$ 求偏导):

同样应用商法则:

$$ \frac{\partial}{\partial x} \left( \frac{N}{D} \right) = \frac{N_x (xM + yN) - N \frac{\partial}{\partial x}(xM + yN)}{D^2} $$

展开分母的偏导项 $\frac{\partial D}{\partial x} = M + x M_x + y N_x$:

$$ \text{分子} = N_x(xM + yN) - N(M + x M_x + y N_x) $$

$$ = x M N_x + y N N_x - MN - x N M_x - y N N_x $$

消去 $y N N_x$:

$$ \text{分子}_R = x M N_x - MN - x N M_x \quad \dots (\beta) $$


4. 利用欧拉定理进行等价变换

现在我们要证明 $(\alpha) = (\beta)$。将两式写在一起观察:

$$ y M_y N - MN - y M N_y \overset{?}{=} x M N_x - MN - x N M_x $$

消去两边的 $-MN$,整理得:

$$ N(y M_y + x M_x) \overset{?}{=} M(y N_y + x N_x) $$

此时,代入欧拉齐次函数定理

  • 左边 $= N \cdot (n M) = n MN$- 右边$= M \cdot (n N) = n MN$

左右相等!


二、 典型例题演练

方程: $(x - y)dx + (x + y)dy = 0$其中$M = x - y, N = x + y$,均为一阶齐次函数。

1. 恰当性检查

$N_x = 1, M_y = -1$。由于 $N_x \neq M_y$,方程不是全微分方程。

2. 解法视角一:齐次化替换(回顾)

可以将方程写为:

$$ \frac{dy}{dx} = -\frac{x - y}{x + y} = -\frac{1 - y/x}{1 + y/x} $$

这是典型的 $h(y/x)$形式,可用$u = y/x$ 求解。

3. 解法视角二:构造特殊积分因子

利用板书右侧的公式:

  • 分母计算: $xM + yN = x(x - y) + y(x + y) = x^2 - xy + xy + y^2 = x^2 + y^2$

  • 锁定因子: $\mu = \frac{1}{x^2 + y^2}$

4. 转化与积分

将 $\mu$ 乘回原方程:

$$ \frac{x - y}{x^2 + y^2}dx + \frac{x + y}{x^2 + y^2}dy = 0 $$

拆分项:

$$ \left( \frac{x}{x^2 + y^2}dx + \frac{y}{x^2 + y^2}dy \right) + \left( \frac{x dy - y dx}{x^2 + y^2} \right) = 0 $$

5. 最终通解

  • 第一部分是 $\frac{1}{2}d(\ln(x^2 + y^2))$- 第二部分是$d(\arctan\frac{y}{x})$

    合并得出:

$$ u(x, y) = \frac{1}{2}\ln(x^2 + y^2) + \arctan\frac{y}{x} = C $$

阅读全文

5.场论

2026/4/19
阅读全文

9.常微分方程 III

2026/4/19

线性常系数微分方程

1. 算子多项式的映射

当我们面对一个 $n$ 阶常系数齐次线性微分方程:

$$ a_n y^{(n)} + a_{n-1} y^{(n-1)} + \dots + a_1 y' + a_0 y = 0 $$

其实是在讨论微分算子 $D = \frac{d}{dx}$的一个多项式$P(D) = \sum_{i=0}^n a_i D^i$。

所谓的特征方程 $P(\lambda) = 0$,本质上是将算子 $D$ 视为一个变量,把微分方程抽象为了算子空间的代数方程:$P(D)y = 0$。

2. 根子空间与核空间(Kernel)的分解

根据代数基本定理,多项式 $P(\lambda)$ 可以在复数域内唯一分解为线性因子的乘积:

$$ P(\lambda) = \prod_{j=1}^k (\lambda - \lambda_j)^{m_j} $$

对应到微分算子,就有 $P(D) = \prod_{j=1}^k (D - \lambda_j)^{m_j}$。

由于这些算子因子 $(D - \lambda_j)^{m_j}$之间是两两可交换的,根据核空间分解定理(或称循环子空间分解),微分方程的解空间$V = \ker(P(D))$ 可以分解为若干个互不相干的子空间的直和:

$$ V = \ker((D - \lambda_1)^{m_1}) \oplus \ker((D - \lambda_2)^{m_2}) \oplus \dots \oplus \ker((D - \lambda_k)^{m_k}) $$

这里的每一个子空间 $\ker((D - \lambda_j)^{m_j})$,正是根子空间在函数空间中的体现。

3. 基向量的生成机制

在每个根子空间 $\ker((D - \lambda_j)^{m_j})$中,我们要寻找的是能够被$(D - \lambda_j)^{m_j}$ 湮灭(Annihilated)的所有函数。

  • 当 $m_j = 1$(单根)时,子空间由特征向量 $e^{\lambda_j x}$ 张成。

  • 当 $m_j > 1$(重根)时,单纯的特征向量不足以填满维度,于是产生了广义特征向量

通过平移公式 $D - \lambda = e^{\lambda x} D e^{-\lambda x}$可以证明,这个子空间的基底正好是${e^{\lambda_j x}, x e^{\lambda_j x}, \dots, x^{m_j-1} e^{\lambda_j x}}$。这与线性代数中 Jordan 标准型处理重特征值的逻辑完全一致。

所以实际上,常系数线性微分方程要做的也就只有做多项式分解,多项式分解能搞定,微分方程也就解决了。

例如 $f’’’-3f’+2f=0$,也就是考虑$D^3-3D+2$的分解,分解成$(D-1)^2(D-2)$,于是就有$f\in Ker(D-1)^2 \oplus Ker(D+2)$,那么$Ker(D-1)^2$是$c_1e^x+c_2xe^x$ ,$Ker(D+2)$是$c_3e^{-2x}$,和也就是$c_1e^x+c_2xe^x+c_3e^{-2x}$ ,也就是通解了。

特解

这个一方面是猜,如果要一般地做,也可以如下考虑:
“套娃”式地定义中间变量:

  • 令 $z_{n-1} = (D - \lambda_2)\dots(D - \lambda_n)y$

  • 则第一步求解:$(D - \lambda_1)z_{n-1} = f(x)$- 得到$z_{n-1}$后,再解$(D - \lambda_2)z_{n-2} = z_{n-1}$- 依此类推,直到解出$y$。

不过积分的话,就未必算的出了(

猜解

实际上也就是直觉经验。

1. $f(x)$为$n$次多项式$P_n(x)$当$f(x) = a_n x^n + \dots + a_1 x + a_0$ 时:

  • 若 $0$不是特征根(即$q \neq 0$):设特解 $\varphi^* = Q_n(x)$(同阶多项式)。

  • 若 $0$是单特征根(即$q = 0, p \neq 0$):设特解 $\varphi^* = x Q_n(x)$。

  • 若 $0$是二重特征根(即$q = p = 0$):设特解 $\varphi^* = x^2 Q_n(x)$。

2. $f(x)$为指数函数$e^{\alpha x}$当$f(x) = A e^{\alpha x}$ 时:

  • 若 $\alpha$不是特征根:设$\varphi^* = B e^{\alpha x}$。

  • 若 $\alpha$是单特征根:设$\varphi^* = B x e^{\alpha x}$。

  • 若 $\alpha$是二重特征根:设$\varphi^* = B x^2 e^{\alpha x}$。

3. $f(x)$ 为正余弦函数组合

当 $f(x) = D_1 \cos(\beta x) + D_2 \sin(\beta x)$ 时:

  • 若 $\pm i\beta$不是特征根:设$\varphi^* = A \cos(\beta x) + B \sin(\beta x)$。

  • 若 $\pm i\beta$是特征根:设$\varphi^* = x [A \cos(\beta x) + B \sin(\beta x)]$。

4. 复合形式

当 $f(x) = e^{\alpha x} [P_n(x) \cos(\beta x) + Q_m(x) \sin(\beta x)]$ 时:

这是最复杂的情况。设 $k = \max(n, m)$,若 $\alpha \pm i\beta$是特征方程的$s$ 重根(对于二阶方程,$s$取$0$或$1$),则:

$$ \varphi^* = x^s e^{\alpha x} [R_k(x) \cos(\beta x) + S_k(x) \sin(\beta x)] $$

另一种理解

我们之前从线性代数的角度思考了线性常系数微分方程的解,实际上可以考虑所谓的特征方程,而不考虑线性代数,虽然实际上几乎是一个东西,但是可以换种角度理解。

考虑二阶线性递推方程:

$$ a_{n+2}+c_1a_{n+1}+c_2a_n=0 $$

我们不会解,但是我们会解等比的递推,于是想到构造 $b_n=a_{n+1}+ka_n$ ,我们希望的是:

$$ b_{n+1}=qb_n $$

或者也就是

$$ a_{n+2}+xa_{n+1}=y(a_{n+1}+a_n) $$

这样,我们与原来的方程比较就能解出 $x,y$,从而解出$b_n$的通项,然后反求$a_n$ 。
对微分方程我们是不是也可以类似地转换呢:

$$ y''+c_1y'+c_2y=0 $$

二阶不会,一阶还是会的,于是构造 $h=y’-ky$ ,我们希望得到:

$$ h'-qh=0 $$

也就是

$$ (y'-ky)'-q(y'-ky)=0 $$

同样,与原式对比就可以解出 $k,q$,从而得到$y’+ky$ 的形式,然后再解一个一阶方程就好了。
我们具体算算,利用

$$ k+q=-c_1, qk=c_2 $$

可知 $q,k$也就是对应方程$x^2+c_1x+c_2$即所谓特征方程的两根$\lambda_1,\lambda_2$ 。
先考虑两根不同。
对这样的方程,当然想到直接分离变量积分:

$$ \frac{(y'-ky)'}{y'-ky}=q $$

积分并化简得到

$$ y'-ky=Ce^{qx} $$

然后乘上因子 $e^{-kx}$ :

$$ (e^{-kx}y)'=Ce^{(q-k)x} $$

积分得到

$$ e^{-kx}y=C_1e^{(q-k)x}+C_2' $$

也就有

$$ y=C_1e^{qx}+C_2e^{kx} $$

不难解出特征方程两根,于是 $y$ 的通解:

$$ y=C_1e^{-\lambda_1x}+C_2e^{-\lambda_2x} $$

如果两根相同,那么记为 $\lambda$ 。

$$ (y'-\lambda y)'-\lambda(y'-\lambda y)=0 $$

同样有

$$ y'-\lambda y=Ce^{\lambda x} $$

同样作用 $e^{-\lambda x}$ :

$$ (e^{-\lambda x}y)'=C $$

于是得到

$$ y=Cxe^{\lambda x} $$

这与我们考虑线性算子时得到的结果一致。

特解

在线性算子中,我们具体考虑特解的一般性计算,将考虑微分算子的逆,笨人并未研究。
这里我们则可以比较形式化地直接得到特解,考虑:

$$ y''+c_1y'+c_2y=f(x) $$

我们故技重施,写成:

$$ (y'-\lambda_1y)'-\lambda_2(y'-\lambda_1y)=f(x) $$

这就降成了一阶微分方程,这样乘上积分因子 $e^{-\lambda_2x}$,记$u=y’-\lambda_1 y$ :

$$ (e^{-\lambda_2x}u)'=f(x)e^{-\lambda_2x} $$

积分得到:

$$ y'-\lambda_1y=e^{\lambda_2x}(\int f(x)e^{-\lambda_2x}dx+C) $$

再来一次:

$$ (e^{-\lambda_1x}y)'=RHS\cdot e^{-\lambda_1x} $$

如果两根不同,则积分:

$$ y=e^{\lambda_1x}(\int(e^{(\lambda_2-\lambda_1)x}\int f(x)e^{-\lambda_2x}dx+C)dx+C') $$

把常数分离一下就得到:

$$ y = e^{\lambda_1x} \left( \int e^{(\lambda_2-\lambda_1)x} \left( \int f(x)e^{-\lambda_2x} dx \right) dx + C_1 \int e^{(\lambda_2-\lambda_1)x} dx + C_2 \right) $$

也就得到了解的一般形式,但是一般猜解还是舒服一点。
如果两根相同,那么第二项积分就变成 $C_1x$ 了。

第一项积分看起来有点丑陋,而且并不对称,但实际上可以通过运算化简,我们写成定积分:

$$ \int_{a}^{x} \left( \int_{a}^{t} f(s) e^{-\lambda_1 s} ds \right) e^{(\lambda_1 - \lambda_2)t} dt \cdot e^{\lambda_2 x} $$

分部积分:

$$ = \left( \left. \int_{a}^{s} f(s) e^{-\lambda_1 s} ds \cdot \frac{e^{(\lambda_1 - \lambda_2)t}}{\lambda_1 - \lambda_2} \right|_{t=a}^{t=x} - \int_{a}^{x} f(t) e^{-\lambda_1 t} \cdot \frac{e^{(\lambda_1 - \lambda_2)t}}{\lambda_1 - \lambda_2} dt \right) e^{\lambda_2 x} $$

$$ = \left( \int_{a}^{x} f(s) e^{-\lambda_1 s} ds \cdot \frac{e^{(\lambda_1 - \lambda_2)x}}{\lambda_1 - \lambda_2} + \int_{0}^{x} \frac{f(t) e^{-\lambda_2 t}}{\lambda_2 - \lambda_1} dt \right) e^{\lambda_2 x} $$

最终形式:

$$ = \left( \int_{a}^{x} \frac{f(t) e^{-\lambda_1 t}}{\lambda_1 - \lambda_2} dt \right) e^{\lambda_1 x} + \left( \int_{a}^{x} \frac{f(t) e^{-\lambda_2 t}}{\lambda_2 - \lambda_1} dt \right) e^{\lambda_2 x} $$

① $\lambda_1 \neq \lambda_2$

$$ y(x) = \left( \int^x \frac{f(t) e^{-\lambda_1 t}}{\lambda_1 - \lambda_2} dt + C_1 \right) e^{\lambda_1 x}

  • \left( \int^x \frac{f(t) e^{-\lambda_2 t}}{\lambda_2 - \lambda_1} dt + C_2 \right) e^{\lambda_2 x}
    $$

② $\lambda_1 = \lambda_2 = \lambda$

$$ y(x) = \left( \int^x f(t) \cdot t e^{-\lambda t} dt + C_1 \right) e^{\lambda x} + \left( \int^x f(t) e^{-\lambda t} dt + C_2 \right) x e^{\lambda x} $$

这是非常正统,非常一般化的解,但是显然不太好算,也记不住。我们观察形式,发现:

$$ 齐次部分对应:c_1\phi_1(x)+c_2\phi_1(x) $$

$$ 非齐次部分对应:D_1(x)\phi_1(x)+D_2(x)\phi_2(x) $$

常数变易法

被判定为邪修,但是很好用(),根据上面我们的观察,我们知道只要整出来齐次的解,只要把系数设成新的函数带进去解出来就可以得到方程的解。实际上就是我们算出来的那一大坨,但是那显然不好记忆()

这实际上对非常系数的微分方程也成立,就不证了(buhui),非常系数的齐次解也没有通用的解法,但是我们还是假定我们找到了齐次的通解 $\varphi_1,\varphi_2$ ,然后现在讨论常数变易法。

原方程:

$$ y''+p(x)y'+q(x)y=f(x) $$

假装解出来了齐次解,安上两个系数函数:

$$ y=C_1(x)\varphi_1(x)+C_2(x)\varphi_2(x) $$

求导:

$$ y'=C_1'\varphi_1+C_1\varphi_1'+C_2'\varphi_2+C_2\varphi_2' $$

$$ y'(x) = \underline{C_1' \varphi_1 + C_2' \varphi_2} + C_1 \varphi_1' + C_2 \varphi_2' $$

$\qquad$设划线处$= 0$ (一会解释为什么能这么干)

$$ y''(x) = C_1' \varphi_1' + C_2' \varphi_2' + C_1 \varphi_1'' + C_2 \varphi_2'' $$

$$ f(x) = C_1' \varphi_1' + C_2' \varphi_2' + \underline{C_1 \varphi_1'' + C_2 \varphi_2''} $$

$$ \qquad + p(x) (\underline{C_1 \varphi_1' + C_2 \varphi_2'}) $$

$$ \qquad + q(x) (\underline{C_1 \varphi_1 + C_2 \varphi_2}) $$

$$ = C_1' \varphi_1' + C_2' \varphi_2' $$

那么就得到两个方程:

$$ \begin{cases} C_1' \varphi_1 + C_2' \varphi_2 = 0 \\ C_1' \varphi_1' + C_2' \varphi_2' = f \end{cases} $$

$$ \Rightarrow \begin{aligned} C_1' &= -\frac{f \varphi_2}{W} \\ C_2' &= \frac{f \varphi_1}{W} \end{aligned} $$

这里的 $W$ 是系数行列式,也就是朗斯基行列式。

$$ \Rightarrow \begin{aligned} C_1(x) &= \int^x -\frac{f(t) \varphi_2(t)}{W(t)} dt + D_1 \\ C_2(x) &= \int^x \frac{f \varphi_1}{W} dt + D_2 \end{aligned} $$

从而

$$ y'' + p(x) y' + q(x) y = f(x) $$

$$ \downarrow $$

$$ y

= \left( \int^x -\frac{f \varphi_2}{W} dt + D_1 \right) \varphi_1(x)

  • \left( \int^x \frac{f \varphi_1}{W} dt + D_2 \right) \varphi_2(x)
    $$

欧拉方程

$$ \sum_i a_ix^iy^{(i)}=0 $$

其中 $a_i$ 为常数,这样形式的微分方程称为所谓欧拉方程。
欧拉方程有一个不错的性质,考虑 $z(x)=y(-x)$,那么偶数项不消说,奇数项由于$z’$和$x$ 都有多一个负号,所以抵消了。也就是说,$z$也满足方程,换言之,只需要考虑$x>0$ 的情形。

那么什么函数值域大于 $0$呢,自然的想法是$e^x$,我们令$x=e^t$,那么$xy’=e^t\frac{dy}{dx}=e^t\frac{dy}{dt}\frac{dt}{dx}$,注意到$\frac{dt}{dx}=e^{-t}$,那么就有$xy’=\frac{dy}{dt}$,如此美妙。我们考虑第二项,设$D = \frac{d}{dt}$,则$x^2 \frac{d^2y}{dx^2} = D(D-1)y$,利用数学归纳法可以得到$x^k \frac{d^ky}{dx^k} = D(D-1)\dots(D-k+1)y$ 。这么一来,就又变回常系数线性方程了。

例如,我们考虑

$$ x^2y''+\frac{3}{2}xy'-y=0 $$

那么换元后就是

$$ (D(D-1)+\frac{3}{2}D-1)y=0 $$

整理得到

$$ (D^2+\frac{1}{2}D-1)y=0 $$

这个丑陋的方程就不解了,总之是解出两个根 $\lambda_i$ ,然后

$$ y=C_1e^{\lambda_1t}+C_2e^{\lambda_2t} $$

但是这还不是 $y(x)$,代入$t=lnx

$$ $y(x)=C_1x^{\lambda_1}+C_2x^{\lambda_2} $$

但是这要求 $x>0$,利用之前所说,只要把$x$ 加上绝对值就好

$$ y(x)=C_1|x|^{\lambda_1}+C_2|x|^{\lambda_2} $$

相应的,如果有重根,就得到

$$ y(x)=C_1x^{\lambda}+C_2ln|x|x^{\lambda} $$

伯努利方程

$$ y'+P(x)y=Q(x)y^n $$

如果没有 $y^n$,那就是标准的一阶非齐次方程,于是自然想到除掉$y^n$ ,得到

$$ y^{-n}y'+P(x)y^{1-n}=Q(x) $$

发现 $1-n$和$-n$差$1$,这与求一次导有所关联,于是进行变量代换$z=y^{1-n}$ ,那么

$$ z'+P(x)z=Q(x) $$

就得到了标准的一阶非齐次方程的形式。

一阶 ODE 组

$n$ 个耦合的一阶微分方程如何求解?

$$ y_1'=F_1(x,y_1,y_2,...,y_n) $$

$$ ... $$

$$ y_n'=F_n(x,y_1,y_2,...,y_n) $$

为了方便描述,可以记 $\vec{y}=(y_1,…,y_n)^T$,类似的$\vec{F}=(F_1,…,F_n)^T$ 。

通解形如

$$ y_1(x)=\varphi_1(x,C_1,...C_n) $$

因为要解 $n$个方程,故有$n$ 个常数。
独立性的判断仍然是行列式

$$ |\frac{D(\vec{\varphi})}{D(\vec{C})}| $$

存在唯一性条件则相应有所变化,要求对 $(x,\vec{y})\in \Omega \subseteq \mathbb{R}\times \mathbb{R}^n$,在其上每个$F_i$对每个$y_i$ 满足一致的李普希兹条件。

为什么要研究方程组

我们考虑 $n$阶微分方程,实际上可以通过变量替换变成一个一阶 ode 组,只要令$u_i=y^{(i)}$ ,就得到

$$ u_1'=u_2 $$

$$ ... $$

$$ u_{n-1}'=u_n $$

$$ u_n=F(x,u_0,u_1...),即原来的微分方程 $$

也就是说,要解 $n$阶方程,只要解这样一个方程组就好。所以$n$阶方程有$n$个常数,实际上是因为对应$n$个一阶方程。把上述的常数独立性条件的$\varphi$改成对应的$y^{(n)}$,就发现和$n$ 阶微分方程的常数独立性条件一样。

对存在唯一性条件,我们看 $\vec{F}$ :

$$ \vec{F}(x, \vec{y}) = (y_2 \ y_3 \ \cdots \ G(x, y_1, \dots, y_n))^T $$

那么对应的雅可比矩阵也就是

$$ \frac{D(\vec{F})}{D(\vec{y})} = \begin{pmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ G_{y_1} & G_{y_2} & G_{y_3} & \cdots & G_{y_n} \end{pmatrix} $$

这个矩阵 $\in C^1$ 是李普希兹连续的一个充分条件(导数有界),那么也就只要求最下方那一排导数连续。

二阶微分方程存在唯一性条件要求 $p,q$ 连续,实际上也就是对应的导数。

各种形式

1. 一般形式(General Form)

最顶层是高度抽象的非线性向量方程:

$$ \vec{y}' = \vec{F}(x, \vec{y}) $$

  • 含义:系统的演化速率 $\vec{y}’$取决于当前自变量$x$和状态向量$\vec{y}$ 的某种复杂非线性组合。

2. 线性化(Linearization)

通过引入“线性”约束,方程退化为变系数线性微分方程组:

$$ \vec{y}' = A(x)\vec{y} + \vec{f}(x) $$

  • 结构

    • $A(x)$是系数矩阵,其元素随自变量$x$ 变化。

    • $\vec{f}(x)$ 是非齐次项(或称强制项)。

  • 逻辑:此时状态 $\vec{y}$ 对演化速率的影响是线性的。

3. 常系数化(Constant Coefficients)

进一步引入“常系数”约束,方程退化为最易求解的形式:

$$ \vec{y}' = A\vec{y} + \vec{f}(x) $$

  • 核心变化:矩阵 $A$不再随$x$ 变化,而是一个常数矩阵。

  • 价值:这是线性代数介入最深的领域,可以通过计算矩阵 $A$ 的特征值特征向量(如 Jordan 标准型)来直接写出通解。

阅读全文

笔记5.线性变换 I

线代 2026/4/18

首先,线性变换实际上是一种特殊的线性映射,定义域和陪域是同一个集合,所以我们关于线性映射的讨论仍然可以延续。

线性映射的核心定义

如果把一个空间 $U$映射到另一个空间$V$,要称之为“线性映射”,它必须恪守两个底线:

  • 可加性:先相加再映射,等同于映射后再相加,即 $\mathscr{A}(\alpha + \beta) = \mathscr{A}\alpha + \mathscr{A}\beta$。

  • 齐次性:缩放后的映射,等同于映射后再缩放,即 $\mathscr{A}(k\alpha) = k\mathscr{A}\alpha$。

    当这两个空间重合(即 $U = V$)时,我们通常称之为线性变换

基的像确定整个映射

对于从 $K^n$到$K^m$ 的映射,其操作的本质就是矩阵乘法

  • 标准基的作用:通过观察标准基向量(那些只有一位是 1,其余为 0 的向量)被映射后的去向,我们可以把这些结果纵向排列,构造出矩阵 $A$

  • 运算等价性:对向量 $x$进行线性映射,在计算层面等同于执行$Ax$。

设 $\mathscr{A}: \mathbf{K}^n \to \mathbf{K}^m$ 是线性映射

$$ \begin{bmatrix} 1 \\ 0 \\ \vdots \\ 0 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix}} , \quad \begin{bmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix}} , \dots, \quad \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 1 \end{bmatrix} \mapsto \color{green}{\begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix}} $$

$$ \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} \mapsto \begin{array}{|cccc|} \hline \color{green}{a_{11}} & \color{green}{a_{12}} & \dots & \color{green}{a_{1n}} \\ \color{green}{a_{21}} & \color{green}{a_{22}} & \dots & \color{green}{a_{2n}} \\ \vdots & \vdots & & \vdots \\ \color{green}{a_{m1}} & \color{green}{a_{m2}} & \dots & \color{green}{a_{mn}} \\ \hline \end{array} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} $$

**$\mathscr{A}$ 在标准基下的矩阵也就是表出系数。

这是线性代数中极具力量的一个结论:只要确定了基底的去向,整个映射就彻底定死了。

  • 定理内涵:如果你给定空间 $U$的一组基${\alpha_1, \dots, \alpha_n}$,并随意指定它们在 $V$中对应的目标${\beta_1, \dots, \beta_n}$,那么世界上存在且仅存在一个线性映射 $\mathscr{A}$ 满足这个对应关系。

  • 构造逻辑

    1. 由于任何向量 $\alpha$都能唯一地写成基底的线性组合$\alpha = \sum k_i \alpha_i$。

    2. 我们利用线性的“可加性”和“齐次性”,强制定义映射结果为 $\mathscr{A}\alpha = \sum k_i \beta_i$。

    3. 这种定义方式保证了映射的良定义性(即一个输入对应唯一确定的输出)。

证明一下吧:

验证 $\mathscr{A}$ 是线性映射

为了证明我们构造的映射 $\mathscr{A}$(即通过基底像的组合定义的映射)是合法的线性映射,需要验证其满足可加性与齐次性。

已知条件:

设 $\alpha = k_1 \alpha_1 + \dots + k_n \alpha_n \in U$若$\alpha’ = l_1 \alpha_1 + \dots + l_n \alpha_n \in U$,则:

验证过程:

  • 可加性:

$$ \begin{aligned} \mathscr{A} (\alpha + \alpha') &= (k_1 + l_1) \beta_1 + \dots + (k_n + l_n) \beta_n \\ &= (k_1 \beta_1 + \dots + k_n \beta_n) + (l_1 \beta_1 + \dots + l_n \beta_n) \\ &= \mathscr{A} \alpha + \mathscr{A} \alpha' \end{aligned} $$

  • 齐次性:

$$ \mathscr{A} (l \alpha) = l k_1 \beta_1 + \dots + l k_n \beta_n = l \mathscr{A} \alpha $$


$\mathscr{A}$ 的唯一性

这部分证明了:一旦基底的像 ${\beta_i}$ 被确定,世界上不存在第二个不同的线性映射能达成同样的对应关系。

证明过程:

若有线性映射 $\mathscr{B}: U \to V$,也满足:

$$ \mathscr{B} \alpha_i = \beta_i, \quad \forall i $$

则对于空间中任意向量的映射结果:

$$ \begin{aligned} \mathscr{B} (k_1 \alpha_1 + \dots + k_n \alpha_n) &= k_1 \mathscr{B} \alpha_1 + \dots + k_n \mathscr{B} \alpha_n \\ &= k_1 \beta_1 + \dots + k_n \beta_n \\ &= \mathscr{A} (k_1 \alpha_1 + \dots + k_n \alpha_n), \quad \forall k_i \end{aligned} $$

于是:

$$ \mathscr{B} = \mathscr{A} $$

线性映射的运算

线性运算:加法与数乘

若 $\mathscr{A}, \mathscr{B}$是从$U$到$V$ 的线性映射,则可以定义:

  • 加法:$(\mathscr{A} + \mathscr{B}): \alpha \mapsto \mathscr{A}\alpha + \mathscr{B}\alpha$

  • 数乘:$k\mathscr{A}: \alpha \mapsto k(\mathscr{A}\alpha) \quad (k \in K)$

这两个运算的结果仍然是线性映射。

核心结论:从 $U$到$V$ 的全体线性映射在上述运算下构成一个线性空间,记作 $\text{Hom}(U, V)$

陪域上能作的运算映射也可以作


复合运算:映射的乘法

设 $\mathscr{B} \in \text{Hom}(U, V)$,$\mathscr{A} \in \text{Hom}(V, W)$。

  • 定义:$\mathscr{B}$与$\mathscr{A}$的复合映射$\alpha \mapsto \mathscr{A}(\mathscr{B}\alpha)$是从$U$到$W$ 的线性映射。

  • 记法:称为 $\mathscr{A}$与$\mathscr{B}$ 的乘积,记作 $\mathscr{A}\mathscr{B}$

  • 前提条件:$\mathscr{B}$的陪域与$\mathscr{A}$ 的定义域相同。

  • 结合律:$(\mathscr{A}\mathscr{B})\mathscr{C} = \mathscr{A}(\mathscr{B}\mathscr{C})$。


线性变换的代数结构

当映射发生在同一个空间上,即 $\mathscr{A}, \mathscr{B} \in \text{Hom}(V)$ 时,结构变得更加丰富:

  • $\text{Hom}(V)$(或记作 $\text{End}(V)$)上的线性变换不但能相加、数乘,还能作乘法运算。

  • 该乘法满足结合律、对加法的分配律,且存在单位元 $\mathscr{I}$(恒等变换)。

核心结论:$\text{Hom}(V)$ 构成一个 $K$-代数


算子运算实例:微分与乘法

幻灯片展示了一个极具启发性的例子,定义在 $C^1(\mathbb{R})$ 上的变换:

  • 微分算子 $D$:$f(x) \mapsto f’(x)$- 乘法算子$S$:$f(x) \mapsto xf(x)$根据导数的乘法法则$(xf(x))’ = xf’(x) + f(x)$,可以推导出算子之间的关系:

$$ (DS - SD)f = (xf)' - xf' = f'x + f - xf' = f $$

即:$DS - SD = \mathscr{I}$

这实际上是量子力学中正则对易关系在函数空间的数学原型。


几何变换实例:投影变换

沿 $W$向$U$的投影变换$\mathscr{P}_U$

  • 背景:空间 $V$可以分解为直和$V = U \oplus W$。

  • 定义:对于任何向量 $\alpha = \beta + \gamma$(其中 $\beta \in U, \gamma \in W$),投影算子将其映射为 $U$ 中的分量:

$$ \mathscr{P}_U: \alpha \mapsto \beta $$

  • 几何直观:所有平行于 $W$的向量被“压扁”到了平面$U$ 上。

投影变换的代数定义

当空间 $V$可以分解为直和$V = U \oplus W$时,任何向量$\alpha$都能唯一分解为$\alpha = \beta + \gamma$(其中 $\beta \in U, \gamma \in W$)。

  • 投影算子 $P_U$:定义为 $\alpha \mapsto \beta$。

  • 基本性质

    • 幂等性:$P_U^2 = P_U$(投射一次后再投射,结果不再改变)。

    • 正交互补性:$P_U P_W = 0$且$P_U + P_W = I$。

2. 核心定理:投影与幂等的等价性

这是线性代数中的一个优美结论:一个线性变换 $P$ 是投影变换,当且仅当它是幂等变换($P^2 = P$)。

  • 空间分解:若 $P^2 = P$,则整个空间 $V$ 必然可以分解为:

$$ V = \text{Im } P \oplus \text{Ker } P $$

  • 物理意义

    • $P$是沿$\text{Ker } P$向$\text{Im } P$ 的投影。

    • $I - P$则是反过来的“镜像”操作,即沿$\text{Im } P$向$\text{Ker } P$ 的投影。

3. 证明逻辑要点

通过代数推导验证这种直和关系:

  • 不动点特性:在 $\text{Im } P$中的向量$\beta$,在 $P$ 的作用下“点点不动”($P\beta = \beta$)。

  • 零交集:通过 $P\beta = \beta$和$\beta \in \text{Ker } P \implies P\beta = 0$联立,证明了$\text{Im } P \cap \text{Ker } P = {0}$,从而满足直和的条件。

  • 全空间覆盖:利用恒等式 $\alpha = P\alpha + (I - P)\alpha$,说明任何向量都能拆分成这两个子空间的成员。

4. 推广:空间的多项分解

这一部分将二元投影推广到了多个子空间的情形。

  • 定理(正向):如果 $V$是多个子空间的直和$V = V_1 \oplus \dots \oplus V_s$,那么必然存在一组投影算子 $P_1, \dots, P_s$,它们满足:

    1. 两两正交:$P_i P_j = 0 \quad (i \neq j)$

    2. 完备性:$\sum P_i = I$

    3. 像空间对应:$\text{Im } P_i = V_i$- 定理(逆向):反之,若一组算子满足上述三个条件,它们就定义了空间$V$ 的一个直和分解。

5.多项式与投影

此前,我们已经讨论过如下定理:

设 $f_1(x), \dots, f_s(x) \in K[x]$两两互素。记$f(x) = \prod_{i=1}^s f_i(x)$。对于 $A \in M_n(K)$,有:

$$ \text{Ker } f(A) = \text{Ker } f_1(A) \oplus \text{Ker } f_2(A) \oplus \dots \oplus \text{Ker } f_s(A) $$

这实际上给出了一组投影。

线性映射空间与矩阵空间的同构

结论:$\text{Hom}(U, V) \cong M_{m,n}(K)$

当我们分别为线性空间 $U$和$V$取定基底${\alpha_1, \dots, \alpha_n}$和${\beta_1, \dots, \beta_m}$时,每一个线性映射$\mathscr{A}$都唯一对应一个矩阵$A$。

  • 映射关系:$(\mathscr{A}\alpha_1, \mathscr{A}\alpha_2, \dots, \mathscr{A}\alpha_n) = (\beta_1, \beta_2, \dots, \beta_m)A$- 本质:这种对应不仅是双射,还保持了加法和数乘运算,意味着$\text{Hom}(U, V)$作为一个线性空间的结构,被矩阵空间$M_{m,n}(K)$ 完美“克隆”了。

基础矩阵与基本映射

正如矩阵空间有一组标准基 $E_{ij}$(仅在 $(i, j)$ 位置为 1,其余为 0),映射空间也有对应的基本映射

  • 定义:$E_{ij}: U \to V$,其作用规律为:

$$ E_{ij}(\alpha_k) = \begin{cases} \beta_i & k=j \\ 0 & k \neq j \end{cases} $$

  • 意义:这组基本映射构成了 $\text{Hom}(U, V)$ 的基底。这告诉我们,任何复杂的线性映射都可以拆解为这些“只把特定的输入基映射到特定的输出基”的简单动作的线性组合。

映射复合与矩阵乘法的等价性

这是线性代数中最关键的定理之一:映射的复合对应矩阵的乘法。

  • 定理描述

    设 $\mathscr{B}: U \to V$的矩阵是$B$,$\mathscr{A}: V \to W$的矩阵是$A$。

    那么复合映射 $\mathscr{AB}: U \to W$的矩阵恰好就是$AB$。

  • 逻辑演示

    通过观察基底像的传递过程:

$$ \begin{aligned} (\mathscr{AB}\alpha_1, \dots, \mathscr{AB}\alpha_n) &= \mathscr{A}((\beta_1, \dots, \beta_m)B) \\ &= ((\mathscr{A}\beta_1, \dots, \mathscr{A}\beta_m))B \\ &= ((\gamma_1, \dots, \gamma_s)A)B \\ &= (\gamma_1, \dots, \gamma_s)(AB) \end{aligned} $$


结合律的传递

  • 映射层面:映射的复合天然满足结合律,即 $(\mathscr{AB})\mathscr{C} = \mathscr{A}(\mathscr{BC})$。

  • 矩阵层面:基于上述等价性,矩阵乘法也必须满足结合律。

复合映射的像空间与维度公式

  • 核心定理

$$ \dim \text{Im } \mathscr{B} = \dim \text{Im } \mathscr{AB} + \dim(\text{Im } \mathscr{B} \cap \text{Ker } \mathscr{A}) $$

  • 证明逻辑

    1. 考察 $\mathscr{A}$在$\text{Im } \mathscr{B}$上的限制映射$\mathscr{A}’ : \text{Im } \mathscr{B} \to W$。

    2. 根据线性映射基本定理(第一同构定理):$\text{Im } \mathscr{B} / \text{Ker } \mathscr{A}’ \cong \text{Im } \mathscr{A}’$。

    3. 验证可知:$\text{Im } \mathscr{A}’ = \text{Im } \mathscr{AB}$,且 $\text{Ker } \mathscr{A}’ = \text{Im } \mathscr{B} \cap \text{Ker } \mathscr{A}$。

  • 推论(Sylvester 秩不等式)

    利用上述维数公式,可以推导出:

$$ \dim \text{Im } \mathscr{A} + \dim \text{Im } \mathscr{B} \leq \dim \text{Im } \mathscr{AB} + \dim V $$

对于矩阵形式,即:$\text{rank}(A) + \text{rank}(B) \leq \text{rank}(AB) + n$

_等号成立条件:$\text{Ker } \mathscr{A} \subseteq \text{Im } \mathscr{B}$,即 $A$的解空间包含于$B$ 的列空间。_

这在之前,我们曾用打洞法构造大矩阵证明过。


基变换与矩阵表示的演变

这是线性代数从“静态矩阵”向“动态变换”跨越的关键。

核心问题

当 $U$的基底从${\alpha_i}$变为${\alpha’_i}$(过渡矩阵为 $P$),$V$的基底从${\beta_j}$变为${\beta’_j}$(过渡矩阵为 $Q$)时,映射 $\mathscr{A}$ 的矩阵如何变化?

变换定理

若 $\mathscr{A}$在原基底下的矩阵为$A$,则在新基底下的矩阵为:

$$ \mathbf{B} = Q^{-1} A P $$

证明推导

  1. 关系式 1:$\mathscr{A}(\alpha_1 \dots \alpha_n) = (\beta_1 \dots \beta_m)A$

  2. 基变换:$(\alpha’_1 \dots \alpha’_n) = (\alpha_1 \dots \alpha_n)P$;$(\beta’_1 \dots \beta’_m) = (\beta_1 \dots \beta_m)Q \implies (\beta_1 \dots \beta_m) = (\beta’_1 \dots \beta’_m)Q^{-1}$

  3. 代入计算

$$ \begin{aligned} \mathscr{A}(\alpha'_1 \dots \alpha'_n) &= \mathscr{A}(\alpha_1 \dots \alpha_n)P \\ &= (\beta_1 \dots \beta_m)AP \\ &= (\beta'_1 \dots \beta'_m)Q^{-1}AP \end{aligned} $$

在线性变换的语境下,就自然出现了所谓相似,$A=PQP^{-1}$ 。相似描述的实际上也就是同一个线性变换在不同基的表现。

在最美妙的选取下,就会出现所谓标准型,分块地写成单位阵和0。

阅读全文

Picard存在性定理

2026/4/18

系列前言

高斯对拆掉脚手架后的完美证明感到满意,但读者也只好接受美妙的证明却难以一窥背后的思路。实际上,大部分的证明都是有迹可循的,来源于已有的证明,而非凭空发明的思路,这也正是数学笔记的一大意义,积累足够的素材,于是自然地得到看似天马行空的证明。

我们总是希望详尽的理解,但教科书或者常见的证明则好像冷酷的传统印象的机械,工序化地一步步证明命题,却并不告诉我们纲要,不告诉我们背后的思路。这于是自然地驱动我们去发掘,为什么数学家会想到这么干。幸而如今 AI 十分超标,指令一下,便可以得到详尽的解释,但又有些不幸,还没到输出能让人直接采纳,于是我做一个中转,整理出得到的,至少我自己接受的一个思路还原。

第一篇是 Picard 的原因很简单,我看书看破防了。这是一个对我而言有一定长度的证明,教材分了一二三四步,我一步步看下去感觉不知所云。

问题

19 世纪初期,数学家面临这样一个困境:求解一阶微分方程

$$ \frac{dy}{dx} = f(x, y), \quad y(x_0) = y_0 $$

的显式解析解,仅在极其有限的特殊情形下才是可能的(如变量分离方程、恰当方程、线性方程等)。然而,来自物理学的需求却是压倒性的——牛顿力学、天体力学、热传导、流体运动,无一不产生这样的方程。物理学家的直觉告诉他们,给定一个系统的初始状态和演化规律,未来的状态“应当”是确定的。但直觉不是数学证明。是否存在解?如果存在,是否唯一? ——这两个问题直接关系到整个经典物理学世界观的可信度。

在 Cauchy 之前,整个 18 世纪关于微分方程的工作几乎全部聚焦于求解技术。Bernoulli 家族、Euler、Lagrange 等大师发展了大量精巧的积分技巧——积分因子、变量代换、幂级数展开等。但这些方法都有一个共同的局限性:它们只能处理能够被“积出来”的方程。对于非线性方程

$$ \frac{dy}{dx} = x^2 + y^2, $$

18 世纪的数学家无能为力。这个方程没有初等函数形式的解,但在数学上却完全“合法”。于是,一个深刻的问题浮现了:一个“合法”提出的微分方程,是否必然拥有解?

对于今天的我们来说,这不是一个自明的问题。请考虑以下具体例子:

(Peano 反例):考虑初值问题

$$ \frac{dy}{dx} = 3y^{2/3}, \quad y(0) = 0. $$

通过观察,可以验证函数 $y(x) \equiv 0$满足该方程。但进一步考察会发现,对于任意$c > 0$,函数

$$ y(x) = \begin{cases} 0, & x \leq c \\ (x - c)^3, & x > c \end{cases} $$

同样满足方程。这意味着从同一个初始点出发,存在无穷多条解曲线。物理上的决定论——给定初始条件唯一确定未来演化——在这里彻底失效。如果微分方程允许这种多解性,那么整个经典力学的哲学基础都将动摇。这个例子清楚地说明,解的存在性和唯一性绝非理所当然,而是需要被严格证明的数学性质

解决

转化成积分方程

面对

$$ \frac{dy}{dx} = f(x, y), \quad y(x_0) = y_0 $$

时,最朴素、最不需要创造力的念头就是:两边积分

这不是一个需要灵感的操作。微积分基本定理在 Cauchy 的时代早已是标准工具。对一个方程两边积分是“解微分方程”的最原始本能——就像看到 $a = b$会想到$a - b = 0$ 一样自然。积分之后得到:

$$ y(x) - y(x_0) = \int_{x_0}^{x} f(t, y(t)) \, dt $$

代入初始条件,直接就是:

$$ y(x) = y_0 + \int_{x_0}^{x} f(t, y(t)) \, dt $$

从微分方程到积分方程的转换,在形式上只是微积分基本定理的直接应用。数学家之所以会“想到”它,不是因为有什么深刻的洞见,而是因为 任何试图处理微分方程的人,迟早都会写下这个等式——它是出发点的自然延伸,不是终点处的巧妙构造。

写下积分等式是容易的。困难的是 意识到这个看似同义反复的改写,竟然可以用来证明解的存在性。这一步才是思想史上真正值得追问的“为什么想到”。

这个洞察的来源,可以从两个方向追溯:

方向一:数值逼近的启发(Euler 折线法的反思)

Euler 折线法在 18 世纪已广为人知。它的构造方式是:从 $x_0$出发,走一小步$h$,用当前斜率 $f(x_0, y_0)$更新$y$。这个过程本质上是在做:

$$ y_{n+1} = y_n + h f(x_n, y_n) $$

数学家会自然地追问:当 $h \to 0$ 时,这些折线收敛到什么?如果我们把离散的递推求和写成积分近似的形式,它就是:

$$ y(x) \approx y_0 + \sum f(x_i, y_i) \Delta x \longrightarrow y_0 + \int_{x_0}^{x} f(t, y(t)) \, dt $$

也就是说,Euler 折线法的连续极限天然地暗示了积分方程的形式。那些试图严格化 Euler 折线法的数学家(如 Cauchy、Peano)在做极限论证时,必须处理的正是这个积分等式。所以,积分方程并非从天上掉下来的灵感,而是 从离散逼近的极限过程中自动涌现出来的

方向二:积分方程研究的先行经验(Liouville-Neumann 方法)

在 Picard 之前,积分方程领域已经有了逐次逼近法的成功先例。对于方程

$$ y(x) = g(x) + \lambda \int_{a}^{x} K(x, t) y(t) \, dt $$

Liouville 和 Neumann 在 19 世纪中叶发展了一套迭代求解技术:从一个初始猜测出发,反复代入积分号下,得到 Neumann 级数。这种方法在求解 Volterra 积分方程时被证明极为有效。

Picard 的“想到”很可能是一种 类比迁移:他看到常微分方程的初值问题恰好可以写成这种积分方程的形式(右端没有 $y$在积分外的项,或者说$g(x) \equiv y_0$)。既然积分方程那边已经有一套成熟的迭代技术,为什么不直接搬过来用?于是有了 Picard 迭代。

所以,对 Picard 而言,“换成积分方程”不是原创动作,而是 为了使用已有的积分方程工具而做的刻意变形。他看到微分方程,想到的是:“这玩意能写成积分方程吗?如果能,我就能用 Neumann 那一套了。”

先前的经验之 Neumann 级数

Neumann 级数是求解积分方程的核心工具。它的核心思想是,通过无穷级数来构造性地表示一个算子的逆。就思想而言,实际上线性代数中也就碰到过,例如求 $A - I$ 的逆。

1. 核心思想:算子版本的“几何级数”

Neumann 级数的灵感直接来源于经典的几何级数公式:

$$ \frac{1}{1 - r} = 1 + r + r^2 + r^3 + \cdots \quad (\text{当 } |r| < 1) $$

现在,我们不把 $r$ 看作一个数,而是一个作用在函数上的线性算子(或矩阵)$K$。那么,$(I - K)^{-1}$(可以类比为$\frac{1}{1-K}$)的逆,就可以形式地写成:

$$ (I - K)^{-1} = I + K + K^2 + K^3 + \cdots $$

这个算子形式的几何级数,就是 Neumann 级数。其中,$I$ 是恒等算子,$K^2$表示连续两次应用算子$K$。

2. 在积分方程中的具体应用

Neumann 级数最经典的应用场景是求解第二类 Fredholm 积分方程。其形式如下:

$$ y(x) = f(x) + \lambda \int_{a}^{b} K(x, t) y(t) \, dt $$

这个方程可以简洁地写成算子形式:

$$ y = f + \lambda K y $$

我们的目标是求解未知函数 $y(x)$。对上述算子方程进行整理:

$$ (I - \lambda K) y = f $$

关键一步:形式上解出 $y$,就得到了逆算子的表达式:

$$ y = (I - \lambda K)^{-1} f $$

接下来,应用 Neumann 级数将逆算子展开:

$$ y = (I + \lambda K + \lambda^2 K^2 + \lambda^3 K^3 + \cdots) f $$

将这个算子级数展开并写回积分形式,我们就得到了解的级数表达式。这个级数由以下各项构成:

  • 零阶项: $y_0(x) = f(x)$- 一阶项:$y_1(x) = \lambda \int_{a}^{b} K(x, t) f(t) , dt$- 二阶项:$y_2(x) = \lambda^2 \int_{a}^{b} K(x, t) \left[ \int_{a}^{b} K(t, t_1) f(t_1) , dt_1 \right] dt$
  • ……以此类推。

这个构造过程被称为“逐次逼近法”,而得到的级数正是 Neumann 级数。

3. 历史脉络:从 Carl Neumann 到 Picard

  • Carl Neumann (1870s): 德国数学家 Carl Neumann 在研究位势理论中的 Dirichlet 问题时,发展了这一方法。他于 1870 年首次对严格凸区域上的 Dirichlet 问题给出了解的存在性证明,其核心在于证明相应积分算子的 Neumann 级数是收敛的。
  • Picard 的继承 (1890s): Émile Picard 直接继承了 Neumann 的成果。他将 Neumann 级数和逐次逼近法从积分方程“移植”到常微分方程领域,用来证明解的存在唯一性,这就是我们熟知的 Picard 迭代法。可以说,Neumann 级数为 Picard 的工作提供了直接的技术蓝图。

试图还原 Picard 的想法

有了上述,实际上也就可以试着还原了。叠甲:下面所有类似 Picard 的思考都是意淫。

证明的完整还原

问题设定

研究对象:一阶常微分方程的初值问题

$$ \frac{dy}{dx} = f(x, y), \quad y(x_0) = y_0 $$

已知条件

  1. 函数 $f(x, y)$在某个包含点$(x_0, y_0)$ 的闭矩形区域

$$ R = \{ (x, y) \in \mathbb{R}^2 : |x - x_0| \leq a, |y - y_0| \leq b \} $$

上连续。因此,根据闭区间上连续函数的性质,$f$在$R$上有界,即存在常数$M > 0$,使得对所有 $(x, y) \in R$,有 $|f(x, y)| \leq M$。

  1. 函数 $f(x, y)$在$R$上关于变量$y$满足 Lipschitz 条件:存在常数$L > 0$,使得对于任意 $(x, y_1) \in R$和$(x, y_2) \in R$,都有

$$ |f(x, y_1) - f(x, y_2)| \leq L |y_1 - y_2| $$

目标:证明在上述条件下,存在唯一的函数 $y = \phi(x)$,定义在某个包含 $x_0$的区间$I$ 上,满足该微分方程及初始条件。

第一步:转化为积分方程

推导
对微分方程 $\frac{dy}{dt} = f(t, y(t))$两边在区间$[x_0, x]$ 上积分:

$$ \int_{x_0}^{x} \frac{dy}{dt} \, dt = \int_{x_0}^{x} f(t, y(t)) \, dt $$

根据微积分基本定理,左边等于 $y(x) - y(x_0)$。代入初始条件 $y(x_0) = y_0$,得到:

$$ y(x) - y_0 = \int_{x_0}^{x} f(t, y(t)) \, dt $$

移项得到等价的积分方程

$$ y(x) = y_0 + \int_{x_0}^{x} f(t, y(t)) \, dt $$

观察
现在问题变了。我不需要找一个可导的函数,只需要找一个连续函数 $y(x)$满足这个积分方程。一旦找到,由$f$的连续性,右边作为$x$的函数是可导的,从而$y(x)$ 自动是可导的,并且满足原微分方程和初始条件。这个转化的好处是:积分运算对函数的“光滑性”要求比求导低,它把连续函数映射为连续函数。这让我可以在连续函数空间这个更“宽敞”也更“结实”的框架里工作。

第二步:构造 Picard 迭代序列

推导
构造一个函数序列 ${\phi_n(x)}_{n=0}^{\infty}$ 如下:

  1. 取初始猜测为常值函数:$\phi_0(x) \equiv y_0$。这是最自然的起点,因为我们唯一确定的信息就是在 $x_0$ 处的值。
  2. 递归定义:

$$ \phi_{n+1}(x) = y_0 + \int_{x_0}^{x} f(t, \phi_n(t)) \, dt, \quad n = 0, 1, 2, \dots $$

现在,整个证明的核心就变成了:证明这个序列 ${\phi_n(x)}$在某种意义下收敛,且其极限函数$\phi(x)$ 恰好满足那个积分方程。

第三步:确定迭代的有效区间

推导
我需要确定一个最大允许的区间半径 $h > 0$,使得只要 $|x - x_0| \leq h$,就能保证所有迭代函数的值都满足 $|\phi_n(x) - y_0| \leq b$。

让我们用归纳法来寻找这个 $h$。

  • 假设对于某个 $n$和所有满足$|x - x_0| \leq h$的$x$,都有 $|\phi_n(x) - y_0| \leq b$。
  • 那么对于下一步迭代,

$$ |\phi_{n+1}(x) - y_0| = \left| \int_{x_0}^{x} f(t, \phi_n(t)) \, dt \right| \leq \left| \int_{x_0}^{x} |f(t, \phi_n(t))| \, dt \right| \leq M |x - x_0| $$

  • 为了保证 $|\phi_{n+1}(x) - y_0| \leq b$,只要 $M |x - x_0| \leq b$ 即可。

因此,我只需要选择 $h$满足$Mh \leq b$。同时,为了不超出 $R$的水平边界,我还需要$h \leq a$。

结论
取 $h = \min\left(a, \frac{b}{M}\right)$。在区间 $I = [x_0 - h, x_0 + h]$上,所有迭代函数$\phi_n(x)$的定义都是良性的,且其图像始终保持在矩形区域$R$ 内。

第四步:估计相邻迭代之差

推导
从 $n=1$ 开始:

$$ |\phi_1(x) - \phi_0(x)| = \left| \int_{x_0}^{x} f(t, y_0) \, dt \right| \leq M |x - x_0| $$

对于一般的 $n \geq 1$,利用迭代定义和 Lipschitz 条件,

$$ \begin{aligned} |\phi_{n+1}(x) - \phi_n(x)| &= \left| \int_{x_0}^{x} [f(t, \phi_n(t)) - f(t, \phi_{n-1}(t))] \, dt \right| \\ &\leq \left| \int_{x_0}^{x} |f(t, \phi_n(t)) - f(t, \phi_{n-1}(t))| \, dt \right| \end{aligned} $$

关键点:这里用到了 Lipschitz 条件。它允许我将关于 $f$的差的估计转化为关于$\phi$ 的差的估计,这是整个证明能够进行下去的基石。

$$ \leq L \left| \int_{x_0}^{x} |\phi_n(t) - \phi_{n-1}(t)| \, dt \right| $$

第五步:递推估计与阶乘因子的出现

推导
让我们尝试计算前几项来寻找规律。

  • 已知:$|\phi_1(x) - \phi_0(x)| \leq M |x - x_0|$- 计算$|\phi_2(x) - \phi_1(x)|$:

$$ |\phi_2(x) - \phi_1(x)| \leq L \left| \int_{x_0}^{x} M |t - x_0| \, dt \right| = M L \frac{|x - x_0|^2}{2} $$

  • 计算 $|\phi_3(x) - \phi_2(x)|$:

$$ |\phi_3(x) - \phi_2(x)| \leq L \left| \int_{x_0}^{x} M L \frac{|t - x_0|^2}{2} \, dt \right| = M L^2 \frac{|x - x_0|^3}{3!} $$

一般公式
规律已经非常明显了。我可以断言,对于所有 $n \geq 1$和$x \in I$,有以下估计成立:

$$ |\phi_n(x) - \phi_{n-1}(x)| \leq \frac{M L^{n-1}}{n!} |x - x_0|^n \leq \frac{M L^{n-1}}{n!} h^n $$

Picard 的洞察
这个估计的美妙之处在于分母上的阶乘 $n!$。它增长得如此之快,以至于无论常数 $M, L, h$的具体值是多少,只要它们是有限的,级数$\sum_{n=1}^{\infty} \frac{M L^{n-1}}{n!} h^n$ 都必然收敛。这正是我需要的收敛性的保证。

第六步:证明序列的一致收敛

推导
考虑级数

$$ \sum_{n=1}^{\infty} \max_{x \in I} |\phi_n(x) - \phi_{n-1}(x)| $$

根据第五步的估计,这个级数的每一项都被 $\frac{M L^{n-1}}{n!} h^n$ 所控制。

考虑数值级数 $\sum_{n=1}^{\infty} \frac{M L^{n-1}}{n!} h^n$。我们可以用比值判别法来检验其收敛性:

$$ \lim_{n \to \infty} \frac{\frac{M L^n}{(n+1)!} h^{n+1}}{\frac{M L^{n-1}}{n!} h^n} = \lim_{n \to \infty} \frac{L h}{n+1} = 0 $$

由于极限为 0(小于 1),该数值级数收敛。

根据 Weierstrass M-判别法,由于函数项级数的每一项在区间 $I$上的绝对值都被一个收敛的正项级数的对应项所控制,因此该函数项级数在$I$ 上一致收敛

结论
这意味着 Picard 迭代序列 ${\phi_n(x)}$在区间$I$上一致收敛于一个极限函数,记作$\phi(x)$。由于每个 $\phi_n$都是连续的,且收敛是一致的,极限函数$\phi(x)$ 也是连续的。

第七步:证明极限函数是解

推导
回忆迭代公式:

$$ \phi_{n+1}(x) = y_0 + \int_{x_0}^{x} f(t, \phi_n(t)) \, dt $$

我想对等式两边取极限 $n \to \infty$。
左边直接趋于 $\phi(x)$。
对于右边,我需要将极限号移入积分号内,即证明:

$$ \lim_{n \to \infty} \int_{x_0}^{x} f(t, \phi_n(t)) \, dt = \int_{x_0}^{x} \lim_{n \to \infty} f(t, \phi_n(t)) \, dt = \int_{x_0}^{x} f(t, \phi(t)) \, dt $$

合法性验证

  1. 我已经知道函数序列 ${\phi_n(t)}$在$I$上一致收敛于$\phi(t)$。
  2. 函数 $f$在闭矩形$R$上是连续的,因此在$R$ 上是一致连续的。
  3. 根据一致连续的性质,对于任意给定的 $\varepsilon > 0$,存在 $\delta > 0$,只要 $|\phi_n(t) - \phi(t)| < \delta$,就有 $|f(t, \phi_n(t)) - f(t, \phi(t))| < \varepsilon$。
  4. 由于 ${\phi_n(t)}$一致收敛,对于这个$\delta$,存在 $N$,当 $n > N$时,对所有$t \in I$都有$|\phi_n(t) - \phi(t)| < \delta$。
  5. 因此,当 $n > N$时,对所有$t \in I$都有$|f(t, \phi_n(t)) - f(t, \phi(t))| < \varepsilon$。这意味着函数序列 ${f(t, \phi_n(t))}$在$I$上一致收敛于$f(t, \phi(t))$。
  6. 对于一致收敛的函数序列,积分和极限可以交换。

结论
因此,取极限是合法的,我得到:

$$ \phi(x) = y_0 + \int_{x_0}^{x} f(t, \phi(t)) \, dt $$

这说明 $\phi(x)$ 满足积分方程,从而是初值问题的一个解。存在性得证。

第八步:证明唯一性

推导
假设存在另一个函数 $\psi(x)$ 也满足积分方程:

$$ \psi(x) = y_0 + \int_{x_0}^{x} f(t, \psi(t)) \, dt $$

考虑两个解之差的绝对值 $u(x) = |\phi(x) - \psi(x)|$。将两者满足的积分方程相减并取绝对值:

$$ u(x) = \left| \int_{x_0}^{x} [f(t, \phi(t)) - f(t, \psi(t))] \, dt \right| \leq \left| \int_{x_0}^{x} |f(t, \phi(t)) - f(t, \psi(t))| \, dt \right| $$

再次应用 Lipschitz 条件:

$$ u(x) \leq L \left| \int_{x_0}^{x} |\phi(t) - \psi(t)| \, dt \right| = L \left| \int_{x_0}^{x} u(t) \, dt \right| $$

现在我需要从这个积分不等式推导出 $u(x) \equiv 0$。不失一般性,考虑 $x \geq x_0$的情况。定义$U(x) = \int_{x_0}^{x} u(t) , dt$。那么 $U’(x) = u(x)$。上述不等式变为:

$$ U'(x) \leq L \cdot U(x) $$

移项得 $U’(x) - L U(x) \leq 0$。两边乘以积分因子 $e^{-Lx}$:

$$ \frac{d}{dx} \left( e^{-Lx} U(x) \right) \leq 0 $$

这说明函数 $e^{-Lx} U(x)$在$x \geq x_0$上是单调不增的。在$x = x_0$ 处,$U(x_0) = \int_{x_0}^{x_0} u(t) , dt = 0$。因此,对于所有 $x \geq x_0$,有 $e^{-Lx} U(x) \leq 0$。但由于 $e^{-Lx} > 0$且$U(x) = \int_{x_0}^{x} u(t) , dt \geq 0$,我们得出 $U(x) \leq 0$且$U(x) \geq 0$,故 $U(x) = 0$。

由于 $U(x) = 0$,其导数 $u(x) = U’(x)$也必然为 0(此处$u$是连续的)。所以$u(x) \equiv 0$,即 $\phi(x) = \psi(x)$对所有$x \geq x_0$成立。对于$x \leq x_0$ 的情况,论证类似。

结论:唯一性得证。

证明完成

综合以上八个步骤,Picard 完整地证明了在连续性和 Lipschitz 条件下,初值问题在某个局部区间上存在且唯一解。他不仅证明了存在性,而且提供了一种构造性的算法(Picard 迭代)以及误差估计(通过阶乘级数的余项),这在当时是关于微分方程理论基础的一项重大突破。

通过这样,所谓的 $h$ 的形式也就很自然。

证明结构总结

Picard 的证明可以浓缩为以下几个技术节点:

步骤 核心操作 关键条件 目的
1 转化为积分方程 微积分基本定理 降低光滑性要求,嵌入初始条件
2 构造迭代序列 $f$ 连续 生成候选逼近序列
3 确定有效区间 $f$ 在紧集上有界 保证迭代良定义
4 估计相邻差 Lipschitz 条件 控制误差传递
5 递推得阶乘估计 数学归纳法 获得显式收敛速率
6 证明一致收敛 Weierstrass M-判别法 确立极限函数存在
7 取极限得解 一致连续 + 一致收敛 验证极限函数是解
8 唯一性证明 Lipschitz 条件 + Gronwall 排除多解可能性

Picard 迭代与 Neumann 级数的对应关系

最后,也许读起来还是会让人有些跳跃的部分还是这个联系,我们再做一点点补充:

这个问题的答案,不在于 Picard 盯着微分方程本身想出了什么妙招,而在于他把目光从微分方程移开,投向了另一个已经成熟的数学领域

1. 真正的灵感来源:积分方程中的“现成工具”

在 Picard 着手研究微分方程存在性的 1890 年代之前,数学界在另一个领域已经发展出了一套完整的、被称为“逐次逼近法”的技术。这个领域就是积分方程

具体来说,研究第二类 Volterra 积分方程(形如 $y(x) = g(x) + \int_a^x K(x, t) y(t) , dt$)的数学家,比如 Liouville 和 Neumann,面临的问题和 Picard 其实是一样的:解不出来显式,但需要证明它存在

他们是怎么做的?他们注意到,如果把整个积分运算看作一个算子 $T$,方程就是 $y = g + Ty$。一个非常自然的想法是:先猜 $y_0 = g$,代入右边得到 $y_1 = g + Tg$。但这显然不是解,因为 $y_1$和$g$不一样。那如果把$y_1$再代进去呢?就得到了$y_2 = g + Ty_1 = g + Tg + T^2g$。一直继续下去,就得到了一个无穷级数:

$$ y = g + Tg + T^2g + T^3g + \cdots $$

这就是 Neumann 级数。他们证明了,只要核 $K(x, t)$ 满足一定的有界条件,这个级数就是收敛的,并且收敛到的函数就是原积分方程的解。这个方法在 Picard 的时代已经是积分方程领域的标准工具,不是秘密,不是猜想,而是已经被写进论文和教科书里的成熟方法。

2. Picard 的“为什么”:一次天才的类比移植

现在,让我们把镜头转向 Picard。他面对的是微分方程初值问题:

$$ \frac{dy}{dx} = f(x, y), \quad y(x_0) = y_0 $$

他做的第一步——也是所有 19 世纪数学家都会做的本能动作——就是把它两边积分,变成:

$$ y(x) = y_0 + \int_{x_0}^x f(t, y(t)) \, dt $$

此时,Picard 的脑子里发生了什么?他看到这个等式,并不是像我们今天的学生一样,仅仅把它看作“微分方程的等价形式”。他看到的是另一副面孔:

这个等式,不就是一个积分方程吗?

具体来说,如果定义算子 $T$为$(Ty)(x) = \int_{x_0}^x f(t, y(t)) , dt$,那么这个方程就是:

$$ y = y_0 + Ty $$

这和 Volterra 积分方程 $y = g + Ty$在结构上完全一致!唯一的区别是,这里的$T$依赖于未知函数$y$的非线性方式(通过$f$),而经典的积分方程中 $T$是线性的(即$Ty = \int K(x, t) y(t) , dt$)。但形式上的相似性是如此强烈,以至于任何一个熟悉积分方程文献的人都会产生一个念头:

既然积分方程那边用“反复代入”的方法(Neumann 级数)能够成功构造出解,那么对于这个方程,我能不能也试试同样的套路?

这就是 Picard 的“为什么”。他不是在发明一个新的哲学,他是在套用一个已知的、在相邻领域被证明极其有效的算法模板。

这个思维的跳跃,本质上是一次类比

  • 源领域:线性积分方程(已知:Neumann 级数有效)
  • 目标领域:非线性微分方程的积分形式(未知:是否有效?)
  • 相似性:方程都具有 $y = g + Ty$ 的抽象形式
  • 行动:将源领域的解法(迭代)直接搬用到目标领域

Picard 的贡献,并不是凭空想出了“反复代入”这个动作,而是勇敢地将这个动作从线性积分方程迁移到了非线性的情境下,并成功地证明了它在 Lipschitz 条件下依然收敛。他的天才体现在“迁移的胆识”和“收敛证明的构造”(用阶乘估计代替 Neumann 的几何级数),而不是迭代动作本身的原创。

3. 证据与旁证

这个解释不是事后合理化的猜测。从历史文献中我们可以看到清晰的脉络:

  • Carl Neumann 在 1870 年代发表的关于位势理论的工作中,明确使用了级数展开法(即后来的 Neumann 级数)来求解边界积分方程。
  • Émile Picard 在 1890 年的论文中,明确引用了 Neumann 的工作,并指出他是将类似的方法应用于更一般的(非线性)情形。事实上,Picard 在 1890 年正是利用 Neumann 的结果发展了他的逐次逼近法。
  • Picard 迭代在现代泛函分析教材中,经常被作为 Banach 不动点定理的前身和特例来介绍,而 Banach 不动点定理的另一直接前身,正是积分方程中 Neumann 级数的抽象化。

因此,历史的链条是清晰的:积分方程中的 Neumann 级数 → Picard 的类比移植 → 微分方程中的 Picard 迭代 → Banach 的抽象不动点定理

4. 结论:为什么 Picard 会想到?

您问“为什么想到”,答案是:

因为他认出了微分方程在积分形式下,和他已经知道如何用迭代法求解的那类积分方程,长得一模一样。

对于 Picard 来说,“反复代入”根本不是一个需要灵感去凭空发明的动作。它是一个已知算法。他面对的问题不是“我应该用什么方法来逼近解?”,而是“我已知的这个叫 Neumann 级数的方法,换到这个新方程上还能不能用?”

这就好比一个现代的程序员,面对一个新的数据处理任务,发现它可以被写成一个递归结构。他不会去思考“我为什么会想到用递归?”,因为“递归”是他工具箱里已经有的一个标准工具。他思考的是:“这个任务适合用递归吗?如果适合,我该怎么改写和证明它的正确性?”

Picard 就是这样一位数学家。他手中的工具箱里,放着积分方程前辈们传下来的“逐次逼近法”。当他看到初值问题的积分形式时,他立刻意识到工具箱里的这个工具可能有戏。他试了,他证明了,于是他成功了。

这就是“为什么”的最终答案:不是灵感的火花,而是工具的自然迁移。

阅读全文
1 ... 6 7 8 ... 12