LOADING

加载过慢请开启缓存 浏览器默认开启

9.常微分方程 III

2026/4/19

线性常系数微分方程

1. 算子多项式的映射

当我们面对一个 $n$ 阶常系数齐次线性微分方程:

$$ a_n y^{(n)} + a_{n-1} y^{(n-1)} + \dots + a_1 y' + a_0 y = 0 $$

其实是在讨论微分算子 $D = \frac{d}{dx}$的一个多项式$P(D) = \sum_{i=0}^n a_i D^i$。

所谓的特征方程 $P(\lambda) = 0$,本质上是将算子 $D$ 视为一个变量,把微分方程抽象为了算子空间的代数方程:$P(D)y = 0$。

2. 根子空间与核空间(Kernel)的分解

根据代数基本定理,多项式 $P(\lambda)$ 可以在复数域内唯一分解为线性因子的乘积:

$$ P(\lambda) = \prod_{j=1}^k (\lambda - \lambda_j)^{m_j} $$

对应到微分算子,就有 $P(D) = \prod_{j=1}^k (D - \lambda_j)^{m_j}$。

由于这些算子因子 $(D - \lambda_j)^{m_j}$之间是两两可交换的,根据核空间分解定理(或称循环子空间分解),微分方程的解空间$V = \ker(P(D))$ 可以分解为若干个互不相干的子空间的直和:

$$ V = \ker((D - \lambda_1)^{m_1}) \oplus \ker((D - \lambda_2)^{m_2}) \oplus \dots \oplus \ker((D - \lambda_k)^{m_k}) $$

这里的每一个子空间 $\ker((D - \lambda_j)^{m_j})$,正是根子空间在函数空间中的体现。

3. 基向量的生成机制

在每个根子空间 $\ker((D - \lambda_j)^{m_j})$中,我们要寻找的是能够被$(D - \lambda_j)^{m_j}$ 湮灭(Annihilated)的所有函数。

  • 当 $m_j = 1$(单根)时,子空间由特征向量 $e^{\lambda_j x}$ 张成。

  • 当 $m_j > 1$(重根)时,单纯的特征向量不足以填满维度,于是产生了广义特征向量

通过平移公式 $D - \lambda = e^{\lambda x} D e^{-\lambda x}$可以证明,这个子空间的基底正好是${e^{\lambda_j x}, x e^{\lambda_j x}, \dots, x^{m_j-1} e^{\lambda_j x}}$。这与线性代数中 Jordan 标准型处理重特征值的逻辑完全一致。

所以实际上,常系数线性微分方程要做的也就只有做多项式分解,多项式分解能搞定,微分方程也就解决了。

例如 $f’’’-3f’+2f=0$,也就是考虑$D^3-3D+2$的分解,分解成$(D-1)^2(D-2)$,于是就有$f\in Ker(D-1)^2 \oplus Ker(D+2)$,那么$Ker(D-1)^2$是$c_1e^x+c_2xe^x$ ,$Ker(D+2)$是$c_3e^{-2x}$,和也就是$c_1e^x+c_2xe^x+c_3e^{-2x}$ ,也就是通解了。

特解

这个一方面是猜,如果要一般地做,也可以如下考虑:
“套娃”式地定义中间变量:

  • 令 $z_{n-1} = (D - \lambda_2)\dots(D - \lambda_n)y$

  • 则第一步求解:$(D - \lambda_1)z_{n-1} = f(x)$- 得到$z_{n-1}$后,再解$(D - \lambda_2)z_{n-2} = z_{n-1}$- 依此类推,直到解出$y$。

不过积分的话,就未必算的出了(

猜解

实际上也就是直觉经验。

1. $f(x)$为$n$次多项式$P_n(x)$当$f(x) = a_n x^n + \dots + a_1 x + a_0$ 时:

  • 若 $0$不是特征根(即$q \neq 0$):设特解 $\varphi^* = Q_n(x)$(同阶多项式)。

  • 若 $0$是单特征根(即$q = 0, p \neq 0$):设特解 $\varphi^* = x Q_n(x)$。

  • 若 $0$是二重特征根(即$q = p = 0$):设特解 $\varphi^* = x^2 Q_n(x)$。

2. $f(x)$为指数函数$e^{\alpha x}$当$f(x) = A e^{\alpha x}$ 时:

  • 若 $\alpha$不是特征根:设$\varphi^* = B e^{\alpha x}$。

  • 若 $\alpha$是单特征根:设$\varphi^* = B x e^{\alpha x}$。

  • 若 $\alpha$是二重特征根:设$\varphi^* = B x^2 e^{\alpha x}$。

3. $f(x)$ 为正余弦函数组合

当 $f(x) = D_1 \cos(\beta x) + D_2 \sin(\beta x)$ 时:

  • 若 $\pm i\beta$不是特征根:设$\varphi^* = A \cos(\beta x) + B \sin(\beta x)$。

  • 若 $\pm i\beta$是特征根:设$\varphi^* = x [A \cos(\beta x) + B \sin(\beta x)]$。

4. 复合形式

当 $f(x) = e^{\alpha x} [P_n(x) \cos(\beta x) + Q_m(x) \sin(\beta x)]$ 时:

这是最复杂的情况。设 $k = \max(n, m)$,若 $\alpha \pm i\beta$是特征方程的$s$ 重根(对于二阶方程,$s$取$0$或$1$),则:

$$ \varphi^* = x^s e^{\alpha x} [R_k(x) \cos(\beta x) + S_k(x) \sin(\beta x)] $$

另一种理解

我们之前从线性代数的角度思考了线性常系数微分方程的解,实际上可以考虑所谓的特征方程,而不考虑线性代数,虽然实际上几乎是一个东西,但是可以换种角度理解。

考虑二阶线性递推方程:

$$ a_{n+2}+c_1a_{n+1}+c_2a_n=0 $$

我们不会解,但是我们会解等比的递推,于是想到构造 $b_n=a_{n+1}+ka_n$ ,我们希望的是:

$$ b_{n+1}=qb_n $$

或者也就是

$$ a_{n+2}+xa_{n+1}=y(a_{n+1}+a_n) $$

这样,我们与原来的方程比较就能解出 $x,y$,从而解出$b_n$的通项,然后反求$a_n$ 。
对微分方程我们是不是也可以类似地转换呢:

$$ y''+c_1y'+c_2y=0 $$

二阶不会,一阶还是会的,于是构造 $h=y’-ky$ ,我们希望得到:

$$ h'-qh=0 $$

也就是

$$ (y'-ky)'-q(y'-ky)=0 $$

同样,与原式对比就可以解出 $k,q$,从而得到$y’+ky$ 的形式,然后再解一个一阶方程就好了。
我们具体算算,利用

$$ k+q=-c_1, qk=c_2 $$

可知 $q,k$也就是对应方程$x^2+c_1x+c_2$即所谓特征方程的两根$\lambda_1,\lambda_2$ 。
先考虑两根不同。
对这样的方程,当然想到直接分离变量积分:

$$ \frac{(y'-ky)'}{y'-ky}=q $$

积分并化简得到

$$ y'-ky=Ce^{qx} $$

然后乘上因子 $e^{-kx}$ :

$$ (e^{-kx}y)'=Ce^{(q-k)x} $$

积分得到

$$ e^{-kx}y=C_1e^{(q-k)x}+C_2' $$

也就有

$$ y=C_1e^{qx}+C_2e^{kx} $$

不难解出特征方程两根,于是 $y$ 的通解:

$$ y=C_1e^{-\lambda_1x}+C_2e^{-\lambda_2x} $$

如果两根相同,那么记为 $\lambda$ 。

$$ (y'-\lambda y)'-\lambda(y'-\lambda y)=0 $$

同样有

$$ y'-\lambda y=Ce^{\lambda x} $$

同样作用 $e^{-\lambda x}$ :

$$ (e^{-\lambda x}y)'=C $$

于是得到

$$ y=Cxe^{\lambda x} $$

这与我们考虑线性算子时得到的结果一致。

特解

在线性算子中,我们具体考虑特解的一般性计算,将考虑微分算子的逆,笨人并未研究。
这里我们则可以比较形式化地直接得到特解,考虑:

$$ y''+c_1y'+c_2y=f(x) $$

我们故技重施,写成:

$$ (y'-\lambda_1y)'-\lambda_2(y'-\lambda_1y)=f(x) $$

这就降成了一阶微分方程,这样乘上积分因子 $e^{-\lambda_2x}$,记$u=y’-\lambda_1 y$ :

$$ (e^{-\lambda_2x}u)'=f(x)e^{-\lambda_2x} $$

积分得到:

$$ y'-\lambda_1y=e^{\lambda_2x}(\int f(x)e^{-\lambda_2x}dx+C) $$

再来一次:

$$ (e^{-\lambda_1x}y)'=RHS\cdot e^{-\lambda_1x} $$

如果两根不同,则积分:

$$ y=e^{\lambda_1x}(\int(e^{(\lambda_2-\lambda_1)x}\int f(x)e^{-\lambda_2x}dx+C)dx+C') $$

把常数分离一下就得到:

$$ y = e^{\lambda_1x} \left( \int e^{(\lambda_2-\lambda_1)x} \left( \int f(x)e^{-\lambda_2x} dx \right) dx + C_1 \int e^{(\lambda_2-\lambda_1)x} dx + C_2 \right) $$

也就得到了解的一般形式,但是一般猜解还是舒服一点。
如果两根相同,那么第二项积分就变成 $C_1x$ 了。

第一项积分看起来有点丑陋,而且并不对称,但实际上可以通过运算化简,我们写成定积分:

$$ \int_{a}^{x} \left( \int_{a}^{t} f(s) e^{-\lambda_1 s} ds \right) e^{(\lambda_1 - \lambda_2)t} dt \cdot e^{\lambda_2 x} $$

分部积分:

$$ = \left( \left. \int_{a}^{s} f(s) e^{-\lambda_1 s} ds \cdot \frac{e^{(\lambda_1 - \lambda_2)t}}{\lambda_1 - \lambda_2} \right|_{t=a}^{t=x} - \int_{a}^{x} f(t) e^{-\lambda_1 t} \cdot \frac{e^{(\lambda_1 - \lambda_2)t}}{\lambda_1 - \lambda_2} dt \right) e^{\lambda_2 x} $$

$$ = \left( \int_{a}^{x} f(s) e^{-\lambda_1 s} ds \cdot \frac{e^{(\lambda_1 - \lambda_2)x}}{\lambda_1 - \lambda_2} + \int_{0}^{x} \frac{f(t) e^{-\lambda_2 t}}{\lambda_2 - \lambda_1} dt \right) e^{\lambda_2 x} $$

最终形式:

$$ = \left( \int_{a}^{x} \frac{f(t) e^{-\lambda_1 t}}{\lambda_1 - \lambda_2} dt \right) e^{\lambda_1 x} + \left( \int_{a}^{x} \frac{f(t) e^{-\lambda_2 t}}{\lambda_2 - \lambda_1} dt \right) e^{\lambda_2 x} $$

① $\lambda_1 \neq \lambda_2$

$$ y(x) = \left( \int^x \frac{f(t) e^{-\lambda_1 t}}{\lambda_1 - \lambda_2} dt + C_1 \right) e^{\lambda_1 x}

  • \left( \int^x \frac{f(t) e^{-\lambda_2 t}}{\lambda_2 - \lambda_1} dt + C_2 \right) e^{\lambda_2 x}
    $$

② $\lambda_1 = \lambda_2 = \lambda$

$$ y(x) = \left( \int^x f(t) \cdot t e^{-\lambda t} dt + C_1 \right) e^{\lambda x} + \left( \int^x f(t) e^{-\lambda t} dt + C_2 \right) x e^{\lambda x} $$

这是非常正统,非常一般化的解,但是显然不太好算,也记不住。我们观察形式,发现:

$$ 齐次部分对应:c_1\phi_1(x)+c_2\phi_1(x) $$

$$ 非齐次部分对应:D_1(x)\phi_1(x)+D_2(x)\phi_2(x) $$

常数变易法

被判定为邪修,但是很好用(),根据上面我们的观察,我们知道只要整出来齐次的解,只要把系数设成新的函数带进去解出来就可以得到方程的解。实际上就是我们算出来的那一大坨,但是那显然不好记忆()

这实际上对非常系数的微分方程也成立,就不证了(buhui),非常系数的齐次解也没有通用的解法,但是我们还是假定我们找到了齐次的通解 $\varphi_1,\varphi_2$ ,然后现在讨论常数变易法。

原方程:

$$ y''+p(x)y'+q(x)y=f(x) $$

假装解出来了齐次解,安上两个系数函数:

$$ y=C_1(x)\varphi_1(x)+C_2(x)\varphi_2(x) $$

求导:

$$ y'=C_1'\varphi_1+C_1\varphi_1'+C_2'\varphi_2+C_2\varphi_2' $$

$$ y'(x) = \underline{C_1' \varphi_1 + C_2' \varphi_2} + C_1 \varphi_1' + C_2 \varphi_2' $$

$\qquad$设划线处$= 0$ (一会解释为什么能这么干)

$$ y''(x) = C_1' \varphi_1' + C_2' \varphi_2' + C_1 \varphi_1'' + C_2 \varphi_2'' $$

$$ f(x) = C_1' \varphi_1' + C_2' \varphi_2' + \underline{C_1 \varphi_1'' + C_2 \varphi_2''} $$

$$ \qquad + p(x) (\underline{C_1 \varphi_1' + C_2 \varphi_2'}) $$

$$ \qquad + q(x) (\underline{C_1 \varphi_1 + C_2 \varphi_2}) $$

$$ = C_1' \varphi_1' + C_2' \varphi_2' $$

那么就得到两个方程:

$$ \begin{cases} C_1' \varphi_1 + C_2' \varphi_2 = 0 \\ C_1' \varphi_1' + C_2' \varphi_2' = f \end{cases} $$

$$ \Rightarrow \begin{aligned} C_1' &= -\frac{f \varphi_2}{W} \\ C_2' &= \frac{f \varphi_1}{W} \end{aligned} $$

这里的 $W$ 是系数行列式,也就是朗斯基行列式。

$$ \Rightarrow \begin{aligned} C_1(x) &= \int^x -\frac{f(t) \varphi_2(t)}{W(t)} dt + D_1 \\ C_2(x) &= \int^x \frac{f \varphi_1}{W} dt + D_2 \end{aligned} $$

从而

$$ y'' + p(x) y' + q(x) y = f(x) $$

$$ \downarrow $$

$$ y

= \left( \int^x -\frac{f \varphi_2}{W} dt + D_1 \right) \varphi_1(x)

  • \left( \int^x \frac{f \varphi_1}{W} dt + D_2 \right) \varphi_2(x)
    $$

欧拉方程

$$ \sum_i a_ix^iy^{(i)}=0 $$

其中 $a_i$ 为常数,这样形式的微分方程称为所谓欧拉方程。
欧拉方程有一个不错的性质,考虑 $z(x)=y(-x)$,那么偶数项不消说,奇数项由于$z’$和$x$ 都有多一个负号,所以抵消了。也就是说,$z$也满足方程,换言之,只需要考虑$x>0$ 的情形。

那么什么函数值域大于 $0$呢,自然的想法是$e^x$,我们令$x=e^t$,那么$xy’=e^t\frac{dy}{dx}=e^t\frac{dy}{dt}\frac{dt}{dx}$,注意到$\frac{dt}{dx}=e^{-t}$,那么就有$xy’=\frac{dy}{dt}$,如此美妙。我们考虑第二项,设$D = \frac{d}{dt}$,则$x^2 \frac{d^2y}{dx^2} = D(D-1)y$,利用数学归纳法可以得到$x^k \frac{d^ky}{dx^k} = D(D-1)\dots(D-k+1)y$ 。这么一来,就又变回常系数线性方程了。

例如,我们考虑

$$ x^2y''+\frac{3}{2}xy'-y=0 $$

那么换元后就是

$$ (D(D-1)+\frac{3}{2}D-1)y=0 $$

整理得到

$$ (D^2+\frac{1}{2}D-1)y=0 $$

这个丑陋的方程就不解了,总之是解出两个根 $\lambda_i$ ,然后

$$ y=C_1e^{\lambda_1t}+C_2e^{\lambda_2t} $$

但是这还不是 $y(x)$,代入$t=lnx

$$ $y(x)=C_1x^{\lambda_1}+C_2x^{\lambda_2} $$

但是这要求 $x>0$,利用之前所说,只要把$x$ 加上绝对值就好

$$ y(x)=C_1|x|^{\lambda_1}+C_2|x|^{\lambda_2} $$

相应的,如果有重根,就得到

$$ y(x)=C_1x^{\lambda}+C_2ln|x|x^{\lambda} $$

伯努利方程

$$ y'+P(x)y=Q(x)y^n $$

如果没有 $y^n$,那就是标准的一阶非齐次方程,于是自然想到除掉$y^n$ ,得到

$$ y^{-n}y'+P(x)y^{1-n}=Q(x) $$

发现 $1-n$和$-n$差$1$,这与求一次导有所关联,于是进行变量代换$z=y^{1-n}$ ,那么

$$ z'+P(x)z=Q(x) $$

就得到了标准的一阶非齐次方程的形式。

一阶 ODE 组

$n$ 个耦合的一阶微分方程如何求解?

$$ y_1'=F_1(x,y_1,y_2,...,y_n) $$

$$ ... $$

$$ y_n'=F_n(x,y_1,y_2,...,y_n) $$

为了方便描述,可以记 $\vec{y}=(y_1,…,y_n)^T$,类似的$\vec{F}=(F_1,…,F_n)^T$ 。

通解形如

$$ y_1(x)=\varphi_1(x,C_1,...C_n) $$

因为要解 $n$个方程,故有$n$ 个常数。
独立性的判断仍然是行列式

$$ |\frac{D(\vec{\varphi})}{D(\vec{C})}| $$

存在唯一性条件则相应有所变化,要求对 $(x,\vec{y})\in \Omega \subseteq \mathbb{R}\times \mathbb{R}^n$,在其上每个$F_i$对每个$y_i$ 满足一致的李普希兹条件。

为什么要研究方程组

我们考虑 $n$阶微分方程,实际上可以通过变量替换变成一个一阶 ode 组,只要令$u_i=y^{(i)}$ ,就得到

$$ u_1'=u_2 $$

$$ ... $$

$$ u_{n-1}'=u_n $$

$$ u_n=F(x,u_0,u_1...),即原来的微分方程 $$

也就是说,要解 $n$阶方程,只要解这样一个方程组就好。所以$n$阶方程有$n$个常数,实际上是因为对应$n$个一阶方程。把上述的常数独立性条件的$\varphi$改成对应的$y^{(n)}$,就发现和$n$ 阶微分方程的常数独立性条件一样。

对存在唯一性条件,我们看 $\vec{F}$ :

$$ \vec{F}(x, \vec{y}) = (y_2 \ y_3 \ \cdots \ G(x, y_1, \dots, y_n))^T $$

那么对应的雅可比矩阵也就是

$$ \frac{D(\vec{F})}{D(\vec{y})} = \begin{pmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ G_{y_1} & G_{y_2} & G_{y_3} & \cdots & G_{y_n} \end{pmatrix} $$

这个矩阵 $\in C^1$ 是李普希兹连续的一个充分条件(导数有界),那么也就只要求最下方那一排导数连续。

二阶微分方程存在唯一性条件要求 $p,q$ 连续,实际上也就是对应的导数。

各种形式

1. 一般形式(General Form)

最顶层是高度抽象的非线性向量方程:

$$ \vec{y}' = \vec{F}(x, \vec{y}) $$

  • 含义:系统的演化速率 $\vec{y}’$取决于当前自变量$x$和状态向量$\vec{y}$ 的某种复杂非线性组合。

2. 线性化(Linearization)

通过引入“线性”约束,方程退化为变系数线性微分方程组:

$$ \vec{y}' = A(x)\vec{y} + \vec{f}(x) $$

  • 结构

    • $A(x)$是系数矩阵,其元素随自变量$x$ 变化。

    • $\vec{f}(x)$ 是非齐次项(或称强制项)。

  • 逻辑:此时状态 $\vec{y}$ 对演化速率的影响是线性的。

3. 常系数化(Constant Coefficients)

进一步引入“常系数”约束,方程退化为最易求解的形式:

$$ \vec{y}' = A\vec{y} + \vec{f}(x) $$

  • 核心变化:矩阵 $A$不再随$x$ 变化,而是一个常数矩阵。

  • 价值:这是线性代数介入最深的领域,可以通过计算矩阵 $A$ 的特征值特征向量(如 Jordan 标准型)来直接写出通解。