微分基本定理的数学意义

Balthild @

注一:本文说的不是微积分基本定理(牛顿—莱布尼兹公式)。

注二:拉格朗日中值定理有时也被称为微分基本定理,但本文说的也不是它。

在高等数学中,有这样一条定理:

微分基本定理: 若函数 $y=f(x)$ 在 $x_0$ 处可微,则有

$$ \mathrm{d}y = f' \mathrm{d}x $$

很容易看出,正是因为这个定理,导数 $f'(x)$ 可以写成微商的形式 $\frac{\mathrm{d}y}{\mathrm{d}x}$,并且 $\mathrm{d}y$ 和 $\mathrm{d}x$ 可以拆开来到处移。但要冠以微分基本定理的名号,这个理由恐怕不太充分。在学了泰勒级数后,还能发现这个定理在形式上就是泰勒展开式的第一项,但这同样说明不了什么问题。

事实上,这个定理之所以「基本」,是因为它揭示了微分的本质——局部线性近似


微积分,或者说数学分析,研究的是函数在局域内的性质。存在一类函数,它们有这样的性质:能找到一个足够小的邻域半径,该函数在此邻域具有某个一阶线性函数所具有的一切性质。这类函数就是可微函数,上述线性函数的斜率是它的导数

函数的微分性质都在邻域内成立,只要邻域的半径足够小,原函数与其线性近似的差异可以忽略不计(注:如果考虑实数连续统假设,可以认为是没有差异)——这便是微分的本质。唯有理解了这点,分析才成为一个能灵活运用的方法,而不是几页纸都写不下的导数公式,或是一连串积分形式变换的枯燥程序。


考虑可微二元函数 $f(x,y)$ 的全微分 $\mathrm{d}z$ 的表达式:

\mathrm{d}z
= \frac{\partial f}{\partial x} \mathrm{d}x
+ \frac{\partial f}{\partial y} \mathrm{d}y

我们已经知道 $\mathrm{d}z$ 有 $A\cdot\mathrm{d}x + B\cdot\mathrm{d}y$ 的形式,但为什么会有 $A=\frac{\partial f}{\partial x}, B=\frac{\partial f}{\partial y}$ 呢?当然,这可以用导数的定义来证明,但抽象的符号表达无法让人直观地感受到「为什么」。

如果理解了微分基本定理,上述等式就是显然的了。可微二元函数的图像是光滑曲面,如果把邻域取得足够小,曲面就近似成为平面,准确地说,是该点的切平面。

若要求从坐标平面上一点 $P:(x_1,y_1)$ 到另一点 $Q:(x_2,y_2)$ 在某平面 $F$ 上竖直投影的「高度」之差,我们会怎么计算呢?可以额外取一点 $S:(x_1,y_2)$,先计算 $P$ 到 $S$ 的高度差,再计算 $S$ 到 $Q$ 的高度差,把它们加起来就是 $P$ 到 $Q$ 的高度差。当然你也可以取 $S':(x_2,y_1)$,结果是一样的,因为坐标平面上的矩形 $PQRS$ 投影到平面 $F$ 上形成的是平行四边形。

如果这个平面是曲面的切平面,那么在邻域足够小时,切平面上的「高度差」就是我们想求的 $\mathrm{d}z$,系数 $A,B$ 即分别是沿着 $x, y$ 方向的直线在切平面上投影的斜率。而这两个斜率无疑便是上述的两个偏导数 $\frac{\partial f}{\partial x}$ 和 $\frac{\partial f}{\partial y}$。

对更多变量的微积分而言,受限于想象三维以上空间的难度,很难借助几何来直观地想象,但其原理是相同的。若学习微分几何,建立了切空间的概念后,便可以类比上去理解。


上面还提到微分基本定理在形式上与泰勒展开式的第一项相同,那么它们之间是否会有本质的联系呢?很显然是的,因为泰勒级数也是在对函数作线性近似,区别在于微分法是一次线性近似,而泰勒展开是高次线性近似。因此,微分只能在足够小的邻域内近似,而泰勒级数取了高次后,收敛域就大得多了。

某种意义上说,泰勒展开是微分法的推广。但要注意的是,不能说微分基本定理是泰勒级数的特殊情况,因为泰勒级数本身是用微分法推导而得,若用泰勒级数来演绎推理得到微分基本定理,就犯了循环论证的错误。