跳转至

14.多元函数的偏导数

1.多元函数

以下将从四个角度研究具有多变量的函数:

  1. 语言描述(文字)
  2. 数值描述(数值表格)
  3. 代数刻画(显式的公式)
  4. 直观刻画(曲面或等值线图)

二元函数

二元函数 f 是指在集合 D 中的每个有序实数对 \((x, y)\) 都有唯一的实数 \(f(x, y)\) 与前者对应

这里 D 是函数的 定义域,f 能取到的值叫做 值域,记作 \(\{ f(x, y) | (x, y) \in D \}\)

几何解释:二元函数 f 满足: 二维平面 \(\mathbb R^2\) 的子集(即定义域)的每一个点能通过 f 唯一映射到一个一维数轴 \(\mathbb R\) 上的点(这些点构成集合——值域)

例子

  1. \(f(x,y)=\frac{\sqrt{x+y+1}}{x-1}\) 的定义域为 \(\{(x,y)|~x\ne1,x+y+1\ge0\}\)
  2. \(f(x,y)=x\ln(y^2-x)\) 的定义域为 \(\{(x,y)|~y^2-x>0\}\)
  3. \(\{(x,y)|~y<f(x)\}\) 表示 \(y=f(x)\) y 的负半轴方向的区域
  4. \(\{(x,y)|~x<f(x)\}\) 表示 \(x=f(y)\) x 的负半轴方向的区域
  5. \(g(x,y)=\sqrt{9-x^2-y^2}\) 的定义域为 \(\{(x,y)|~x^2+y^2\le9\}\),值域为 \([0,3]\)

二元函数 图像

如果 f 是一个以 \(D\subset \mathbb R^2\) 为定义域的二元函数,那么 f 的图像就是在 \(\mathbb R^3\) 中所有的点 \((x, y, z)\)

这里 \(z=f(x, y)\) 并且 \((x, y)\) 在 D 中

例子

  1. 假设 \(f(x,y)=6-3x-2y\),那么 \(z=f(x,y)\) 的图像是 \(x,y,z\) 轴截距分别为 \(2,3,6\) 的平面
  2. \(g(x,y)=\sqrt{9-x^2-y^2}\),那么方程 \(z=f(x,y)\) 的图像是以 \((0,0)\) 为圆心,半径为 3 的圆的上半部分
  3. \(h(x,y)=4x^2+y^2\),由[12.6],\(z=h(x,y)\) 是椭圆抛物面

计算机画图

  • 试着画出如下函数图像:\((x^2 + 3y^2)e^{-x^2-y^2}\)\(\sin x + \sin y\)\(\frac {\sin x\sin y}{xy}\)

等高线

二元函数 f 的等高线就是方程 \(f(x, y) = k\) 所对应的曲线(k 为常数)

同时也可以认为 \(f(x, y) = k\) 是 f 在 \(xoy\) 上的投影

二元函数的等高线 可以推广到 一元函数的端点,也可以对应于 三元函数的等高面

等高线的应用

  • 地形图:设高于水平面的高度 f 是 x 和 y 的函数,那么 f 的一族等高线对应了 地理学 中的地形图;等高线越密集,表示此处越陡峭
  • 温度带:设温度 f 是经纬度 x 和 y 的函数,那么 f 的一族等高线就是某一时刻的温度等温线

试着用等高线画图

  • \(-xye^{-x^2-y^2}\)\(\frac {-3y}{x^2+y^2+1}\)

三元函数

三元函数 f 对于定义域 \(D\subset \mathbb R^3\) 内的每个三元组 (x, y, z) 都有唯一的实数 f(x, y, z) 与其对应

例子

  1. \(f(x,y,z)=\ln(z-y)+xy\sin z\) 的定义域是 \(\{(x,y,z)\in\mathbb R^3|~z-y>0\}\)

三元函数的 等高面

三元函数 f 的等高面就是方程 \(f(x, y, z) = k\) 所对应的曲面(k 为常数)

多元函数

一个 n 元函数是一个数组 \((x_1, x_2, \dots, x_n)\) 到一个数 \(z=f(x_1,x_2,\dots, x_n)\) 的一个对应

  • 我们有三种方式看待定义在 \(\mathbb R^n\) 的子集上的函数:

    1. n 个实变量 \(x_1,x_2,\dots,x_n\) 的函数
    2. 一个点变量 \((x_1,x_2,\dots,x_n)\) 的函数
    3. 一个向量 \(\mathbf x = \langle x_1,x_2,\dots,x_n \rangle\) 的函数;f 可表示为 \(f(\mathbf x)\)

Note

  • 我们将所有数组 \(((x_1, x_2, \dots, x_n))\) 构成的集合为 \(\mathbb R^n\)

总结

  1. 多元函数:假设 \(D_f\subset\mathbb R^n\)多元函数定义为映射关系 \(f:~D_f^n\to\mathbb R\),其中 \(D_f,R_f=\{\mathbf x\in\mathbb R^n|~\mathbf x\in D_f\}\) 分别为 f 的定义域和值域,\(\mathbb R\) 是 f 的余定义域(注:\(\mathbf x=(x,y,z,\cdots)\)\(\mathbf x=(x_1,x_2,\cdots)\)
    1. \(n=1\),那么函数方程 \(y=f(x)\) 表示 \(\mathbb R^2\) 下的向量集或者曲线
    2. \(n=2\),那么函数方程 \(z=f(x,y)\) 表示 \(\mathbb R^3\) 下的向量集或者曲面
    3. \(n\in\mathbb Z^+\),那么函数方程 \(u=f(\mathbf x)\) 表示 \(\mathbb R^{n+1}\) 下的向量集
  2. 等高线,等值面:假设 \({a_k}\) 是一个(等差)数组,那么 \(z=f(x,y)\) 的一组等高线\(f(x,y)=a_1,\cdots,f(x,y)=a_k\)\(u=f(x,y,z)\) 的一组等值面\(f(x,y,z)=a_1,\cdots,f(x,y,z)=a_k\)

练习

  1. 使用“等值方法”画出如下方程:(1) \(z=\sin\sqrt{x^2+y^2}\),(2) \(z=x^2y^2e^{-x^2-y^2}\),(3) \(z=\frac1{x^2+4y^2}\),(4) \(z=x^3-3xy^2\),(5) \(z=\sin x\sin y\),(6) \(z=\sin^2x+\frac14y^2\)
  2. 如何计算多元函数的定义域,值域,各处取值?
  3. 如何做图像变换?(见[第1章])
  4. 使用“等值方法”画出如下函数的图像:(1) \(xy\),(2) \(x^2-y^2\),(3) \(y-\ln x\),(4) \(e^{y/x}\),(5) \(\sqrt{x+y}\),(6) \(y\sec x\),(7) \(x-y^2\),(8) \(y/(x^2+y^2)\)
  5. 画出如下函数的图像:(1) \(|x|+|y|\),(2) \(|xy|\),(3) \(1/(1+x^2+y^2)\),(4) \((x^2-y^2)^2\),(5) \((x-y)^2\),(6) \(\sin{|x|+|y|}\)

2.多元函数的极限 & 连续性

二元函数极限

  1. 感性定义:\(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L\) 表示在 f 的定义域点 (x, y) 沿着任何路径趋近于 (a, b) 时,f(x, y) 趋近于一个数 L

    也就是说,通过让 (x,y) 充分靠近 (a,b),使得 f(x,y) 充分接近 L

  2. 严格定义:令 f 是一个二元函数,定义域是 D,其中的点 (x,y) 任意趋近于 (a,b),那么我们称当 (x,y) 趋近 (a,b) 时,f(x,y) 的极限是 L,记作: \(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L\)

    如果对于任意的数 \(\epsilon > 0\),有一个相应的 \(\delta > 0\) 使得 \(|f(x,y)-L|<\epsilon\),这里 \((x,y)\in D\) & \(0<\sqrt {(x-a)+(y-b)^2} < \delta\)

  3. 二元函数极限也可以表示为 \(\lim\limits_{\begin{smallmatrix}x\to a\\ y\to b\end{smallmatrix}} f(x,y)=L\)\(f(x,y)\to L\)\((x,y)\to (a,b)\)

  4. 几何解释:由二元函数的几何定义有 f 在 \(D\subset \mathbb R^2\) 上的每个点都能唯一映射到一维数轴上(设为 z)

    如果给定 z 上的任意小区间 \((L-\epsilon, L+\epsilon)\),我们可以在 D 上找到一个以点 (a,b) 为中心,\(\delta > 0\) 为半径的圆盘 \(D_{\delta}\),使得 f 可以把所有圆盘 \(D_{\delta}\) 上的点映射带区间 \((L-\epsilon, L+\epsilon)\)

  5. 其他定义:详见 p215

定理

如果从路径 \(C_1:(x,y)\to(a,b)\) 使 \(f(x,y)\to L_1\),而沿路径 \(C_2:(x,y)\to(a,b)\) 使 \(f(x,y)\to L_2\)

而且 \(L_1\ne L_2\),那么 \(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L\) 不存在

Note

  • 该定理是一元函数情况下的推广:一元函数左右两侧极限不相等 \(\iff\) 该处极限不存在

例子

  1. 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{x^2-y^2}{x^2+y^2}\):若 \(C_1:x=y,C_2:x=2y\),蕴含 \(C_1:(x,y)\to(0,0),f(x,y)\to0\)\(C_2:(x,y)\to(0,0),f(x,y)=\frac{4y^2-y^2}{4y^2+y^2}\to3/5\),所以极限不存在
  2. 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{xy}{x^2+y^2}\):若 \(C_1:x=0,C_2:x=y\),蕴含 \(C_1:(x,y)\to(0,0),f(x,y)\to0\)\(C_2:(x,y)\to(0,0),f(x,y)=\frac{x^2}{x^2+x^2}\to1/2\),所以极限不存在
  3. 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{xy^2}{x^2+y^4}\):若 \(C_1:x=0,C_2:x=y^2\),蕴含 \(C_1:(x,y)\to(0,0),f(x,y)\to0\)\(C_2:(x,y)\to(0,0),f(x,y)=\frac{y^4}{y^4+y^4}\to1/2\),所以极限不存在
  4. 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{3x^2y}{x^2+y^2}\)
    1. 预处理:存在 \(C:x=0\) 使得 \((x,y)\to(0,0),f(x,y)\to0\),假设 \(L=0\),有 \(|f(x,y)-L|=\left|\frac{3x^2y}{x^2+y^2}-0\right|=3\frac{x^2}{x^2+y^2}|y|\le3|y|\le3\sqrt{x^2+y^2}\)
    2. 假设 \(\delta=\epsilon/3\) 使得 \(\|\mathbf x-\mathbf a\|<\delta\),即 \(\sqrt{x^2+y^2}<\epsilon/3\)
    3. \(|f(x,y)-L|=\left|\frac{3x^2y}{x^2+y^2}-0\right|=3\frac{x^2}{x^2+y^2}|y|\le3|y|\le3\sqrt{x^2+y^2}<\epsilon\),于是极限 \(\lim\limits_{(x,y)\to(0,0)}\frac{3x^2y}{x^2+y^2}\) 存在
  5. \(\lim\limits_{(x,y)\to(0,0)}\frac {\sin (x^2+y^2)}{x^2+y^2}\)

二元函数极限策略

  1. 结论:\(\lim\limits_{(x,y)\to (a,b)} x = a, \lim\limits_{(x,y)\to (a,b)} y = b, \lim\limits_{(x,y)\to (a,b)} c = c\)
  2. 沿着 \(x=a\)\(y=b\) 接近 (a,b):
    • \(\lim\limits_{y\to b} f(a, y) = L_1\)
    • \(\lim\limits_{x\to a} f(x, b) = L_2\)
    • \(L_1\ne L_2\),则极限不存在,否则转到步骤 (3)
  3. 沿着斜线 \(y=mx\)\(x=my\) 接近 (a,b):\(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L_3\)
    • \(L_3 \ne L_1\)\(L_3 \ne L_2\),则极限不存在,否则转到步骤 (4)
  4. 沿着曲线 \(y=g(x)\) 接近 (a,b):\(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L_4\)
    • 若存在 i 使得 \(L_4 \ne L_i\) (\(i=1,2,3\)),则极限不存在,否则转到步骤 (5)
  5. 找到某个数 \(\epsilon>0\) 使得 \(|f(x,y) - L| < \epsilon\)\(\epsilon = g(\delta)\),并且 \(0 < \sqrt {(x-a)^2 + (y-b)^2}< \delta\)
    • 我们记 \(F(x,y) = |f(x,y)-L|\)(简记 \(F\)),\(h(x,y) = \sqrt {(x-a)^2 + (y-b)^2}\)(简记 \(h\)
    • \(F(x,y) < \epsilon\)\(h(x,y) < \delta\)
    • 我们先找到 \(F < \epsilon = F' \circ h\) (注:\(F \le \epsilon = F' \circ h\) 的情况当然也成立)
    • 若找到了 \(\epsilon\),则对于 \(\epsilon = g(\delta) > 0\),有一个相应的 \(\delta = g^{-1}(\epsilon) > 0\) 使得 \(F(x,y) = |f(x,y)-L| < \epsilon\),这里 \((x,y)\in D\)\(0 < h(x,y) = \sqrt {(x-a)^2 + (y-b)^2} < \epsilon\)
    • 如果上述命题能被满足,那么极限存在且为 L

二元函数连续性

一个二元函数在 (a,b) 连续,如果 \(\lim\limits_{(x,y)\to(a,b)} f(x,y) = f(a,b)\)

如果 f 在 D 里的每一个点 (a,b) 连续,则 f 在 D 连续

连续性的感性理解

  • 连续指自变量变化一点,而函数也仅仅变化一点点
  • 在曲面上,连续的含义是没有 断面 和 洞

例子

  1. \(\lim\limits_{(x,y)\to(1,2)}(x^2y^3-x^3y^2+3x+2y)=1^2\cdot2^3-1^3\cdot2^2+3\cdot1+2\cdot2=11\)
  2. \(f(x,y)=\frac{x^2-y^2}{x^2+y^2}\) 在定义域 \(\{(x,y)|~x^2+y^2\ne0\}\) 处连续
  3. \(g(x,y)=\begin{cases}\frac{x^2-y^2}{x^2+y^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\)\((0,0)\) 处不连续,因为 \((0,0)\) 处极限不存在(注:g 不是二元初等函数,只能称 g 分段初等)
  4. \(f(x,y)=\begin{cases}\frac{3x^2y}{x^2+y^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\) 处处连续,其中 \((0,0)\) 处极限存在且等于 \(f(0,0)\)
  5. \(f(x,y)=\tan^{-1}(y/x)\) 在除 \(x\ne0\) 以外的地方连续

结论

  1. 根据极限的性质,可知连续函数的 和,导数,乘积,商 在他们的定义域内连续
  2. 由连续性 和 \(\lim\limits_{(x,y)\to (a,b)} x = a, \lim\limits_{(x,y)\to (a,b)} y = b, \lim\limits_{(x,y)\to (a,b)} c = c\) 可知:二元多项式函数 \(f(x,y) = cx^ny^m\) 连续,进而 \(\lim\limits_{(x,y)\to (a,b)} cx^ny^m = ca^nb^m\)
  3. 由 (1),(2) 二元有理函数 在定义域内也连续
  4. 若 f(x,y) 是一个二元连续函数,g(x) 是定义在 f 的值域上的函数(或 g 在 f 的值域的超集上也连续),那么复合函数 \(h = g\circ f(x, y)\) 也是一个连续函数

三元函数 极限

\(\lim\limits_{(x,y,z)\to(a,b,c)} f(x,y,z) = L\)

在 f 的定义域内,当 (x,y,z) 以任意方式趋近 (a,b,c) 时,f(x,y,z) 趋近于 L

精确定义:对任意 \(\epsilon > 0\),则存在 \(\delta > 0\),使得 \(|f(x,y,z) - L| < \epsilon\),这里 \(0 < \sqrt {(x-a)^2 + (y-b)^2 + (z-c)^2} < \delta\),(x,y,z) 在定义域内

三元函数 连续性

f 在 (a,b,c) 连续,如果 \(\lim\limits_{(x,y,z)\to(a,b,c)} f(x,y,z) = f(a,b,c)\)

多元函数 极限(向量描述)

\(\mathbf x = \langle x_1, x_2, \dots, x_n \rangle\)\(\mathbf a = \langle a_1, a_2, \dots, a_n\rangle\)

如果 f 是定义在 \(D \subset \mathbb R^n\) 上的函数,则\(\lim\limits_{\mathbf x\to \mathbf a} f(\mathbf x) = L\)

这意味着对于每个数 \(\epsilon > 0\),则有一个相应的 \(\mathbf \delta > 0\),使得 \(|f(\mathbf x) - L| < \epsilon\),这里 \(0 < |\mathbf x - \mathbf a| < \delta\)\(\mathbf x \in D\)

多元函数 连续(向量描述)

f 在 \(\mathbf a\) 处连续,如果 \(\lim\limits_{\mathbf x \to \mathbf a} f(\mathbf x) = f(\mathbf a)\)

总结

  1. 多元函数的极限:假设 \(\mathbf a\in\mathbb R^n,L\in\mathbb R\),若 \(\forall\epsilon>0,\exists\delta>0\) 使得 \(\forall\mathbf x\in\mathring U(\mathbf a,\delta),f(\mathbf x)\in U(L,\epsilon)\),那么称 f 在 \(\bf a\) 处取存在极限 L,记为 \(\lim\limits_{\bf x\to a}f(\mathbf x)=L\)(其中,\(\mathring U(\mathbf a,\delta)=\{\mathbf x\in\mathbb R^n|~\|\mathbf x-\mathbf a\|<\delta,\mathbf x\ne\mathbf a\}\)
    1. 或者记为 \(\mathbf x\to\mathbf a,f(\mathbf x)\to L\);沿着路径 C 的极限记为 \(C:\mathbf x\to\mathbf a,f(\mathbf x)\to L\)
  2. 定理:若存在两条不同路径 \(\exists C_1\ne C_2\) 使得 \(C_1:\mathbf x\to\mathbf a,f(\mathbf x)\to L_1\)\(C_2:\mathbf x\to\mathbf a,f(\mathbf x)\to L_2\),并且 \(L_1\ne L_2\),那么 \(\lim\limits_{\bf x\to a}f(\mathbf x)\) 不存在
  3. 多元函数的连续性(点连续,区间连续):假设 f 是 n 元的,若 \(\lim\limits_{\bf x\to a}f(\mathbf x)=f(\mathbf a)\),那么称 f 在 \(\bf a\)连续;若 \(\forall\mathbf x\in D_f,\lim\limits_{\bf u\to x}f(\mathbf u)=f(\mathbf x)\),那么称 f 是连续函数或在 \(D_f\) 上连续

一级结论

  1. 多元函数极限(实用性定义):假设 \(\mathbf a\in\mathbb R^n,L\in\mathbb R\),若 \(\forall\epsilon>0,\exists\delta>0\) 使得 \(\forall\|\mathbf x-\mathbf a\|<\delta\) 使得 \(|f(x)-L|<\epsilon\)
  2. 多元初等函数在定义域内连续

练习

  1. 判断题
    1. 连续函数在定义域处的极限等于函数值(Y)
    2. 连续函数在边界处但未定义的点的极限经常被研究(Y)
    3. 分段连续的函数在边界点处的极限也经常被研究(Y)
  2. 讨论极限值:(1) \(\lim\limits_{(x,y)\to(0,0)}\frac{x^2}{x^2+y^2}\),(2) \(\lim\limits_{(x,y)\to(0,0)}\frac{xy}{\sqrt{x^2+y^2}}\),(3) \(\lim\limits_{(x,y)\to(0,0)}\frac{2x^2y}{x^4+y^2}\),(4) \(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{x^2+2y^2+3z^2}{x^2+y^2+z^2}\),(5) \(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{xy+yz^2+xz^2}{x^2+y^2+z^4}\)
  3. 使用极坐标计算极限:(1) \(\lim\limits_{(x,y)\to(0,0)}\frac{x^3+y^3}{x^2+y^2}\),(2) \(\lim\limits_{(x,y)\to(0,0)}(x^2+y^2)\ln(x^2+y^2)\)
  4. 使用球坐标计算极限:\(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{xyz}{x^2+y^2+z^2}\)

提示

(2)

  1. 函数沿着 \(C_1:x=0,C_2:y=x\) 接近 \((0,0)\) 的极限分别为 \(0,1/2\),所以极限不存在
  2. 因为沿着 \(C:x=0\) 接近 \((0,0)\) 的极限为 0,所以假设极限值为 \(L=0\),又 \(|f(x,y)-0|=\frac{|xy|}{\sqrt{x^2+y^2}}\le\frac{\sqrt{x^2+y^2}\cdot\sqrt{x^2+y^2}}{\sqrt{x^2+y^2}}=\sqrt{x^2+y^2}\),假设 \(\delta=\epsilon\),有 \(\|(x,y)-(0,0)\|<\delta\),即 \(\sqrt{x^2+y^2}<\epsilon\),于是 \(|f(x,y)-0|<\epsilon\),所以极限为 0
  3. 函数沿着 \(C_1:x=0,C_2:y=x^2\) 接近 \((0,0)\) 的极限分别为 \(0,1\),所以极限不存在
  4. 函数沿着 \(C_1:y=0,z=0\)\(C_2:x=0,z=0\) 接近 \((0,0,0)\) 的极限分别为 \(1,2\),所以极限不存在(注:\(\mathbb R^n\) 下的一条曲线可以由 \(n-1\) 个方程定义)
  5. 函数沿着 \(C_1:x=0,y=0\)\(C_2:x=z^2,y=z^2\) 的极限分别为 \(0,1\),所以极限不存在

(3)

  1. \(\lim\limits_{(x,y)\to(0,0)}\frac{x^3+y^3}{x^2+y^2}=\lim\limits_{r\to0^+}\frac{r^3\cos^3\theta+r^3\sin^3\theta}{r^2\cos^2\theta+r^2\sin^2\theta}=\lim\limits_{r\to0^+}r(\cos^3\theta+\sin^3\theta)=0\)
  2. \(\lim\limits_{(x,y)\to(0,0)}(x^2+y^2)\ln(x^2+y^2)=\lim\limits_{r\to0^+}r^2\ln r^2=2\lim\limits_{r\to0^+}\frac{\ln r}{1/r^2}=2\lim\limits_{r\to0^+}\frac{1/r}{-2/r^3}=0\)

(4) \(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{xyz}{x^2+y^2+z^2}=\lim\limits_{\rho\to0^+}\frac{\rho\sin\phi\cos\theta\cdot\rho\sin\phi\sin\theta\cdot\rho\cos\phi}{\rho^2}=\lim\limits_{\rho\to0^+}\rho\sin^2\phi\cos\phi\cos\theta\sin\theta=0\)

3.多元函数的偏导数

二元函数 偏导数

如果 f 是一个二元函数,它的偏导数是 \(f_x\)\(f_y\),定义为:

\(f_x(x, y) = \lim\limits_{h\to 0}\frac {f(x+h, y)-f(x,y)}h\)

\(f_y(x, y) = \lim\limits_{h\to 0}\frac {f(x, y+h)-f(x,y)}h\)

  • 若 z=f(x,y),我们记:
    • \(f_x(x,y)=f_x=\frac {\partial f}{\partial x}=\frac {\partial}{\partial x}f(x,y) = \frac {\partial z}{\partial x} = f_1 = D_1f = D_xf\)
    • \(f_y(x,y)=f_y=\frac {\partial f}{\partial y}=\frac {\partial}{\partial y}f(x,y) = \frac {\partial z}{\partial y} = f_2 = D_2f = D_2f\)

偏导数求导法则

  • \(z=f(x,y)\)
  • 为求 \(f_x\),把 y 看作常数,对 x 求导
  • 为求 \(f_y\),把 x 看作常数,对 y 求导

例子

  1. \(f(x,y)=x^3+x^2y^3-2y^2\) 的偏导数分别为 \(f_x(x,y)=3x^2+2xy^3\)\(f_y(x,y)=3x^2y^2-4y\)

二元偏导数的几何意义

若 z=f(x,y)

\(f_x(a,b)\) 表示曲线 \(z=f(x,y), y=b\)(即 \(F(x,b,z)=0\)) 的斜率

\(f_y(a,b)\) 表示曲线 \(z=f(x,y), x=a\)(即 \(F(a,y,z)=0\)) 的斜率

例子

  1. \(f(x,y)=4-x^2-2y^2\) 的偏导数分别为 \(f_x(x,y)=-2x,f_y(x,y)=-4y\),那么 \(f_x(1,1)\) 表示 \(z=f(x,y)\) 沿着曲线 \(z=4-x^2-2,y=1\) 的切线斜率,那么 \(f_y(1,1)\) 表示 \(z=f(x,y)\) 沿着曲线 \(z=4-1-2y^2,x=1\) 的切线斜率

三元偏导数

\(f_x(x,y,z) = \lim\limits_{h\to 0}\frac {f(x+h,y,z)-f(x,y,z)}h\)

\(f_y(x,y,z) = \lim\limits_{h\to 0}\frac {f(x,y+h,z)-f(x,y,z)}h\)

\(f_z(x,y,z) = \lim\limits_{h\to 0}\frac {f(x,y,z+h)-f(x,y,z)}h\)

注:\(\omega = f(x,y,z)\) 在四维空间中,我们无法解释其几何意义

多元偏导数

令 u 是 n 元函数,\(u = f(x_1,x_2,\dots, x_n)\)

第 i 个变量的偏导数为:\(\frac {\partial u}{\partial x_i} = \lim\limits_{h\to 0} \frac {f(x_1,\dots,x_{i-1},x_i+h,x_{i+1},\dots, x_n) - f(x_1,\dots,x_i,\dots, x_n)}h\)

高阶导数

若 f 有两个变量,那么偏导数 \(f_x\)\(f_y\) 仍然是二元函数,

  • 我们讨论导数 \((f_x)_x, (f_x)_y, (f_y)_x, (f_y)_y\),有如下定义:

    1. \((f_x)_x = f_{xx} = f_{11} = \frac {\partial }{\partial x}(\frac {\partial f}{\partial x}) = \frac {\partial ^2f}{\partial x^2} = \frac {\partial ^2z}{\partial x^2}\)
    2. \((f_x)_y = f_{xy} = f_{12} = \frac {\partial }{\partial y}(\frac {\partial f}{\partial x}) = \frac {\partial ^2f}{\partial y\partial x} = \frac {\partial ^2z}{\partial y\partial x}\)
    3. \((f_y)_x = f_{yx} = f_{21} = \frac {\partial }{\partial x}(\frac {\partial f}{\partial y}) = \frac {\partial ^2f}{\partial x\partial y} = \frac {\partial ^2z}{\partial x\partial y}\)
    4. \((f_y)_y = f_{yy} = f_{22} = \frac {\partial }{\partial y}(\frac {\partial f}{\partial y}) = \frac {\partial ^2f}{\partial y^2} = \frac {\partial ^2z}{\partial y^2}\)

克莱罗定理

在 f 的定义域 D 内含有点 (a,b),如果 \(f_{xy}, f_{yx}\) 都在 D 内连续,那么 \(f_{xy}(a,b) = f_{yx}(a,b)\)

偏微分方程举例

  • \(\frac {\partial ^2u}{\partial x^2} + \frac {\partial ^2u}{\partial y^2} = 0\),解为 \(e^x\sin y\)
  • \(\frac {\partial ^2u}{\partial t^2} = a^2 \frac {\partial ^2u}{\partial x^2}\),解为 \(\sin (x-at)\)
  • 考伯-当拉斯产出函数定义为 \(P = P(L, K)\)(P 为收益,L 为劳动力,K 为资本)
    • P 关于 L 的变化率 与 P/L 成比例:\(\frac {\partial P}{\partial L} = \alpha \frac PL\) (1)
    • P 关于 K 的变化率 与 P/K 成比例:\(\frac {\partial P}{\partial K} = \beta \frac PK\) (2)
    • 对 (1) 和 (2) 分别用“分离变量法”(参见 9.3) 得到:
      • \(P(L, K_0) = C_1K_0L^{\alpha}\) ,(\(C_1 = \frac {C_1'}{K_0}\)
      • \(P(L_0, K) = C_2L_0K^{\beta}\) ,(\(C_2 = \frac {C_2'}{L_0}\)
      • 得到:\(P(L, K) = bL^{\alpha}K^{\beta}\),假定 \(\alpha,\beta > 0\)
    • \(P(mL, mK) = m^{\alpha+\beta}bL^{\alpha}K^{\beta} = m^{\alpha+\beta}P(L,K)\)
    • \(\alpha+\beta=1\) 时,称 \(P(L,K) = bL^{\alpha}K^{1-\alpha}\) 为考伯-当拉斯产出函数

总结

  1. 二元函数偏导数:若函数 f 是二元的,它的两个偏导数分别定义为:\(f_x(x,y)=\lim\limits_{h\to0}\frac{f(x+h,y)-f(x,y)}h\)\(f_y(x,y)=\lim\limits_{h\to0}\frac{f(x,y+h)-f(x,y)}h\);对于函数方程 \(z=f(x,y)\),记:
    1. \(f_x=\frac{\partial f}{\partial x}=\frac\partial{\partial x}f=\frac{\partial z}{\partial x}=f_1=D_1f=D_xf\)
    2. \(f_y=\frac{\partial f}{\partial y}=\frac\partial{\partial y}f=\frac{\partial z}{\partial y}=f_2=D_2f=D_yf\)
  2. 二元函数偏导数的几何意义:
    1. \(f_x(x,y)\) 表示 \(z=f(x,y)\) 沿着向量曲线方程 \(\mathbf r(t)=(t,y,f(t,y))\) 在点 \((x,y,f(x,y))\) 上的切线斜率,该切线为 \(\mathbf r(t)=(x,y,f(x,y))+t(1,0,f_x(x,y))\)
    2. \(f_y(x,y)\) 表示 \(z=f(x,y)\) 沿着向量曲线方程 \(\mathbf r(t)=(x,t,f(x,t))\) 在点 \((x,y,f(x,y))\) 上的切线斜率,该切线为 \(\mathbf r(t)=(x,y,f(x,y))+t(0,1,f_y(x,y))\)
  3. 高阶偏导数:
    1. 若 f 是二元的,那么记 \((f_x)_x=f_{xx}=f_{11}=\frac{\partial}{\partial x}\left(\frac{\partial f}{\partial x}\right)=\frac{\partial^2f}{\partial x^2}=\frac {\partial^2z}{\partial x^2}\),以及 \((f_x)_y=f_{xy}=f_{12}=\frac{\partial}{\partial y}\left(\frac{\partial f}{\partial x}\right)=\frac{\partial^2f}{\partial y\partial x}=\frac {\partial^2z}{\partial y\partial x}\)
  4. 克莱罗定理(高阶偏导数交换律):假设 f 是二元的,若 \(f_{xy},f_{yx}\) 均在 \((a,b)\) 的邻域内连续,那么 \(f_{xy}(a,b)=f_{yx}(a,b)\)
  5. n 元函数的偏导数:若 \(u=f(x_1,\cdots,x_n)\),那么第 i 个变量的偏导数为 \(\frac{\partial u}{\partial x_i}=\lim\limits_{t\to0}\frac{f(x_1,\cdots,x_i+t,\cdots,x_n)-f(x_1,\cdots,x_n)}t\)
  6. n 元函数的高阶偏导数:\(\frac{\partial^ku}{\partial x_i^k}=f_i^{(k)}(\mathbf x)\)

练习

  1. 判断题
    1. 二元函数 f 的 n 阶偏导数有 \(2^n\)
    2. 若二元函数 f 的 n 阶偏导数均连续,那么这些偏导数有 \(n+1\) 种(Y)
  2. 计算 \(f(x,y)=\begin{cases}\frac{x^3y-xy^3}{x^2+y^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\) 的偏导数 \(f_x,f_y,f_{xy},f_{yx}\)
  3. 计算 \(f(x,y)=\frac{xe^{\sin(x^2y)}}{(x^2+y^2)^{3/2}}\) 的偏导数 \(f_x(1,0)\)
  4. 计算椭圆 \(4x^2+2y^2+z^2=16,y=2\)\((1,2,2)\) 上的切线的向量方程
  5. 对于内角分别为 \(A,B,C\),相应对边为 \(a,b,c\) 的三角形,余弦定理为 \(a^2=b^2+c^2-2bc\cos A\),证明:(1) \(\frac{\partial A}{\partial a}=\frac a{bc\sin A}\),(2) \(\frac{\partial A}{\partial b}=\frac{c\cos A-b}{bc\sin A}\),(3) \(\frac{\partial A}{\partial c}=\frac{b\cos A-c}{bc\sin A}\)
  6. 假设 f 是二元的,证明:\(f_x(x,y)=x+4y,f_y(x,y)=3x-y\) 是矛盾的
  7. 对于并联电阻 \(R_1,\cdots,R_2\),总电阻满足 \(\frac1R=\sum\limits_{i=1}^n\frac1{R_i}\),证明:\(\forall i=1..n,\frac{\partial R}{\partial R_i}=\frac{R^2}{R_i^2}\)
  8. 证明:\(u=1/\sqrt{x^2+y^2+z^2}\) 是三维拉普拉斯方程 \(u_{xx}+u_{yy}+u_{zz}=0\) 的一个解
  9. 证明:(1) \(u=\sin(kx)\sin(akt)\),(2) \(u=t/(a^2t^2-x^2)\),(3) \(u=(x-at)^6+(x+at)^6\),(4) \(u=\sin(x-at)+\ln(x+at)\) 均是波动方程 \(u_{tt}=a^2u_{xx}\) 的一个解
  10. \(f,g\) 二阶可微,那么 \(u(x,t)=f(x+at)+g(x-at)\) 是波动方程的解
  11. 证明:假设 \(\mathbf a,\mathbf x\in\mathbb R^n\)\(\mathbf a\cdot\mathbf a=1\),那么 \(u(\mathbf x)=e^{\bf a\cdot x}\)\(\sum\limits_{i=1}^n\frac{\partial^2u}{\partial x_i^2}=u\) 的一个解

提示

(2) 若 \((x,y)\ne0\),有 \(f_x(x,y)=\frac{y(x^4+4x^2y^2-y^4)}{(x^2+y^2)^2}\),而 \(f_x(0,0)=\lim\limits_{t\to0}\frac{f(0+t,0)-f(0,0)}t=0\),于是 \(f_x(x,y)=\begin{cases}\frac{y(x^4+4x^2y^2-y^4)}{(x^2+y^2)^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\)

\((x,y)\ne0\),有 \(f_y(x,y)=\frac{x^5-4x^3y^2-xy^4}{(x^2+y^2)^2}\),而 \(f_y(0,0)=\lim\limits_{t\to0}\frac{f(0,0+t)-f(0,0)}t=0\),于是 \(f_y(x,y)=\begin{cases}\frac{x^5-4x^3y^2-xy^4}{(x^2+y^2)^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\)

\((x,y)\ne0\),有 \(f_{xy}=f_{yx}=\frac{x^6+9x^4y^2-9x^2y^4-y^6}{(x^2+y^2)^3}\)(由于克莱罗法则)

\(f_{xy}(0,0)=\lim\limits_{t\to0}\frac{f_x(0,0+t)-f_x(0,0)}t=\lim\limits_{t\to0}\frac{t(-t^4)/t^4}t=-1\)\(f_{yx}(0,0)=\lim\limits_{t\to0}\frac{f_y(0+t,0)-f_y(0,0)}t=\lim\limits_{t\to0}\frac{t^5/t^4 }t=1\)

于是 \(f_{xy}(x,y)=\begin{cases}\frac{x^6+9x^4y^2-9x^2y^4-y^6}{(x^2+y^2)^3}&(x,y)\ne(0,0)\\-1&(x,y)=(0,0)\end{cases}\)\(f_{yx}(x,y)=\begin{cases}\frac{x^6+9x^4y^2-9x^2y^4-y^6}{(x^2+y^2)^3}&(x,y)\ne(0,0)\\1&(x,y)=(0,0)\end{cases}\)

(3) \(f_x(1,0)=\lim\limits_{t\to0}\frac{f(1+t,0)-f(1,0)}t=\lim\limits_{t\to0}\frac{(1+t)^{-2}-1}t=\lim\limits_{t\to0}\frac{1-(1+t)^2}{t(1+t)^2}\) \(=\lim\limits_{t\to0}\frac{-2t-t^2}{t(1+t)^2}=\lim\limits_{t\to0}\frac{-2-t}{(1+t)^2}=-2\)

法2:\(f(x,0)=x(x^2)^{-3/2}=x^{-2}\),那么 \(f_x(x,0)=-2x^{-3}\),于是 \(f_x(1,0)=-3\)

(4) \(4x^2+2y^2+z^2=16\) 蕴含 \(8x+2z\frac{\partial z}{\partial x}=0\),蕴含 \(\frac{\partial z}{\partial x}=-4x/z\)

于是,在 \((1,2,2)\) 处,\(\frac{\partial z}{\partial x}=-2\),该处的切线向量方程为 \(\mathbf r(t)=(1,2,2)+t(1,0,-2)\)(因为该切线在平面 \(y=2\)

(6) \(f_x(x,y)=x+4y\) 蕴含 \(f_{xy}(x,y)=4\)

\(f_y(x,y)=3x-y\) 蕴含 \(f_{yx}(x,y)=3\)

由[克莱罗定理]和 \(f_{xy},f_{yx}\) 均是连续的,有 \(f_{xy}=f_{yx}\),矛盾

(7) \(\forall i=1..n\)\(-\frac1{R^2}\frac{\partial R}{\partial R_i}=-\frac1{R_i^2}\),蕴含 \(\frac{\partial R}{\partial R_i}=\frac{R^2}{R_i^2}\)

(8) \(u=1/\sqrt{x^2+y^2+z^2}\) 蕴含 \(u_x=-\frac{2x}{2(x^2+y^2+z^2)^{3/2}}=-\frac{x}{(x^2+y^2+z^2)^{3/2}}\),蕴含 \(u_{xx}=\frac{-(x^2+y^2+z^2)^{3/2}-(-x)(3/2)\sqrt{x^2+y^2+z^2}(2x)}{(x^2+y^2+z^2)^3}=\frac{-(x^2+y^2+z^2)+3x^2}{(x^2+y^2+z^2)^{5/2}}\)

根据对称性 \(u_{yy}=\frac{-(x^2+y^2+z^2)+3y^2}{(x^2+y^2+z^2)^{5/2}}\)\(u_{zz}=\frac{-(x^2+y^2+z^2)+3z^2}{(x^2+y^2+z^2)^{5/2}}\)

于是 \(u_{xx}+u_{yy}+u_{zz}=0\)

(11) \(\forall i=1..n\)\(\frac{\partial^2u}{\partial x_i^2}=\frac{\partial^2}{\partial x_i^2}(e^{\mathbf a\cdot\mathbf x})=\frac{\partial}{\partial x_i}((\mathbf a\cdot\mathbf x')e^{\mathbf a\cdot\mathbf x})=\frac{\partial}{\partial x_i}(a_ie^{\mathbf a\cdot\mathbf x})=a_i^2e^{\bf a\cdot x}\),于是 \(\sum\limits_{i=1}^n\frac{\partial^2u}{\partial x_i^2}=\sum\limits_{i=1}^na_i^2e^{\bf a\cdot x}=e^{\bf a\cdot x}\sum\limits_{i=1}^na_i^2=e^{\bf a\cdot x}=u\)

4.切平面 & 线性近似

一元微积分中,我们将函数曲线的一段小区间用它的切线近似

而二元微积分中,我们将函数曲面的一段小区域用它的切面来近似

多元可微函数同样也可以使用类似的近似方法

令 z=f(x,y) 的曲面 C 分别与 \(y=y_0\)\(x=x_0\) 相交于曲线 \(C_1,C_2\);点 \(P(x_0,y_0,z_0)\) 位于切平面 G 与曲面 C 的交点

由平面方程(12.5)有: \(G:~~A(x-x_0)+B(y-y_0)+C(z-z_0)=0\) \(\implies z-z_0=a(x-x_0)+b(y-y_0)\)

\(a=-\frac AC,b=-\frac BC, C\ne0\)

\(T_1,T_2\) 分别为 \(C_1,C_2\) 在点 P 处的切线

通过 G 的方程,\(T_1,T_2\) 可以分别表示为 \(z-z_0=a(x-x_0), y=y_0\)\(z-z_0=b(y-y_0), x=x_0\)

又由 14.2 可知 \(T_1,T_2\) 的斜率分别为 \(f_x(x_0,y_0), f_y(x_0,y_0)\),即 \(a=f_x(x_0,y_0), b=f_y(x_0,y_0)\)

最后得到 C 在 \(P(x_0,y_0,z_0)\) 处的切平面 G 为 \(z-z_0=f_x(x_0,y_0)(x-x_0)+f_y(x_0,y_0)(y-y_0)\)

曲面的切平面

假设二元函数 f 有连续偏导数,那么 \(z=f(x,y)\)\((a,b)\) 处的切平面的向量参数方程为 \(\mathbf r(u,v)=(a,b,f(a,b))+u(1,0,f_x(a,b))+v(0,1,f_y(a,b))\)

或者,该切平面的向量方程为 \(z-f(a,b)=f_x(a,b)(x-a)+f_y(a,b)(y-b)\)

\(z=f(x,y)\)\((a,b)\) 处沿着曲线 \(z=f(x,y),y=b\) 的切线向量为 \((1,0,f_x(a,b))\)

沿着曲线 \(z=f(x,y),x=a\) 的切线向量为 \((0,1,f_y(a,b))\),于是:

(1) \(z=f(x,y)\)\((a,b)\) 处的切平面的向量参数方程为 \(\mathbf r(u,v)=(a,b,f(a,b))+u(1,0,f_x(a,b))+v(0,1,f_y(a,b))\)

(2) \(z=f(x,y)\)\((a,b)\) 处的切平面的向量方程为 \(((1,0,f_x(a,b))\times(0,1,f_y(a,b)))\cdot((x,y,z)-(a,b,f(a,b)))=0\)

其中 \((1,0,f_x(a,b))\times(0,1,f_y(a,b))=(-f_x(a,b),-f_y(a,b),1)\)\((x,y,z)-(a,b,f(a,b))=(x-a,y-b,z-f(a,b))\)

于是 \(z-f(a,b)=f_x(a,b)(x-a)+f_y(a,b)(y-b)\)

\(\blacksquare\)

例子

  1. 计算 \(z=2x^2+y^2\) 在点 \((1,1,3)\) 上的切平面:设 \(f(x,y)=2x^2+y^2\),蕴含 \(f_x(x,y)=4x,f_y(x,y)=2y\),那么 \((1,1,3)\) 处的切平面为 \(z-3=f_x(1,1)(x-1)+f_y(1,1)(y-1)\),即 \(z-3=4(x-1)+2(y-1)\),即 \(z=4x+2y-3\)

线性近似

我们称 f 在 (a,b) 的线性化为:\(L(x, y) = f(a,b) + f_x(a,b)(x-a) + f_y(a,b)(y-b)\)

称 f 在点 (a,b) 的 线性近似 或 切平面近似 为:\(f(x,y) \approx f(a,b) + f_x(a,b)(x-a) + f_y(a,b)(y-b)\)

例子

  1. \(f(x,y)=xe^{xy}\) 有偏导数 \(f_x(x,y)=e^{xy}(1+xy),f_y(x,y)=x^2e^{xy}\),于是 f 在 \((1,0)\) 的线性近似为 \(g(x,y)=f(1,0)+f_x(1,0)(x-1)+f_y(1,0)(y-0)=x+y\);而 \(g(1,1,-0.1)=1\approx0.98542\approx f(1.1,-0.1)\)

由第 3 章,若 f(x) 在 a 处可微,那么 \(\Delta y = f'(a)\Delta x + \epsilon\Delta\),其中 \(\Delta\to 0\)\(\epsilon\to 0\)\(\Delta y = f(a + \Delta x) - f(a)\)

定义

若 z=f(x,y),那么 f 在点 (a,b) 是可微的,如果 \(\Delta z\) 可以表达为:

\(\Delta z = f_x(a,b)\Delta x + f_y(a,b)\Delta y + \epsilon_1\Delta x + \epsilon_2\Delta y\)

其中当 \(\epsilon_1 \to 0,\epsilon_2 \to 0\) 时,\((\Delta x, \Delta y) \to (0,0)\)

定理

如果偏导数 \(f_x\)\(f_y\) 在 (a,b) 附近存在,并且 (a,b) 连续,则 f 在 (a,b) 点可微

全微分

可微函数 z=f(x,y) 的全微分定义为:\(d_z = f_x(x,y)d_x + f_y(x,y)d_y = \frac {\partial z}{\partial x}d_x + \frac {\partial z}{\partial y}d_y\)

例子

  1. \(z=f(x,y)=x^2+3xy-y^2\),那么它的全微分为 \(dz=\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy=(2x+3y)dx+(-2y+3x)dy\)
    1. \((2,3)\to(2.05,2.96)\),那么 \(\Delta z=f(2.05,2.96)-f(2,3)=0.6449\),而 \(dx=0.05,dy=-0.04,dz=(2\cdot2+3\cdot3)(0.05)+(-2\cdot3+3\cdot2)(-0.04)=0.65\)

Tip

  • 在 (a,b) 附近,可以令 \(d_x=\Delta x = x-a, d_y=\Delta y = y-b\)
  • 那么全微分 \(d_z = f_x(a,b)(x-a) + f_y(a,b)(y-b)\)
  • \(f(x,y) \approx f(a,b) + d_z\) \(\implies\) \(\Delta z \approx d_z\)

三元函数的情况

线性近似:\(f(x,y,z) \approx f(a,b,c) + f_x(a,b,c)(x-a) + f_y(a,b,c)(y-b) + f_z(a,b,c)(z-c)\)

其线性化表达式 L(x,y,z) 等于上式的右边

\(\omega = f(x,y,z)\),那么 \(\omega\) 的增量是: \(\Delta \omega = f(x+\Delta x, y+\Delta y, z+\Delta z) - f(x,y,z)\)

微分 \(d_{\omega} = \frac {\partial \omega}{\partial x}d_x + \frac {\partial \omega}{\partial y}d_y + \frac {\partial \omega}{\partial z}d_z\)

总结

  1. 切平面:假设二元函数 f 有连续偏导数,那么 \(z=f(x,y)\)\((a,b)\) 处的切平面的向量参数方程为 \(\mathbf r(u,v)=(a,b,f(a,b))+u(1,0,f_x(a,b))+v(0,1,f_y(a,b))\),对应的向量方程为 \(z-f(a,b)=f_x(a,b)(x-a)+f_y(a,b)(y-b)\)
  2. 线性近似:二元函数 f 在 \((a,b)\) 点的线性近似为 \(g(x,y)=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b)\)\((a,b)\) 附近有 \(g(x,y)\approx f(x,y)\)
  3. 可微:假设 \(z=f(x,y)\),若 \(\epsilon_1 \to 0,\epsilon_2 \to 0,\Delta x\to0,\Delta y\to0\) 时,有 \(f_x(a,b)\Delta x+f_y(a,b)\Delta y+\epsilon_1\Delta x+\epsilon_2\Delta y=\Delta z\),那么 f 在 \((a,b)\)可微
  4. 可微定理:若 \(f_x,f_y\)\((a,b)\) 附近存在,并且在 \((a,b)\) 处连续,那么 f 在 \((a,b)\) 处可微
  5. 全微分:假设 f 是二元的,且 \(z=f(x,y)\),那么 f 的全微分定义为 \(dz=f_x(x,y)d_x+f_y(x,y)d_y\)

练习

  1. 计算切平面(假设 \(z=f(x,y)\)):(1) \(z=\sqrt{4-x^2-2y^2},(1,-1,1)\),(2) \(z=e^{x^2-y^2},(1,-1,1)\)
  2. 计算 \(f(x,y)=\tan^{-1}(x+2y)\)\((1,0)\) 处的线性近似
  3. 计算 \(z=5x^2+y^2\)\((1,2)\) 变到 \((1.05,2.1)\) 时,\(dz\)\(\Delta z\) 的值
  4. 通过定义证明:\(f(x,y)=x^2+y^2\) 可微
  5. 证明:\(\lim\limits_{(\Delta x,\Delta y)\to(0,0)}f(a+\Delta x,b+\Delta y)=f(a,b)\)

提示

(1.1) \(f_x(x,y)=\frac{-2x}{2\sqrt{4-x^2-2y^2}}=\frac{-x}{\sqrt{4-x^2-2y^2}}\)\(f_y(x,y)=\frac{-4y}{2\sqrt{4-x^2-2y^2}}=\frac{-2y}{\sqrt{4-x^2-2y^2}}\)

于是 \(z=f(x,y)\)\((1,-1)\) 处的切平面为 \(z-f(1,-1)=f_x(1,-1)(x-1)+f_y(1,-1)(y+1)\),即 \(z-1=-(x-1)+2(y+1)\),即 \(z=-x+2y+4\)

(1.2) \(f_x(1,-1)=d(e^{x^2-1})/dx\Big|_{x=1}=(2xe^{x^2-1})\Big|_{x=1}=2\)\(f_y(1,-1)=d(e^{1-y^2})/dx\Big|_{y=-1}=(-2ye^{1-y^2})\Big|_{y=-1}=2\)

于是 \(z=f(x,y)\)\((1,-1)\) 处的切平面为 \(z-f(1,-1)=2(x-1)+2(y+1)\),即 \(z=2x+2y+1\)

(2) \(f_x(x,y)=\frac1{1+(x+2y)^2},f_y(x,y)=\frac2{1+(x+2y)^2}\)

于是 \(f(x,y)\)\((1,0)\) 处的线性近似为 \(g(x,y)=f(1,0)+f_x(1,0)(x-1)+f_y(1,0)(y-0)=\pi/4+\frac12(x-1)+y=x/2+y+\pi/4-1/2\)

5.多元函数的链式法则

链式法则(情况 1)

\(z=f(x,y)\) 是一个关于 x 和 y 的可微函数,而 \(x=g(t)\)\(y=h(t)\) 均为 t 的可微函数,那么 z 就是 t 的一个可微函数,

并且有: \(\frac {d_z}{d_t} = \frac {\partial f}{\partial x}\frac {d_x}{d_t} + \frac {\partial f}{\partial y}\frac {d_y}{d_t}\)

通常记为: \(\frac {d_z}{d_t} = \frac {\partial z}{\partial x}\frac {d_x}{d_t} + \frac {\partial z}{\partial y}\frac {d_y}{d_t}\)

例子

  1. 假设 \(z=x^2y+3xy^4,x=\sin 2t,y=\cos t\),计算 \(\frac{dz}{d_t}\)
    1. 传统链式法则:\(\frac{dz}{d_t}=(2x(2\cos2t))y+x^2(-s\sin t)+3(2\cos2t)y^4+3x(4y^3(-\sin t))\)
    2. 二元链式法则:\(\frac{dz}{d_t}=(2xy+3y^4)(2\cos2t)+(x^2+12xy^3)(-\sin t)\)
  2. 假设 \(z=e^x\sin y,x=st^2,y=s^2t\),那么 \(\frac{\partial z}{\partial s}=(e^x\sin y)(t^2)+(e^x\cos y)(2st)\)\(\frac{\partial z}{\partial t}=(e^x\sin y)(2st)+(e^x\cos y)(2s^2)\)

链式法则(情况 2)

\(z=f(x,y)\) 是一个关于 x 和 y 的可微函数,而 \(x=g(s,t)\)\(y=h(s,t)\) 均为 s 和 t 的可微函数,那么 z 就是 s 和 t 的一个可微函数,

并且有: \(\frac {\partial z}{\partial s} = \frac {\partial f}{\partial x}\frac {\partial x}{\partial s} + \frac {\partial f}{\partial y}\frac {\partial y}{\partial s}\)\(\frac {\partial z}{\partial t} = \frac {\partial f}{\partial x}\frac {\partial x}{\partial t} + \frac {\partial f}{\partial y}\frac {\partial y}{\partial t}\)

Tip

  • 由于 \(f(x,y) = f(g(s,t), h(s,t))\),即 f 可以是两个变量 s 和 t 的函数,所以使用偏微分符号 \(\frac {\partial z}{\partial s}\)\(\frac {\partial z}{\partial t}\)
  • 链式法则(情况 2)有些违反直觉,例如:\(\frac {\partial z}{\partial s} = \frac {\partial f}{\partial x}\frac {\partial x}{\partial s} + \frac {\partial f}{\partial y}\frac {\partial y}{\partial s} = 2\frac {\partial z}{\partial s}\) (等式右边可能不正确?)

链式法则(通用形式)

假设 u 是 n 个变量 \(x_1,x_2,\dots,x_n\) 的一个可微函数,每一个变量 \(x_i\) 都是 m 个变量 \(t_1,t_2,\dots,t_m\) 的可微函数,那么 u 是 \(t_1,t_2,\dots,t_m\) 的可微函数,那么:

\(\displaystyle \frac {\partial u}{\partial t_j} = \sum\limits_{i=1}^n\frac {\partial u}{\partial x_i}\frac {\partial x_i}{\partial t_j}\)\(j=1..m\)

注:u 既可以表示为 \(u(x_1,x_2,\dots,x_n)\),也可以表示为 \(U(t_1,t_2,\dots,t_m)\)(注意映射符号的改变);上式则暗示 u 以 \(U(t_1,t_2,\dots,t_m)\) 的形式出现时的偏导数

推论:假设 g 是 u 的高阶高阶导数(“导数路径”为 \(x_{a_1},x_{a_2},\dots,x_{a_k}\)),那么 g 仍然是关于 \(t_1,t_2,t_m\) 的可微函数,同样有:\(\displaystyle \frac {\partial g}{\partial t_j} = \sum\limits_{i=1}^n\frac {\partial g}{\partial x_i}\frac {\partial x_i}{\partial t_j}\)

Tip

  • 用“树图”的方式可以直观地表示 因变量,中间变量,独立变量 之间的关系(因变量作为这棵树的根结点)

例子

  1. \(w=f(x,y,z,u),x=x(s,t),y=y(s,t),z=z(s,t),u=u(s,t)\),那么 (1) \(\frac{\partial w}{\partial s}=\frac{\partial w}{\partial x}\frac{\partial x}{\partial s}+\frac{\partial w}{\partial y}\frac{\partial y}{\partial s}+\frac{\partial w}{\partial z}\frac{\partial z}{\partial s}+\frac{\partial w}{\partial u}\frac{\partial u}{\partial s}\),(2) \(\frac{\partial w}{\partial t}=\frac{\partial w}{\partial x}\frac{\partial x}{\partial t}+\frac{\partial w}{\partial y}\frac{\partial y}{\partial t}+\frac{\partial w}{\partial z}\frac{\partial z}{\partial t}+\frac{\partial w}{\partial u}\frac{\partial u}{\partial t}\)
  2. 计算一般的偏微分总是会计算梯度向量 \(\nabla f\)(参见[14.6])的分量
  3. \(g(s,t)=f(s^2-t^2,t^2-s^2)\) 且 f 可微,那么 \(\frac{\partial g}{\partial s}=f_1'\cdot(2s)+f_2'\cdot(-2s)\)\(\frac{\partial g}{\partial t}=f_1'\cdot(-2t)+f_2'\cdot(2t)\),于是 \(t\frac{\partial g}{\partial s}+s\frac{\partial g}{\partial t}=0\)(有时为了记号“严谨”,会设 \(x=s^2-t^2,y=t^2-s^2\),蕴含 \(f(x,y)=f(s^2-t^2,t^2-s^2)\),蕴含 \(f_1'=\frac{\partial f}{\partial x},f_2'=\frac{\partial f}{\partial y}\)
  4. 假设 \(z=f(x,y)\) 有二阶偏导数,且 \(x=r^2+s^2,y=2rs\),那么 \(\frac{\partial z}{\partial r}=f_1'\cdot(2r)+f_2'\cdot(2s)\),计算 \(\frac{\partial^2z}{\partial r^2}\)
    1. 普通做法:\(\frac{\partial^2z}{\partial r^2}=\frac{\partial}{\partial r}\left(\frac{\partial z}{\partial r}\right)=(f_{11}''\cdot(2r)+f_{12}''\cdot(2s))\cdot(2r)+f_1'\cdot(2)+(f_{21}''\cdot(2r)+f_{22}''\cdot(2s))\cdot(2s)+f_2'\cdot0\) \(=4r^2f_{11}''+8rsf_{12}''+4s^2f_{22}''+2f_1'\)
    2. 优化做法:\(\frac{\partial^2z}{\partial r^2}=\frac{\partial}{\partial r}\left(\frac{\partial z}{\partial r}\right)=(2rf_{11}''+2sf_{21}'')(2r)+(2rf_{12}''+2sf_{22}'')(2s)+2f_1'=4r^2f_{11}''+8rsf_{12}''+4s^2f_{22}''+2f_1'\)

隐函数导数(一元)

根据微积分定理,当 F 定义在一个 盘型域,它上面的点 (a, b) 有 \(F(a,b)=0, F_y(a, b)\ne 0\),而且 \(F_x\)\(F_y\) 在盘型域中连续,那么方程 F(x,y)=0 在点 (a,b) 附近定义了一个 y 作为 x 的一个函数,且这个函数是可微的

其偏导数为 \(\frac {d_y}{d_x} = -\frac {F_x}{F_y}\)

\(F(x,y)=0\) 两边对 x 求导,有 \(F_1'+F_2'\frac{dy}{dx}=0\)

假设 \(F_2'\ne0\),有 \(\frac{dy}{dx}=-F_1'/F_2'\)\(\frac{\partial z}{\partial y}=-F_2'/F_3'\)

\(\blacksquare\)

隐函数导数(二元)

根据微积分定理,当 F 定义在一个包含 (a,b,c) 的 球体 上,它上面的点 (a,b,c) 有 \(F(a,b,c)=0, F_z(a, b, c)\ne 0\),而且 \(F_x(a,b,c)\ne 0\),而且 \(F_x,F_y,F_z\) 在球体内部连续,那么方程 F(x,y,z)=0 在点 (a,b,c) 附近定义了一个 z 作为 x 和 y 的一个函数,且这个函数是可微的

其偏导数为 \(\frac {\partial z}{\partial x} = -\frac {F_x}{F_z}\)\(\frac {\partial z}{\partial y} = -\frac {F_y}{F_z}\)

\(F(x,y,z)=0\) 分别对 \(x,y\) 求偏导数,有 \(\begin{cases}F_1'+F_3'\frac{\partial z}{\partial x}=0\\F_2'+F_3'\frac{\partial z}{\partial y}=0\end{cases}\)

假设 \(F_3'\ne0\),有 \(\frac{\partial z}{\partial x}=-F_1'/F_3'\)

\(\blacksquare\)

例子

  1. 假设 \(x^3+y^3=6xy,y=f(x)\),设 \(F(x,y)=x^3+y^3-6xy\),于是 \(y'=-\frac{3x^2-6y}{3y^2-6x}=\frac{2y-x^2}{y^2-2x}\)
  2. 假设 \(x^3+y^3+z^3+6xyz=1,z=f(x,y)\),设 \(F(x,y,z)=x^3+y^3+z^3+6xyz-1\),于是 \(\frac{\partial z}{\partial x}=-\frac{3x^2+6yz}{3z^2+6xy}=-\frac{x^2+2yz}{z^2+2xy}\)\(\frac{\partial z}{\partial y}=-\frac{3y^2+6xz}{3z^2+6xy}=-\frac{y^2+2xz}{z^2+2xy}\)

总结

  1. 二元链式法则(递归定义):假设 f 是二元的,那么 \(z=f(x,y)\) 对 t 的偏导数为 \(\frac{\partial z}{\partial t}=\frac{\partial z}{\partial x}\frac{\partial x}{\partial t}+\frac{\partial z}{\partial y}\frac{\partial y}{\partial t}\)\(\frac{\partial z}{\partial t}=f_1'\frac{\partial x}{\partial t}+f_2'\frac{\partial y}{\partial t}\)
    1. 特别的,若 \(z=(f\circ(g,h))(t)\),那么 \(\frac{dz}{dt}=\frac{\partial z}{\partial x}\frac{d x}{d_t}+\frac{\partial z}{\partial y}\frac{d y}{d_t}\)
  2. 多元链式法则:假设 f 是 n 元的,若 \(z=(f\circ(x_1,\cdots,x_n))(t_1,\cdots,t_m)\),那么 \(\forall i=1..m,\frac{\partial z}{\partial t_i}=\sum\limits_{j=1}^n\frac{\partial z}{\partial x_k}\frac{\partial x_k}{\partial t_i}\) 或者 \(\frac{\partial z}{\partial t_i}=\sum\limits_{k=1}^nf_k'\frac{\partial x_k}{\partial t_i}\)
    1. 其中,函数 \(\frac{\partial z}{\partial t_i}\) 可表示为 \(\frac{\partial z}{\partial t_i}=g(x_1,\cdots,x_n,t_i)\)
    2. 二阶偏导数:\(\frac{\partial^2z}{\partial t_j\partial t_i}=\mathbf u^T\begin{bmatrix}\frac{\partial x_1}{\partial t_i}\frac{\partial}{\partial x_1}\\\vdots\\\frac{\partial x_n}{\partial t_i}\frac{\partial}{\partial x_n}\end{bmatrix}\begin{bmatrix}\frac{\partial x_1}{\partial t_j}f_1'&\cdots&\frac{\partial x_n}{\partial t_j}f_n'\end{bmatrix}\mathbf u+\sum\limits_{k=1}^n\frac{\partial^2x_k}{\partial t_j\partial t_i}f_k'\),其中 \(\mathbf u^T=[1\cdots1]\)
  3. 隐函数偏导数:(更具实用性的隐函数求导,参见[3.6])
    1. 对于 \(F(x,y)=0,y=f(x)\),有 \(\frac{dy}{dx}=-F_1'/F_2'\)
    2. 对于 \(F(x,y,z)=0,z=f(x,y)\),有 \(\frac{\partial z}{\partial x}=-F_1'/F_3',\frac{\partial z}{\partial y}=-F_2'/F_3'\)

二级结论

  1. 微分应当分为“直接微分”(如:\(f_i'=\frac{\partial f}{\partial x_i}\))和“路径微分”(如:\(\frac{\partial f}{\partial t}=f_i'\frac{\partial x_i}{\partial t}\)
  2. 多元链式法则重用推论:假设 \(z=f(x,y),x=g(s,t),y=h(s,t)\),那么 \(\frac{\partial z}{\partial s}=[x_s'~~y_s']\begin{bmatrix}f_1'\\f_2'\end{bmatrix}\)\(\frac{\partial^2z}{\partial s\partial t}=[x_s'x_t'~~x_s'y_t'+x_t'y_s'~~y_s'y_t'~~x_{st}''~~y_{st}'']\begin{bmatrix}f_{11}''\\f_{12}''\\f_{22}''\\f_1'\\f_2'\end{bmatrix}\)

练习

  1. 判断题
    1. 假设一个 n 元函数间接依赖于 m 个变量,对 m 个变量进行二阶偏微分,可以得到项数为 \(\frac{n(n+1)}2+n=\frac{n(n+3)}2\) 的式子(Y)
  2. 若二元函数 f 满足 \(\forall t,f(tx,ty)=t^nf(x,y)\),那么称 f 是 n 阶齐次的
    1. 证明:\(f(x,y)=x^2y+2xy^2+5y^3\)
    2. 证明:[线性代数]中的 n 元二次型是 n 阶齐次的
    3. 证明:若 f 是 n 阶齐次函数,那么 f 是偏微分方程 \(x\frac{\partial f}{\partial x}+y\frac{\partial f}{\partial y}=nf(x,y)\) 的一个解
    4. 证明:若 f 是 n 阶齐次的,那么 f 是偏微分方程 \(x^2\frac{\partial^2f}{\partial x^2}+2xy\frac{\partial^2f}{\partial x\partial y}+y^2\frac{\partial^2f}{\partial y^2}=n(n-1)f(x,y)\) 的一个解
    5. 证明:若 f 是 n 阶齐次的,那么 f 是偏微分方程 \(f_x(tx,ty)=t^{n-1}f_x(x,y)\) 的一个解
  3. (环形依赖难题)假设 \(F(x,y,z)=0\) 定义了如下三个函数:\(z=f(x,y),y=g(x,z),x=h(y,z)\),并且 \(F_x',F_y',F_z'\) 均不为 0,证明:\(\frac{\partial z}{\partial x}\frac{\partial x}{\partial y}\frac{\partial y}{\partial z}=-1\)
  4. 假设 \(z=e^r\cos\theta,r=st,\theta=\sqrt{s^2+t^2}\),计算 \(\frac{\partial z}{\partial s},\frac{\partial z}{\partial t}\)
  5. (极坐标/柱面坐标的偏微分)假设 \(z=f(x,y),x=r\cos\theta,y=r\sin\theta\)
    1. 计算 \(\frac{\partial z}{\partial r},\frac{\partial z}{\partial \theta},\frac{\partial^2z}{\partial r^2},\frac{\partial^2z}{\partial\theta^2},\frac{\partial^2z}{\partial r\partial\theta}\)
    2. 证明:\(\left(\frac{\partial z}{\partial x}\right)^2+\left(\frac{\partial z}{\partial y}\right)^2=\left(\frac{\partial z}{\partial r}\right)^2+\frac1{r^2}\left(\frac{\partial z}{\partial\theta}\right)^2\)
    3. 证明:\(\frac{\partial^2z}{\partial x^2}+\frac{\partial^2z}{\partial y^2}=\frac{\partial^2z}{\partial r^2}+\frac1{r^2}\frac{\partial^2z}{\partial \theta^2}+\frac1r\frac{\partial z}{\partial r}\)

提示

(3) 若 \(z=f(x,y)\),根据隐函数求导法则 \(\frac{\partial z}{\partial x}=-F_1'/F_3'\)

同样地,若 \(y=g(x,z)\)\(x=h(y,z)\),那么 \(\frac{\partial x}{\partial y}=-F_2'/F_1'\)\(\frac{\partial y}{\partial z}=-F_3'/F_2'\)

于是 \(\frac{\partial z}{\partial x}\frac{\partial x}{\partial y}\frac{\partial y}{\partial z}=\left(-\frac{F_1'}{F_3'}\right)\left(-\frac{F_2'}{F_1'}\right)\left(-\frac{F_3'}{F_2'}\right)=-1\)

(4) \(\frac{\partial z}{\partial s}=e^r\cos\theta\cdot t-e^r\sin\theta\cdot\frac s{\sqrt{s^2+t^2}}\)

\(\frac{\partial z}{\partial t}=e^r\cos\theta\cdot s-e^r\sin\theta\cdot\frac t{\sqrt{s^2+t^2}}\)

(5.1) 根据[14.5二级结论]有:

  1. \(\frac{\partial z}{\partial r}=\cos\theta f_1'+\sin\theta f_2'\)
  2. \(\frac{\partial z}{\partial \theta}=-r\sin\theta f_1'+r\cos\theta f_2'\)
  3. \(\frac{\partial^2z}{\partial r^2}=\cos^2\theta f_{11}''+2\cos\theta\sin\theta f_{12}''+\sin^2\theta f_{22}''+0\cdot f_1'+0\cdot f_2'\)
  4. \(\frac{\partial^2z}{\partial\theta^2}=r^2\sin^2\theta f_{11}''-2r^2\cos\theta\sin\theta f_{12}''+r^2\cos^2\theta f_{22}''+-\sin\theta f_1'+\cos\theta f_2'\)
  5. \(\frac{\partial^2z}{\partial r\partial\theta}=-r\sin\theta\cos\theta f_{11}''+r(\cos^2\theta-\sin^2\theta)f_{12}''+r\sin\theta\cos\theta f_{22}''-r\sin\theta f_1'-r\cos\theta f_2'\)

6.方向导数 & 梯度向量

我们希望找到 \((x_0,y_0)\) 附近,沿着任意方向的单位向量 \(\mathbf u=\langle a, b\rangle\) 中 z=f(x,y) 的变化率,

\(P(x_0,y_0,f(x_0,y_0))\) 是曲面 \(S_1\) (由 f 决定)上一点,\(S_2\) 是经过点 P 且平行于 \(\mathbf u\) 的垂直于 xoy 的平面,

\(Q(x,y,z)\) 为曲面 \(S_1\) 与曲面 \(S_2\) 的交线 C 上的一点,显然能表示为 \(Q(x_0+ha, y_0+hb, f(x_0+ha, y_0+hb))\)

得到线段 PQ 之间的差分之比:\(\frac {\Delta z}{h} = \frac {f(x_0+ha, y_0+hb) - f(x_0,y_0)}{h}\)

因而 \(\lim\limits_{h\to 0} \frac {f(x_0+ha, y_0+hb) - f(x_0,y_0)}{h}\) 为 z 的在点 \((x_0,y_0)\)\(\mathbf u\) 方向上的变化率

方向导数

如果极限存在的话,函数 f 在点 \((x_0,y_0)\) 的关于一个向量 \(\mathbf u = \langle a,b\rangle\) 的方向导数是:

\(\displaystyle D_{\mathbf u}f(x_0,y_0) = \lim\limits_{h\to 0} \frac {f(x_0+ha, y_0+hb) - f(x_0,y_0)}{h}\)

Tip

  • \(\displaystyle D_{\mathbf i} f = f_x(x_0,y_0) = \lim\limits_{h\to 0}\frac {f(x_0+h,y_0)-f(x_0,y_0)}h\)\(\mathbf i = \langle 1,0 \rangle\)
  • \(\displaystyle D_{\mathbf j} f = f_y(x_0,y_0) = \lim\limits_{h\to 0}\frac {f(x_0,y_0+h)-f(x_0,y_0)}h\)\(\mathbf j = \langle 0,1 \rangle\)

梯度向量

如果 f 是 x 和 y 的一个两个变量函数,则 f 的梯度就是向量函数 \(\mathbf {grad} f\)\(\nabla f\)

\(\nabla f(x,y) = \langle f_x(x,y), f_y(x,y)\rangle = \frac {\partial f}{\partial x}\mathbf i + \frac {\partial f}{\partial y}\mathbf j\)

定理

如果 f 是 x 和 y 的一个可微函数,那么对于任何一个单位向量 \(\mathbf u = \langle a,b \rangle\),f 都有一个方向导数,其表达式为:

\(D_{\mathbf u}f(x,y) = f_x(x,y)a + f_y(x,y)b\)

\(D_{\mathbf u}f(x,y) = \nabla f\cdot \mathbf u\)

Tip

  1. \(a^2+b^2=1\)(即 \(\mathbf u\) 为单位向量),我们构造 \(a=\cos \theta, b=\sin \theta\),其中 \(\theta\)\(\mathbf u\) 与 x 轴正方向的夹角;那么 \(D_{\mathbf u}f(x,y) = f_x(x,y)\cos\theta + f_y(x,y)\sin\theta\)

例子

  1. 假设 \(f(x,y)=x^3-3xy+4y^2\)\(\mathbf u=(\cos\frac\pi6,\sin\frac\pi6)\),那么 \(D_{\bf u}f(x,y)=(f_x(x,y),f_y(x,y))\cdot\mathbf u=(3x^2-3y,8y-3x)\cdot(\sqrt3/2,1/2)=\frac{\sqrt3}2(3x^2-3y)+\frac12(8y-3x)\)
  2. 假设 \(f(x,y)=\sin x+e^{xy}\),那么 \(\nabla f(x,y)=(\cos x+ye^{xy},xe^{xy})\)
  3. 计算 \(f(x,y)=x^2y^3-4y\)\((2,-1)\) 对于 \(\mathbf u=(2,5)\) 的方向导数:\(D_{\bf u}f(2,-1)=(-4,8)\cdot(2,5)/\sqrt{2^2+5^2}=32/\sqrt{29}\)

三个变量函数的情况

  1. 如果下属极限存在,那么三元函数 f 在点 \((x_0,y_0,z_0)\) 的关于单位向量 \(\mathbf u=\langle a,b,c \rangle\) 的方向导数为:

    \(D_{\mathbf u}f(x_0,y_0,z_0) = \lim\limits_{h\to 0}\frac {f(x_0+ha,y_0+hb,z_0+hc)-f(x_0,y_0,z_0)}h\)

  2. 梯度向量 \(\nabla f = \langle f_x,f_y,f_z \rangle = \frac {\partial f}{\partial x}\mathbf i + \frac {\partial f}{\partial y}\mathbf j + \frac {\partial f}{\partial z}\mathbf k\)

  3. \(D_{\mathbf u}f(x_0,y_0,z_0) = \nabla f(x_0,y_0,z_0)\cdot \mathbf u\)

例子

  1. 计算 \(f(x,y,z)=x\sin yz\)\((1,3,0)\) 处沿着 \(\mathbf u=(1,2,-1)\) 的方向导数:\(\text D_{\bf u}f=(\sin yz,xz\cos yz,xy\cos yz)\cdot\mathbf u/\|\mathbf u\|\),于是 \(\text D_{\bf u}f(1,3,0)=(0,0,3)\cdot(1,2,-1)/\sqrt6=-3/\sqrt6\)

n 个变量函数的情况

n 元函数 f 在 \((\mathbf {x_0}) = (x_{1,0},x_{2,0},\dots,x_{n,0})\) 处,关于向量 \(\mathbf u\) 的情况:

  1. \(D_{\mathbf u}f(\mathbf {x_0}) = \lim\limits_{h\to 0}\frac {f(\mathbf{x_0} + h\mathbf u)-f(\mathbf{x_0})}h\)
  2. \(\nabla f = \langle f_{x_{1,0}},f_{x_{2,0}},\dots,f_{x_{n,0}} \rangle\)
  3. \(D_{\mathbf u}f(\mathbf {x_0}) = \nabla f(\mathbf {x_0})\cdot \mathbf u\)

方向导数最大值

假设 f 是 n 元的,\(\mathbf a\in\mathbb R^n\)

那么\(\bf a\) 处的方向导数的最大值为 \(\max\limits_{\mathbf u\in\mathbb R^n}\{\text D_{\bf u}f(\mathbf a)\}=\|\nabla f(\mathbf a)\|\),即 \(\arg\max\limits_{\mathbf u\in\mathbb R^n}\text D_{\bf u}f(\mathbf a)=\nabla f(\mathbf a)\)

\(\forall\mathbf u\in\mathbb R^n\)\(\text D_{\bf u}f=\frac{\nabla f\cdot\mathbf u}{\|\mathbf u\|}\le\|\nabla f\|\|\mathbf u\|/\|\mathbf u\|=\|\nabla f\|\)

\(\text D_{\nabla f}f=\frac{\nabla f\cdot\nabla f}{\|\nabla f\|}=\|\nabla f\|\)

于是当 \(\mathbf u=\nabla f\) 时,\(\text D_{\bf u}f\) 有最大值,即 \(\arg\max\limits_{\mathbf u\in\mathbb R^n}\text D_{\bf u}f=\nabla f\)

\(\blacksquare\)

例子

  1. \(f(x,y)=xe^y\)\((2,0)\) 上方向导数的最大值为 \(\text D_{\nabla f}f(2,0)=\|\nabla f(2,0)\|=\|(e^0,2e^0)\|=\sqrt5\)

假设 S 是 \(F(x,y,z)=k\) 确定的曲面(即 三元函数的等值面/等高面 或 二元函数的图像)

\(F(x,y,z)=k\) 可以表示为 \(F(\mathbf r(t))=F(x(t),y(t),z(t))=k\)

两边对 t 求微分有:\(\frac {\partial F}{\partial x}\frac {d_x}{d_t} + \frac {\partial F}{\partial y}\frac {d_y}{d_t} + \frac {\partial F}{\partial z}\frac {d_z}{d_t} = 0\) \(\implies\) \(\nabla F \cdot \mathbf r'(t) = 0\)

上式说明 \(\nabla F\) 与任意 S 上经过点 \(P(x(t),y(t),z(t))\) 的曲线 C 在 P 处的切线向量 \(\mathbf r'(t)\) 垂直,

这些切线向量构成平面为:\(F_x(x,y,z)(x_1-x) + F_y(x,y,z)(y_1-y) + F_z(x,y,z)(z_1-z) = 0\),称之为切平面(切平面由点 \((x_1,y_1,z_1)\) 构成)

上述切平面的法线方程为:\(\frac {x_2-x}{F_x(x,y,z)} = \frac {y_2-y}{F_y(x,y,z)} = \frac {z_2-z}{F_z(x,y,z)}\) (法线由点 \((x_2,y_2,z_2)\) 构成)

曲面的 切平面 & 法向量

  1. 给定三元函数等值面 或 二元隐函数 \(F(x,y,z)=k\),求 \((x_0,y_0,z_0)\) 处的 切平面 或 法向量:

    • 切平面方程:\(F_x(x_0,y_0,z_0)(x-x_0) + F_y(x_0,y_0,z_0)(y-y_0) + F_z(x_0,y_0,z_0)(z-z_0) = 0\)
    • 法线方程:\(\frac {x-x_0}{F_x(x_0,y_0,z_0)} = \frac {y-y_0}{F_y(x_0,y_0,z_0)} = \frac {z-z_0}{F_z(x_0,y_0,z_0)}\)
  2. 给定显式二元函数 \(F(x,y,z)-k = f(x,y)-z = 0\),求 \((x_0,y_0,z_0)\) 处的 切平面 或 法向量:

    • 切平面方程:\(f_x(x_0,y_0)(x-x_0) + f_y(x_0,y_0)(y-y_0) - (z-z_0) = 0\)
    • 法线方程:\(\frac {x-x_0}{f_x(x_0,y_0)} = \frac {y-y_0}{f_y(x_0,y_0)} = \frac {z-z_0}{-1}\)

例子

  1. \(\frac{x^2}4+y^2+\frac{z^2}9=3\)\((-2,1,-3)\) 的切平面为 $$

梯度向量的含义

  • \(\nabla F(\mathbf {x_0})\) 给出 f 增长最快的方向
  • \(\nabla F(\mathbf {x_0})\) 正交于 f 过点 \(P(\mathbf {x_0})\) 的等值区域 S

总结

  1. 方向导数:假设 \(\mathbf a,\mathbf u\in\mathbb R^n\),函数 f 是 n 元可微的,那么 f 在点 \(\bf a\) 上关于 \(\mathbf u\)方向导数\(\text D_{\bf u}f(\mathbf a)=\lim\limits_{t\to0}\frac{f(\mathbf a+t\mathbf u)-f(\mathbf a)}t\)(注:方向导数可以称为变化率
    1. \(n=2\),那么 (1) \(\text D_{\bf u}f(a_1,a_2)=\lim\limits_{t\to0}\frac{f(a_1+tu_1,a_2+tu_2)-f(a_1,a_2)}t\),(2) \(\text D_{\bf i}f(a_1,a_2)=f_x'(a_1,a_2)\),(3) \(\text D_{\bf j}f(a_1,a_2)=f_y'(a_1,a_2)\)
  2. 梯度:假设函数 f 是 n 元可微的,那么 f 的梯度定义为 \(\nabla f=(f_1',\cdots,f_n')\),或者记为 \(\mathbf{grad}f\)
  3. 定理:假设函数 f 是 n 元可微的,那么 \(\forall\mathbf u\in\mathbb R^n\),有 \(\text D_{\bf u}f=\frac{(\nabla f)\cdot \mathbf u}{\|\mathbf u\|}\)
  4. 方向导数的最值:假设 \(\mathbf a\in\mathbb R^n\),并且 f 是 n 元可微的,那么 f 在 \(\bf a\) 处沿着 \(\nabla f\) 方向时,方向导数取最大值,即 \(\max\limits_{\mathbf u\in\mathbb R^n}\{\text D_{\bf u}f(\mathbf a)\}=\|\nabla f(\mathbf a)\|\)\(\arg\max\limits_{\mathbf u\in\mathbb R^n}\text D_{\bf u}f(\mathbf a)=\nabla f(\mathbf a)\)
  5. 曲面的切平面,法线:在 \(\mathbb R^3\) 上,
    1. 曲面 \(f(x,y,z)=0\)\((a,b,c)\) 处的切平面为 \(\nabla f(a,b,c)\cdot(x-a,y-b,z-c)=0\),法线为 \(\mathbf u=(a,b,c)+t\nabla f(a,b,c)\)(其中 \(\mathbf u=(x,y,z)\) 是未知向量)
    2. 函数曲面 \(z=f(x,y)\)\((a,b,c)\) 处的切平面为 \((f_1'(a,b,c),f_2'(a,b,c),-1)\cdot(x-a,y-b,z-c)=0\),法线为 \(\mathbf u=(a,b,c)+t(f_1'(a,b,c),f_2'(a,b,c),-1)\)
  6. 切空间:假设 \(\mathbf a\in\mathbb R^n\),f 是 n 元的,那么几何空间 \(f(\mathbf x)=0\)\(\bf x=a\) 处的切空间\(\nabla f(\mathbf a)\cdot(\mathbf x-\mathbf a)=0\)
    1. \(n=2\),那么 \(f(x,y)=0\)\((a,b)\) 的切线为 \(\nabla f(a,b)\cdot(x-a,y-b)=0\)
    2. \(n=3\),那么 \(f(x,y,z)=0\)\((a,b,c)\) 处的切平面为 \(\nabla f(a,b,c)\cdot(x-a,y-b,z-c)=0\)

一级结论

  1. 梯度算子的性质:假设 \(u,v\) 是 n 元可微的,\(c\in\mathbb R\),那么 (1) \(\nabla(cu)=c\nabla u\),(2) \(\nabla(uv)=u\nabla v+v\nabla u\),(3) \(\nabla\frac uv=\frac{v\nabla u-u\nabla v}{v^2}\)

练习

  1. 证明:\(\sqrt x+\sqrt y+\sqrt z=\sqrt d\) 在任意一处的切平面在三个坐标轴的截距之和为 d
  2. 计算[10.5]讨论的曲线的切线,以及[12.6]讨论的曲面的切平面
  3. 如何计算函数 f 的梯度 \(\nabla f\)?如何计算 f 在 \(\bf a\) 处沿着向量 \(\bf u\) 的方向导数 \(\text D_{\bf u}(\mathbf a)\)?方向导数和梯度有什么关系?
  4. 梯度的最大值,最小值如何计算?

提示

(1) 该平面在任意一处 \((a,b,c)\) 的切平面为 \((1/\sqrt a,1/\sqrt b,1/\sqrt c)\cdot(x-a,y-b,z-c)=0\),即 \((1/\sqrt a,1/\sqrt b,1/\sqrt c)\cdot(x,y,z)=(1/\sqrt a,1/\sqrt b,1/\sqrt c)\cdot(a,b,c)\),即 \(x/\sqrt a+y/\sqrt b+z/\sqrt c=\sqrt a+\sqrt b+\sqrt c\)

3 个截距之和为 \(\sqrt a(\sqrt a+\sqrt b+\sqrt c)+\sqrt b(\sqrt a+\sqrt b+\sqrt c)+\sqrt c(\sqrt a+\sqrt b+\sqrt c)=(\sqrt a+\sqrt b+\sqrt c)^2=(\sqrt d)^2=d\)

7.多元函数的 极大值 & 极小值

正如第 4 章所见,导数的主要用途之一是计算 极值 或 最值

定义

如果对所有与 (a,b) 邻近的 (x,y) 均有 \(f(x,y)\le f(a,b)\),则称 (a,b) 是二元函数 f 的极大值点 (或以 (a,b) 为圆心的某一圆周之内的所有点 (x,y),均有 \(f(x,y)\le f(a,b)\)),f(a,b) 为一个极大值

如果对所有与 (a,b) 邻近的 (x,y) 均有 \(f(x,y)\ge f(a,b)\),则称 (a,b) 是二元函数 f 的极小值点 (或以 (a,b) 为圆心的某一圆周之内的所有点 (x,y),均有 \(f(x,y)\ge f(a,b)\)),f(a,b) 为一个极小值

定理(极值的必要条件)

如果 f 在 (a,b) 达到 极大 或 极小,则该点 f 的一阶偏导数存在,且有 \(f_x(x,y)=0\)\(f_y(x,y)=0\)

注:可以用 Fermat 定理证明

临界点 或 驻点,鞍点

如果有 \(f_x(a,b)=0\)\(f_y(a,b)=0\) 或其中之一不存在,

则称 (a,b) 为 f 的 临界点驻点

如果一个 临界点 不是极值点,那么称为 鞍点

二阶导数判别

设函数 f 的二阶导数在某一以 (a,b) 为圆心的圆形区域内连续,并且设 \(f_x(a,b)=0\)\(f_y(a,b)=0\)(即 (a,b) 是 f 的临界点)

\(D = D(a,b) = f_{xx}(a,b)f_{yy}(a,b) - [f_{xy}(a,b)]^2 = \left|\begin{matrix}{f_{xx}}&{f_{xy}}\\ {f_{yx}}&{f_{yy}}\\ \end{matrix}\right|\)

  1. \(D > 0\)
    1. 如果 \(f_{xx}(a,b) > 0\),则 \(f(a,b)\) 是极小值
    2. 如果 \(f_{xx}(a,b) < 0\),则 \(f(a,b)\) 是极大值
  2. \(D < 0\),则 \(f(a,b)\) 既不是极小值,也不是极大值
  3. \(D = 0\),则判别规则无效(无法提供任何信息)

部分证明详见:P274

例子

  1. 讨论 \(f(x,y)=x^4+y^4-4xy+1\) 的极值,鞍点:
    1. \(\nabla f(x,y)=(4x^3-4y,4y^3-4x)\),解方程 \(\nabla f(x,y)=\mathbf0\)\((x,y)=\) \((0,0)\)\((1,1)\)\((-1,-1)\)
    2. \(g(x,y)=f_{11}''(x,y)f_{22}''(x,y)-(f_{12}'')^2(x,y)=(12x^2)(12y^2)-(-4)^2=4^2(9x^2y^2-1)\)
    3. \(f_{11}''(0,0)=0\),于是 \((0,0)\) 是鞍点
    4. \(f_{11}''(1,1)=12>0,g(1,1)=128>0\),于是 \((1,1)\) 是极小值点
    5. \(f_{11}''(-1,-1)=12>0,g(-1,-1)=128>0\),于是 \((-1,-1)\) 是极小值点
  2. 借助计算器对 \(f(x,y)=10x^2y-5x^2-4y^2-x^4-2y^4\) 的临界点进行分类

应用

  • 点 到 平面 \(ax+by+cz+d=0\) 的距离可以使用上述定理转化为极值问题
  • 计算无盖长方体盒子的最大体积(限制:表面积固定)

\(\mathbb R^2\) 中,我们定义:

闭集:该集合与其所有边界点的并集(wiki的解释:开集的补集是闭集)

有界集:能被某个圆包含在其中的集合

在 闭集 和 有界集 的基础上,给出二维空间中的极值定理:

两个变量的函数的 极值定理

若 f 在 \(\mathbb R^2\) 中的有界闭集 D 上连续,则 f 在 D 中的某两个点 \((x_1,y_1)\)\((x_2,y_2)\) 处取到最大值 \(f(x_1,y_1)\) 和最小值 \(f(x_2,y_2)\)

连续函数 f 在有界集合 D 上的最值

  1. 求 f 在 D 上临界点处的函数值
  2. 求 f 在 D 的边界点上的极值
  3. 步骤 1 和 2 的最大的值为最大值,最小的则是最小值

例子

  1. 假设 \(f(x,y)=x^2-2xy+2y\)\(D_f=[0,3]\times[0,2]\),计算 f 的最值:
    1. \(\nabla f(x,y)=(2x-2y,2-2x)\),解方程 \(\nabla f(x,y)=0\)\((x,y)=(1,1)\),而 \(f(1,1)=1\)(而 \(g(x,y)=(f_{11}''f_{22}''-(f_{12}'')^2)(x,y)=2\cdot(-2)-(-2)^2=-8<0\)\(f_{11}''=2>0\),于是 \((1,1)\) 是极小值点)
    2. \(x=0\),那么 \(f(x,y)=2y\),此时极小值,极大值分别为 \(f(0,0)=0,(0,2)=4\)
    3. \(x=3\),那么 \(f(x,y)=9-4y\),此时极小值,极大值分别为 \(f(3,2)=1,f(3,0)=9\)
    4. \(y=0\),那么 \(f(x,y)=x^2\),此时极小值,极大值分别为 \(f(0,0)=0,f(3,0)=9\)
    5. \(y=2\),那么 \(f(x,y)=x^2-4x+4=(x-2)^2\),此时极小值,极大值分别为 \(f(2,2)=0,f(0,2)=4\)
    6. 通过比较上述 1 个临界值和 8 个边界值,f 的最小值为 \(f(0,0)=f(2,2)=0\),最大值为 \(f(3,0)=9\)

总结

  1. 最值,最值点:假设 f 是 n 元的
    1. \(\exists\mathbf u\in\mathbb R^n,\forall\mathbf a\in\mathbb R^n\) 使得 \(f(\mathbf u)\ge f(\mathbf a)\),那么 \(\mathbf u\) 称为 f 的最大值点\(f(\mathbf u)\) 称为 f 的最大值,记 \(\mathbf u=\arg\max\limits_{\mathbf a\in D_f}f(\mathbf a)\)
    2. \(\exists\mathbf u\in\mathbb R^n,\forall\mathbf a\in\mathbb R^n\) 使得 \(f(\mathbf u)\le f(\mathbf a)\),那么 \(\mathbf u\) 称为 f 的最小值点\(f(\mathbf u)\) 称为 f 的最小值,记 \(\mathbf u=\arg\min\limits_{\mathbf a\in D_f}f(\mathbf a)\)
  2. 极值,极值点:假设 f 是 n 元的,那么 \(\begin{cases}\mathbf u是极大值点&\mathbf u=\arg\max\limits_{\mathbf x\in U(\mathbf a,\delta)}f(\mathbf x)\\\mathbf u是极小值点&\mathbf u=\arg\min\limits_{\mathbf x\in U(\mathbf a,\delta)}f(\mathbf x)\end{cases}\)
  3. 费马定理(n 元的情况):假设 f 是 n 元的,若 \(\bf a\) 是 f 的极值点,那么 \(\nabla f(\mathbf a)=\mathbf 0\)
  4. 临界点(驻点),鞍点:假设 f 是 n 元的,若 \(\nabla f(\mathbf a)=\mathbf 0\)\(\nabla f(\mathbf a)\) 不存在,那么 \(\bf a\) 称为 f 的临界点驻点;又若 \(\bf a\) 不是极值点,那么 \(\bf a\) 又称鞍点(注:极值点是临界的非鞍点)
  5. (极值的)二阶导数判别法:假设 f 是二元的,\(A(\mathbf u)=\begin{bmatrix}f_{11}''(\mathbf u)&f_{12}''(\mathbf u)\\f_{21}(\mathbf u)&f_{22}''(\mathbf u)\end{bmatrix}\),若 \(\nabla f(\mathbf u)=\mathbf 0\),那么 \(\begin{cases}\mathbf u是f的一个极大值点&|A(\mathbf u)|>0,f_{11}''<0\\\mathbf u是f的一个极小值点&|A(\mathbf u)|>0,f_{11}''>0\\\mathbf u是f的一个鞍点&|A(\mathbf u)|<0\\不提供信息&|A(\mathbf u)=0|\end{cases}\)
  6. 最值存在定理:假设 f 是二元的,若 \(D_f\)有界闭集,那么 \(\exists\mathbf u_1,\mathbf u_2\in\mathbb R^2\) 使得 \(\mathbf u_1,\mathbf u_2\) 分别是 f 的最大值点,最小值点
  7. 最值判定定理:假设 f 是定义在有界闭集上的函数,那么 f 的最值点是 f 的 (1) 边界点 和 (2) 极值点 中的最值点(有时无需结合极值判别法来获取极值点,而只需讨论边界点和临界点)

二级结论

  1. 特殊点分类:\(\begin{cases}临界点(驻点)\begin{cases}极值点\\鞍点\end{cases}\\边界点\end{cases}\);最值点是极值点或边界点

练习

  1. 计算三角形闭区域内函数的最值:
    1. \(f(x,y)=1+4x-5y\)\(D_f\)\((0,0),(2,0),(0,3)\) 为顶点
    2. \(f(x,y)=3+xy-x-2y\)\(D_f\)\((1,0),(5,0),(1,4)\) 为顶点
  2. 计算 \(f(x,y)=x^3-3x-y^3+12y\) 的最值,其中 \(D_f\) 是以 \((-2,3),(2,3),(2,2),(-2,-2)\) 为顶点的四边形

提示

8.lagrange 乘子

lagrange 乘子算法

为了找到函数 f(x,y,z) 在 g(x,y,z)=k 条件下的最大值和最小值

假设这些值存在,且在曲面 g(x,y,z)=k 上有 \(\nabla g \ne 0\)

  1. 找出所有 x, y, z, \(\lambda\) 的值,使得:\(\nabla f(x,y,z)=\lambda \nabla g(x,y,z)\)\(g(x,y,z)=k\)
  2. 求出 f 在 (1) 中所得的所有点 (x,y,z) 对应的值;在这些值中最大的就是 f 的最大值,最小的就是 f 的最小值

lagrange 乘子算法性质

\(\nabla f = \lambda \nabla g\) 和 g(x,y,z)=k 等价于:

\(\displaystyle \begin{cases} f_x = \lambda g_x \\ f_y = \lambda g_y \\ f_z = \lambda g_z \\ g(x,y,z)=k \end{cases}\)

例子

  1. 假设 \(x,y,z\ne0\),计算 \(f(x,y,z)=xyz\)\(xy+2(x+y)z-12=0\) 的条件下的最大值:由[拉格朗日乘子算法],\(\exists\lambda\) 使得 \(\nabla f(x,y,z)=\lambda\nabla g(x,y,z)\),即 \((yz,xz,xy)=\lambda(y+2z,x+2z,2(x+y))\),解得 \((x,y,z)=(2,2,1)\),所以最值为 \(f(2,2,1)=4\)(注:)
  2. 计算 \(f(x,y)=x^2+2y^2\)\(x^2+y^2=1\) 的条件下的极值:\(\exists\lambda\) 使得 \(\nabla f(x,y)=\lambda\nabla g(x,y)\),即 \((2x,4y)=\lambda(2x,2y)\)
    1. \(x\ne0\),蕴含 \(\lambda=1\),蕴含 \(y=0\),蕴含 \(x=\pm1\)
    2. \(y\ne0\),蕴含 \(\lambda=2\),蕴含 \(x=0\),蕴含 \(y=\pm1\)
    3. 于是 f 在 \((\pm1,0)\) 处取最小值,在 \((0,\pm1)\) 处最大值
  3. 假设 \(f(x,y)=x^2+2y^2\),并且 \(D_f=\{(x,y)|~x^2+y^2\le1\}\) 的最值
    1. 讨论临界点:假设 \(\nabla f(x,y)=(2x,4y)\),解方程 \(\nabla f(x,y)=0\)\((x,y)=(0,0)\)\(f(0,0)=0\)
    2. 讨论边界点:\(\exists\lambda,\nabla f(x,y)=\lambda\nabla g(x,y)\),即 \((2x,4y)=\lambda(2x,2y)\),类似于 (2) 有 \((x,y)=(\pm1,\pm1)\)
    3. 于是 f 的最小值为 \(f(0,0)=0\),最大值为 \(f(0,\pm1)=2\)

两个约束条件下的 lagrange 乘子算法

求 f(x,y,z) 在满足 g(x,y,z)=k 和 h(x,y,z)=c 的约束条件下的极值:

存在两个常数 \(\lambda\)\(\mu\)(lagrange 乘子),使得 \(\nabla f = \lambda \nabla g + \mu \nabla h\)

其等价于 \(\displaystyle \begin{cases} f_x = \lambda g_x + \mu h_x \\ f_y = \lambda g_y + \mu h_y \\ f_z = \lambda g_z + \mu h_z \\ g(x,y,z)=k \\ h(x,y,z)=c \end{cases}\)

例子

  1. 计算 \(f(x,y,z)=x+2y+3z\) 在限制 \(g(x,y,z)=x-y+z-1=0,h(x,y,z)=x^2+y^2-1=0\) 下的最大值:
    1. \(\exists u,v\) 使得 \(\nabla f=u\nabla g+v\nabla h\),即 \((1,2,3)=u(1,-1,1)+v(2x,2y,0)\)
    2. 初步解得 \(x=\pm2/\sqrt{29},y=\pm5/\sqrt{29}\),而 \(z=1-x+y\),可以计算得到最大值为 \(3+\sqrt{29}\)

扩展到 n 个变量

总结

  1. 拉格朗日乘子算法:假设 \(c,d\in\mathbb R\),f 是三元的,\(\nabla g\ne0\)
    1. \(\mathbf u=\arg\max\limits_{\mathbf x\in D_f,g(\mathbf x)=c}f(\mathbf x)\),那么 \(\exists\lambda\in\mathbb R\),使得 \(\begin{cases}\nabla f(\mathbf u)=\lambda\nabla g(\mathbf u)\\g(\mathbf u)=c\end{cases}\)
    2. \(\mathbf u=\arg\max\limits_{\mathbf x\in D_f,g(\mathbf x)=c,h(\mathbf x)=d}f(\mathbf x)\),那么 \(\exists\lambda,\mu\in\mathbb R\) 使得 \(\begin{cases}\nabla f(\mathbf u)=\lambda\nabla g(\mathbf u)+\nabla h(\mathbf u)\\g(\mathbf u)=c\\h(\mathbf u)=d\end{cases}\)
    3. 注:在实际运用该算法时,注意先假设 \(\nabla g\) 的各个分量非零时的情况

一级结论

练习

  1. (几何平均值,算术平均值)假设 \(\mathbf x\in\mathbb R^n,c\in\mathbb R\)
    1. 证明:\(f(\mathbf x)=\sqrt[n]{\prod\limits_{i=1}^nx_i}\)\(\sum\limits_{i=1}^nx_i=c\) 的限制下的最大值为 \(\frac cn\)
    2. 由 (1) 可知 \(\forall\mathbf x\in\mathbb R^n,\sqrt[n]{\prod\limits_{i=1}^nx_i}\le\frac1n\sum\limits_{i=1}^n\),讨论何时等式成立?
  2. (柯西-施瓦茨不等式)假设 \(\mathbf x,\mathbf y,\mathbf a,\mathbf b\in\mathbb R^n\)
    1. 证明:\(f(\mathbf x,\mathbf y)\)\(\sum\limits_{i=1}^nx_i^2=1,\sum\limits_{i=1}^ny_i^2=1\) 的限制条件下的最大值为 1
    2. \(\forall i=1..n,x_i=\frac{a_i}{\sqrt{\sum\limits_{j=1}^na_j^2}},y_i=\frac{b_i}{\sqrt{\sum\limits_{j=1}^nb_j^2}}\),证明:\(\sum\limits_{i=1}^na_ib_i\le\sqrt{\sum\limits_{i=1}^na_i^2}\sqrt{\sum\limits_{i=1}^nb_i^2}\)
  3. 计算 \(\mathbb R^3\) 中的椭圆曲线 \(4x-3y+8z=5,z^2=x^2+y^2\) 的最高点,最低点
  4. 计算 \(\mathbb R^3\) 中的椭圆曲线 \(x+y+2z=2,z=x^2+y^2\) 离原点的最近点,最远点
  5. 长方形盒子表面积为 a,所有边周长为 b,计算盒子体积的最大值
  6. 证明:矩形周长为 p 时,矩形为正方形时面积最大
  7. 证明:三角形周长为 p 时,三边相等时面积最大(海伦公式:三角形面积为 \(\sqrt{s(s-x)(s-y)(s-z)}\),其中 \(s=p/2\)\(x,y,z\) 分别为三角形的三条边)
  8. 计算给定条件下的最值:(假设 \(g,h\) 为限制函数)
    1. \(f(x,y)=x^2-y^2,x^2+y^2=1\)
    2. \(f(x,y,z)=x^2+y^2+z^2,x^4+y^4+z^4=1\)
    3. \(f(x,y,z)=x^2y^2z^2,x^2+y^2+z^2=1\)
    4. \(f(x,y,z)=yz+xy,xy=1,y^2+z^2=1\)
  9. 计算 f 的最值:
    1. \(f(x,y)=2x^2+3y^2-4x-5,D_f=\{(x,y)|~x^2+y^2\le16\}\)
    2. \(f(x,y)=e^{-xy},D_f=\{(x,y)|~x^2+4y^2\le1\}\)

提示

(1.1) \(\exists\lambda,\nabla f(\mathbf x)=\lambda\nabla g(\mathbf x)\),即 \(\sqrt[n]{\prod\limits_{i=1}^nx_i}\left(\frac1{nx_1},\cdots,\frac1{nx_n}\right)=\lambda(1,\cdots,1)\)

解得 \(x_1=\cdots=x_n\),即 \(\forall i=1..n,x_i=\frac cn\)

(1.2) 仅当 \(\forall i\ne j,x_i=x_j\) 时成立

(3) 假设 \(f(x,y,z)=z,g(x,y,z)=4x-3y+8z-5,h(x,y,z)=x^2+y^2-z^2\)

于是 \(\exists u,v\) 使得 \(\nabla f(x,y,z)=u\nabla g(x,y,z)+v\nabla h(x,y,z)\),即 \((0,0,1)=u(4,-3,8)+v(2x,2y,-2z)\),消去 \(u,v\)\(x=-\frac43y\)

然后解方程组 \(\begin{cases}x=-\frac43y\\4x-3y+8z=5\\x^2+y^2=z^2\end{cases}\)\((x,y,z)=\) \((\frac4{13},-\frac3{13},\frac5{13})\)\((-\frac43,1,\frac53)\)

所以椭圆上的最高点为 \((-\frac43,1,\frac53)\),高度为 \(\frac53\)

椭圆上的最低点为 \((\frac4{13},-\frac3{13},\frac5{13})\),高度为 \(\frac5{13}\)

(4) 记 \(f(x,y,z)=x^2+y^2+z^2,g(x,y,z)=x+y+2z-2,h(x,y,z)=x^2+y^2-z\)

\(\exists u,v\) 使得 \(\nabla f(x,y,z)=u\nabla g(x,y,z)+v\nabla h(x,y,z)\),即 \((2x,2y,2z)=u(1,1,2)+v(2x,2y,-1)\)\(\begin{bmatrix}1&2x\\1&2y\\2&-1\end{bmatrix}\begin{bmatrix}u\\v\end{bmatrix}=\begin{bmatrix}2x\\2y\\2z\end{bmatrix}\),后者对系数进行初等变换有 \(\begin{bmatrix}1&2x&2x\\1&2y&2y\\2&-1&2z\end{bmatrix}\sim\begin{bmatrix}1&2x&2x\\0&y-x&y-x\\0&1+4x&4x-2z\end{bmatrix}\)

  1. \(y\ne x\),蕴含 \(v=1\),那么 \(1+4x=4x-2z\),即 \(z=-1/2\),而与 \(z=x^2+y^2\ge0\) 矛盾
  2. \(y=x\),可以得到方程组 \(\begin{cases}x+z=1\\z=2x^2\end{cases}\),结合 \(y=x\) 的假设,解得 \((x,y,z)=\) \((-1,-1,2)\)\((1/2,1/2,1/2)\)

于是椭圆上离原点最远的点是 \((1/2,1/2,1/2)\),此时距离为 \(\sqrt{f(1/2,1/2,1/2)}=\sqrt3/2\)

椭圆上离原点最远的点是 \((-1,-1,2)\),此时距离为 \(\sqrt{f(-1,-1,2)}=\sqrt6\)

(5) 记 \(f(x,y,z)=xyz,2(xy+yz+zx)=a,2(x+y+z)=b\)

存在 \(u,v\) 使得 \(\nabla f(x,y,z)=u\nabla g(x,y,z)+v\nabla h(x,y,z)\),容易解得 \(x=y\)\(y=z\)\(x=z\)

...

(8.1) \(f(x,y)=x^2-y^2,g(x,y)=x^2+y^2-1\)

\(\exists u,\nabla f=u\nabla g\),即 \((2x,-2y)=u(2x,2y)\),解得 \((x,y)=\) \((0,\pm1)\)\((\pm1,0)\)

于是 f 的最大值为 \(f(\pm1,0)=1\),最小值为 \(f(0,\pm1)=-1\)

(8.2) \(f(x,y,z)=x^2+y^2+z^2,x^4+y^4+z^4=1\)

\(\exists u,\nabla f=u\nabla g\),即 \((2x,2y,2z)=u(4x^3,4y^3,4z^3)\)

  1. \(x\ne0\),可以得到四种可能:\(x^2=y^2=z^2\)\(x^2=y^2,z=0\)\(y=0,x^2=z^2\)\(y=0,z=0\),可以解得 \((x,y,z)=\) \((\pm\frac1{\sqrt[4]3},\pm\frac1{\sqrt[4]3},\pm\frac1{\sqrt[4]3})\)\((\pm\frac1{\sqrt[4]2},\pm\frac1{\sqrt[4]2},0)\)\((\pm\frac1{\sqrt[4]2},0,\pm\frac1{\sqrt[4]2})\)\((\pm1,0,0)\)
  2. \(x=0\)\(y\ne0\)\(y=0\)\(z\ne0\)\(z=0\) 时,可以得到类似的解?

可以得到 f 的最大值为 \(f(\pm\frac1{\sqrt[4]2},\pm\frac1{\sqrt[4]2},\pm\frac1{\sqrt[4]2})=\sqrt3\),最小值为 \(f(\pm1,0,0)=1\)