14.多元函数的偏导数
1.多元函数
以下将从四个角度研究具有多变量的函数:
- 语言描述(文字)
- 数值描述(数值表格)
- 代数刻画(显式的公式)
- 直观刻画(曲面或等值线图)
二元函数
二元函数 f 是指在集合 D 中的每个有序实数对 \((x, y)\) 都有唯一的实数 \(f(x, y)\) 与前者对应
这里 D 是函数的 定义域,f 能取到的值叫做 值域,记作 \(\{ f(x, y) | (x, y) \in D \}\)
几何解释:二元函数 f 满足: 二维平面 \(\mathbb R^2\) 的子集(即定义域)的每一个点能通过 f 唯一映射到一个一维数轴 \(\mathbb R\) 上的点(这些点构成集合——值域)
例子
- \(f(x,y)=\frac{\sqrt{x+y+1}}{x-1}\) 的定义域为 \(\{(x,y)|~x\ne1,x+y+1\ge0\}\)
- \(f(x,y)=x\ln(y^2-x)\) 的定义域为 \(\{(x,y)|~y^2-x>0\}\)
- \(\{(x,y)|~y<f(x)\}\) 表示 \(y=f(x)\) y 的负半轴方向的区域
- \(\{(x,y)|~x<f(x)\}\) 表示 \(x=f(y)\) x 的负半轴方向的区域
- \(g(x,y)=\sqrt{9-x^2-y^2}\) 的定义域为 \(\{(x,y)|~x^2+y^2\le9\}\),值域为 \([0,3]\)
二元函数 图像
如果 f 是一个以 \(D\subset \mathbb R^2\) 为定义域的二元函数,那么 f 的图像就是在 \(\mathbb R^3\) 中所有的点 \((x, y, z)\),
这里 \(z=f(x, y)\) 并且 \((x, y)\) 在 D 中
例子
- 假设 \(f(x,y)=6-3x-2y\),那么 \(z=f(x,y)\) 的图像是 \(x,y,z\) 轴截距分别为 \(2,3,6\) 的平面
- 若 \(g(x,y)=\sqrt{9-x^2-y^2}\),那么方程 \(z=f(x,y)\) 的图像是以 \((0,0)\) 为圆心,半径为 3 的圆的上半部分
- 若 \(h(x,y)=4x^2+y^2\),由[12.6],\(z=h(x,y)\) 是椭圆抛物面
计算机画图
- 试着画出如下函数图像:\((x^2 + 3y^2)e^{-x^2-y^2}\),\(\sin x + \sin y\),\(\frac {\sin x\sin y}{xy}\)
等高线
二元函数 f 的等高线就是方程 \(f(x, y) = k\) 所对应的曲线(k 为常数)
同时也可以认为 \(f(x, y) = k\) 是 f 在 \(xoy\) 上的投影
二元函数的等高线 可以推广到 一元函数的端点,也可以对应于 三元函数的等高面
等高线的应用
- 地形图:设高于水平面的高度 f 是 x 和 y 的函数,那么 f 的一族等高线对应了 地理学 中的地形图;等高线越密集,表示此处越陡峭
- 温度带:设温度 f 是经纬度 x 和 y 的函数,那么 f 的一族等高线就是某一时刻的温度等温线
试着用等高线画图
- \(-xye^{-x^2-y^2}\),\(\frac {-3y}{x^2+y^2+1}\)
三元函数
三元函数 f 对于定义域 \(D\subset \mathbb R^3\) 内的每个三元组 (x, y, z) 都有唯一的实数 f(x, y, z) 与其对应
例子
- \(f(x,y,z)=\ln(z-y)+xy\sin z\) 的定义域是 \(\{(x,y,z)\in\mathbb R^3|~z-y>0\}\)
三元函数的 等高面
三元函数 f 的等高面就是方程 \(f(x, y, z) = k\) 所对应的曲面(k 为常数)
多元函数
一个 n 元函数是一个数组 \((x_1, x_2, \dots, x_n)\) 到一个数 \(z=f(x_1,x_2,\dots, x_n)\) 的一个对应
我们有三种方式看待定义在 \(\mathbb R^n\) 的子集上的函数:
- n 个实变量 \(x_1,x_2,\dots,x_n\) 的函数
- 一个点变量 \((x_1,x_2,\dots,x_n)\) 的函数
- 一个向量 \(\mathbf x = \langle x_1,x_2,\dots,x_n \rangle\) 的函数;f 可表示为 \(f(\mathbf x)\)
Note
- 我们将所有数组 \(((x_1, x_2, \dots, x_n))\) 构成的集合为 \(\mathbb R^n\)
总结
- 多元函数:假设 \(D_f\subset\mathbb R^n\),多元函数定义为映射关系 \(f:~D_f^n\to\mathbb R\),其中 \(D_f,R_f=\{\mathbf x\in\mathbb R^n|~\mathbf x\in D_f\}\) 分别为 f 的定义域和值域,\(\mathbb R\) 是 f 的余定义域(注:\(\mathbf x=(x,y,z,\cdots)\) 或 \(\mathbf x=(x_1,x_2,\cdots)\))
- 若 \(n=1\),那么函数方程 \(y=f(x)\) 表示 \(\mathbb R^2\) 下的向量集或者曲线
- 若 \(n=2\),那么函数方程 \(z=f(x,y)\) 表示 \(\mathbb R^3\) 下的向量集或者曲面
- 若 \(n\in\mathbb Z^+\),那么函数方程 \(u=f(\mathbf x)\) 表示 \(\mathbb R^{n+1}\) 下的向量集
- 等高线,等值面:假设 \({a_k}\) 是一个(等差)数组,那么 \(z=f(x,y)\) 的一组等高线是 \(f(x,y)=a_1,\cdots,f(x,y)=a_k\);\(u=f(x,y,z)\) 的一组等值面是 \(f(x,y,z)=a_1,\cdots,f(x,y,z)=a_k\)
练习
- 使用“等值方法”画出如下方程:(1) \(z=\sin\sqrt{x^2+y^2}\),(2) \(z=x^2y^2e^{-x^2-y^2}\),(3) \(z=\frac1{x^2+4y^2}\),(4) \(z=x^3-3xy^2\),(5) \(z=\sin x\sin y\),(6) \(z=\sin^2x+\frac14y^2\)
- 如何计算多元函数的定义域,值域,各处取值?
- 如何做图像变换?(见[第1章])
- 使用“等值方法”画出如下函数的图像:(1) \(xy\),(2) \(x^2-y^2\),(3) \(y-\ln x\),(4) \(e^{y/x}\),(5) \(\sqrt{x+y}\),(6) \(y\sec x\),(7) \(x-y^2\),(8) \(y/(x^2+y^2)\)
- 画出如下函数的图像:(1) \(|x|+|y|\),(2) \(|xy|\),(3) \(1/(1+x^2+y^2)\),(4) \((x^2-y^2)^2\),(5) \((x-y)^2\),(6) \(\sin{|x|+|y|}\)
2.多元函数的极限 & 连续性
二元函数极限
感性定义:\(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L\) 表示在 f 的定义域点 (x, y) 沿着任何路径趋近于 (a, b) 时,f(x, y) 趋近于一个数 L
也就是说,通过让 (x,y) 充分靠近 (a,b),使得 f(x,y) 充分接近 L
严格定义:令 f 是一个二元函数,定义域是 D,其中的点 (x,y) 任意趋近于 (a,b),那么我们称当 (x,y) 趋近 (a,b) 时,f(x,y) 的极限是 L,记作: \(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L\)
如果对于任意的数 \(\epsilon > 0\),有一个相应的 \(\delta > 0\) 使得 \(|f(x,y)-L|<\epsilon\),这里 \((x,y)\in D\) & \(0<\sqrt {(x-a)+(y-b)^2} < \delta\)
二元函数极限也可以表示为 \(\lim\limits_{\begin{smallmatrix}x\to a\\ y\to b\end{smallmatrix}} f(x,y)=L\) 或 \(f(x,y)\to L\) 当 \((x,y)\to (a,b)\)
几何解释:由二元函数的几何定义有 f 在 \(D\subset \mathbb R^2\) 上的每个点都能唯一映射到一维数轴上(设为 z)
如果给定 z 上的任意小区间 \((L-\epsilon, L+\epsilon)\),我们可以在 D 上找到一个以点 (a,b) 为中心,\(\delta > 0\) 为半径的圆盘 \(D_{\delta}\),使得 f 可以把所有圆盘 \(D_{\delta}\) 上的点映射带区间 \((L-\epsilon, L+\epsilon)\)
其他定义:详见 p215
定理
如果从路径 \(C_1:(x,y)\to(a,b)\) 使 \(f(x,y)\to L_1\),而沿路径 \(C_2:(x,y)\to(a,b)\) 使 \(f(x,y)\to L_2\)
而且 \(L_1\ne L_2\),那么 \(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L\) 不存在
Note
- 该定理是一元函数情况下的推广:一元函数左右两侧极限不相等 \(\iff\) 该处极限不存在
例子
- 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{x^2-y^2}{x^2+y^2}\):若 \(C_1:x=y,C_2:x=2y\),蕴含 \(C_1:(x,y)\to(0,0),f(x,y)\to0\),\(C_2:(x,y)\to(0,0),f(x,y)=\frac{4y^2-y^2}{4y^2+y^2}\to3/5\),所以极限不存在
- 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{xy}{x^2+y^2}\):若 \(C_1:x=0,C_2:x=y\),蕴含 \(C_1:(x,y)\to(0,0),f(x,y)\to0\),\(C_2:(x,y)\to(0,0),f(x,y)=\frac{x^2}{x^2+x^2}\to1/2\),所以极限不存在
- 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{xy^2}{x^2+y^4}\):若 \(C_1:x=0,C_2:x=y^2\),蕴含 \(C_1:(x,y)\to(0,0),f(x,y)\to0\) 和 \(C_2:(x,y)\to(0,0),f(x,y)=\frac{y^4}{y^4+y^4}\to1/2\),所以极限不存在
- 讨论 \(\lim\limits_{(x,y)\to(0,0)}\frac{3x^2y}{x^2+y^2}\):
- 预处理:存在 \(C:x=0\) 使得 \((x,y)\to(0,0),f(x,y)\to0\),假设 \(L=0\),有 \(|f(x,y)-L|=\left|\frac{3x^2y}{x^2+y^2}-0\right|=3\frac{x^2}{x^2+y^2}|y|\le3|y|\le3\sqrt{x^2+y^2}\)
- 假设 \(\delta=\epsilon/3\) 使得 \(\|\mathbf x-\mathbf a\|<\delta\),即 \(\sqrt{x^2+y^2}<\epsilon/3\)
- 而 \(|f(x,y)-L|=\left|\frac{3x^2y}{x^2+y^2}-0\right|=3\frac{x^2}{x^2+y^2}|y|\le3|y|\le3\sqrt{x^2+y^2}<\epsilon\),于是极限 \(\lim\limits_{(x,y)\to(0,0)}\frac{3x^2y}{x^2+y^2}\) 存在
- \(\lim\limits_{(x,y)\to(0,0)}\frac {\sin (x^2+y^2)}{x^2+y^2}\)
二元函数极限策略
- 结论:\(\lim\limits_{(x,y)\to (a,b)} x = a, \lim\limits_{(x,y)\to (a,b)} y = b, \lim\limits_{(x,y)\to (a,b)} c = c\)
- 沿着 \(x=a\) 或 \(y=b\) 接近 (a,b):
- \(\lim\limits_{y\to b} f(a, y) = L_1\)
- \(\lim\limits_{x\to a} f(x, b) = L_2\)
- 若 \(L_1\ne L_2\),则极限不存在,否则转到步骤 (3)
- 沿着斜线 \(y=mx\) 或 \(x=my\) 接近 (a,b):\(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L_3\)
- 若 \(L_3 \ne L_1\) 或 \(L_3 \ne L_2\),则极限不存在,否则转到步骤 (4)
- 沿着曲线 \(y=g(x)\) 接近 (a,b):\(\lim\limits_{(x,y)\to (a,b)} f(x, y) = L_4\)
- 若存在 i 使得 \(L_4 \ne L_i\) (\(i=1,2,3\)),则极限不存在,否则转到步骤 (5)
- 找到某个数 \(\epsilon>0\) 使得 \(|f(x,y) - L| < \epsilon\),\(\epsilon = g(\delta)\),并且 \(0 < \sqrt {(x-a)^2 + (y-b)^2}< \delta\)
- 我们记 \(F(x,y) = |f(x,y)-L|\)(简记 \(F\)),\(h(x,y) = \sqrt {(x-a)^2 + (y-b)^2}\)(简记 \(h\))
- 有 \(F(x,y) < \epsilon\),\(h(x,y) < \delta\)
- 我们先找到 \(F < \epsilon = F' \circ h\) (注:\(F \le \epsilon = F' \circ h\) 的情况当然也成立)
- 若找到了 \(\epsilon\),则对于 \(\epsilon = g(\delta) > 0\),有一个相应的 \(\delta = g^{-1}(\epsilon) > 0\) 使得 \(F(x,y) = |f(x,y)-L| < \epsilon\),这里 \((x,y)\in D\),\(0 < h(x,y) = \sqrt {(x-a)^2 + (y-b)^2} < \epsilon\)
- 如果上述命题能被满足,那么极限存在且为 L
二元函数连续性
一个二元函数在 (a,b) 连续,如果 \(\lim\limits_{(x,y)\to(a,b)} f(x,y) = f(a,b)\)
如果 f 在 D 里的每一个点 (a,b) 连续,则 f 在 D 连续
连续性的感性理解
- 连续指自变量变化一点,而函数也仅仅变化一点点
- 在曲面上,连续的含义是没有 断面 和 洞
例子
- \(\lim\limits_{(x,y)\to(1,2)}(x^2y^3-x^3y^2+3x+2y)=1^2\cdot2^3-1^3\cdot2^2+3\cdot1+2\cdot2=11\)
- \(f(x,y)=\frac{x^2-y^2}{x^2+y^2}\) 在定义域 \(\{(x,y)|~x^2+y^2\ne0\}\) 处连续
- \(g(x,y)=\begin{cases}\frac{x^2-y^2}{x^2+y^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\) 在 \((0,0)\) 处不连续,因为 \((0,0)\) 处极限不存在(注:g 不是二元初等函数,只能称 g 分段初等)
- \(f(x,y)=\begin{cases}\frac{3x^2y}{x^2+y^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\) 处处连续,其中 \((0,0)\) 处极限存在且等于 \(f(0,0)\)
- \(f(x,y)=\tan^{-1}(y/x)\) 在除 \(x\ne0\) 以外的地方连续
结论
- 根据极限的性质,可知连续函数的 和,导数,乘积,商 在他们的定义域内连续
- 由连续性 和 \(\lim\limits_{(x,y)\to (a,b)} x = a, \lim\limits_{(x,y)\to (a,b)} y = b, \lim\limits_{(x,y)\to (a,b)} c = c\) 可知:二元多项式函数 \(f(x,y) = cx^ny^m\) 连续,进而 \(\lim\limits_{(x,y)\to (a,b)} cx^ny^m = ca^nb^m\)
- 由 (1),(2) 二元有理函数 在定义域内也连续
- 若 f(x,y) 是一个二元连续函数,g(x) 是定义在 f 的值域上的函数(或 g 在 f 的值域的超集上也连续),那么复合函数 \(h = g\circ f(x, y)\) 也是一个连续函数
三元函数 极限
\(\lim\limits_{(x,y,z)\to(a,b,c)} f(x,y,z) = L\)
在 f 的定义域内,当 (x,y,z) 以任意方式趋近 (a,b,c) 时,f(x,y,z) 趋近于 L
精确定义:对任意 \(\epsilon > 0\),则存在 \(\delta > 0\),使得 \(|f(x,y,z) - L| < \epsilon\),这里 \(0 < \sqrt {(x-a)^2 + (y-b)^2 + (z-c)^2} < \delta\),(x,y,z) 在定义域内
三元函数 连续性
f 在 (a,b,c) 连续,如果 \(\lim\limits_{(x,y,z)\to(a,b,c)} f(x,y,z) = f(a,b,c)\)
多元函数 极限(向量描述)
设 \(\mathbf x = \langle x_1, x_2, \dots, x_n \rangle\),\(\mathbf a = \langle a_1, a_2, \dots, a_n\rangle\)
如果 f 是定义在 \(D \subset \mathbb R^n\) 上的函数,则\(\lim\limits_{\mathbf x\to \mathbf a} f(\mathbf x) = L\),
这意味着对于每个数 \(\epsilon > 0\),则有一个相应的 \(\mathbf \delta > 0\),使得 \(|f(\mathbf x) - L| < \epsilon\),这里 \(0 < |\mathbf x - \mathbf a| < \delta\),\(\mathbf x \in D\)
多元函数 连续(向量描述)
f 在 \(\mathbf a\) 处连续,如果 \(\lim\limits_{\mathbf x \to \mathbf a} f(\mathbf x) = f(\mathbf a)\)
总结
- 多元函数的极限:假设 \(\mathbf a\in\mathbb R^n,L\in\mathbb R\),若 \(\forall\epsilon>0,\exists\delta>0\) 使得 \(\forall\mathbf x\in\mathring U(\mathbf a,\delta),f(\mathbf x)\in U(L,\epsilon)\),那么称 f 在 \(\bf a\) 处取存在极限 L,记为 \(\lim\limits_{\bf x\to a}f(\mathbf x)=L\)(其中,\(\mathring U(\mathbf a,\delta)=\{\mathbf x\in\mathbb R^n|~\|\mathbf x-\mathbf a\|<\delta,\mathbf x\ne\mathbf a\}\))
- 或者记为 \(\mathbf x\to\mathbf a,f(\mathbf x)\to L\);沿着路径 C 的极限记为 \(C:\mathbf x\to\mathbf a,f(\mathbf x)\to L\)
- 定理:若存在两条不同路径 \(\exists C_1\ne C_2\) 使得 \(C_1:\mathbf x\to\mathbf a,f(\mathbf x)\to L_1\),\(C_2:\mathbf x\to\mathbf a,f(\mathbf x)\to L_2\),并且 \(L_1\ne L_2\),那么 \(\lim\limits_{\bf x\to a}f(\mathbf x)\) 不存在
- 多元函数的连续性(点连续,区间连续):假设 f 是 n 元的,若 \(\lim\limits_{\bf x\to a}f(\mathbf x)=f(\mathbf a)\),那么称 f 在 \(\bf a\) 处连续;若 \(\forall\mathbf x\in D_f,\lim\limits_{\bf u\to x}f(\mathbf u)=f(\mathbf x)\),那么称 f 是连续函数或在 \(D_f\) 上连续
一级结论
- 多元函数极限(实用性定义):假设 \(\mathbf a\in\mathbb R^n,L\in\mathbb R\),若 \(\forall\epsilon>0,\exists\delta>0\) 使得 \(\forall\|\mathbf x-\mathbf a\|<\delta\) 使得 \(|f(x)-L|<\epsilon\)
- 多元初等函数在定义域内连续
练习
- 判断题
- 连续函数在定义域处的极限等于函数值(Y)
- 连续函数在边界处但未定义的点的极限经常被研究(Y)
- 分段连续的函数在边界点处的极限也经常被研究(Y)
- 讨论极限值:(1) \(\lim\limits_{(x,y)\to(0,0)}\frac{x^2}{x^2+y^2}\),(2) \(\lim\limits_{(x,y)\to(0,0)}\frac{xy}{\sqrt{x^2+y^2}}\),(3) \(\lim\limits_{(x,y)\to(0,0)}\frac{2x^2y}{x^4+y^2}\),(4) \(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{x^2+2y^2+3z^2}{x^2+y^2+z^2}\),(5) \(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{xy+yz^2+xz^2}{x^2+y^2+z^4}\)
- 使用极坐标计算极限:(1) \(\lim\limits_{(x,y)\to(0,0)}\frac{x^3+y^3}{x^2+y^2}\),(2) \(\lim\limits_{(x,y)\to(0,0)}(x^2+y^2)\ln(x^2+y^2)\)
- 使用球坐标计算极限:\(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{xyz}{x^2+y^2+z^2}\)
提示
(2)
- 函数沿着 \(C_1:x=0,C_2:y=x\) 接近 \((0,0)\) 的极限分别为 \(0,1/2\),所以极限不存在
- 因为沿着 \(C:x=0\) 接近 \((0,0)\) 的极限为 0,所以假设极限值为 \(L=0\),又 \(|f(x,y)-0|=\frac{|xy|}{\sqrt{x^2+y^2}}\le\frac{\sqrt{x^2+y^2}\cdot\sqrt{x^2+y^2}}{\sqrt{x^2+y^2}}=\sqrt{x^2+y^2}\),假设 \(\delta=\epsilon\),有 \(\|(x,y)-(0,0)\|<\delta\),即 \(\sqrt{x^2+y^2}<\epsilon\),于是 \(|f(x,y)-0|<\epsilon\),所以极限为 0
- 函数沿着 \(C_1:x=0,C_2:y=x^2\) 接近 \((0,0)\) 的极限分别为 \(0,1\),所以极限不存在
- 函数沿着 \(C_1:y=0,z=0\) 或 \(C_2:x=0,z=0\) 接近 \((0,0,0)\) 的极限分别为 \(1,2\),所以极限不存在(注:\(\mathbb R^n\) 下的一条曲线可以由 \(n-1\) 个方程定义)
- 函数沿着 \(C_1:x=0,y=0\) 或 \(C_2:x=z^2,y=z^2\) 的极限分别为 \(0,1\),所以极限不存在
(3)
- \(\lim\limits_{(x,y)\to(0,0)}\frac{x^3+y^3}{x^2+y^2}=\lim\limits_{r\to0^+}\frac{r^3\cos^3\theta+r^3\sin^3\theta}{r^2\cos^2\theta+r^2\sin^2\theta}=\lim\limits_{r\to0^+}r(\cos^3\theta+\sin^3\theta)=0\)
- \(\lim\limits_{(x,y)\to(0,0)}(x^2+y^2)\ln(x^2+y^2)=\lim\limits_{r\to0^+}r^2\ln r^2=2\lim\limits_{r\to0^+}\frac{\ln r}{1/r^2}=2\lim\limits_{r\to0^+}\frac{1/r}{-2/r^3}=0\)
(4) \(\lim\limits_{(x,y,z)\to(0,0,0)}\frac{xyz}{x^2+y^2+z^2}=\lim\limits_{\rho\to0^+}\frac{\rho\sin\phi\cos\theta\cdot\rho\sin\phi\sin\theta\cdot\rho\cos\phi}{\rho^2}=\lim\limits_{\rho\to0^+}\rho\sin^2\phi\cos\phi\cos\theta\sin\theta=0\)
3.多元函数的偏导数
二元函数 偏导数
如果 f 是一个二元函数,它的偏导数是 \(f_x\) 和 \(f_y\),定义为:
\(f_x(x, y) = \lim\limits_{h\to 0}\frac {f(x+h, y)-f(x,y)}h\)
\(f_y(x, y) = \lim\limits_{h\to 0}\frac {f(x, y+h)-f(x,y)}h\)
- 若 z=f(x,y),我们记:
- \(f_x(x,y)=f_x=\frac {\partial f}{\partial x}=\frac {\partial}{\partial x}f(x,y) = \frac {\partial z}{\partial x} = f_1 = D_1f = D_xf\)
- \(f_y(x,y)=f_y=\frac {\partial f}{\partial y}=\frac {\partial}{\partial y}f(x,y) = \frac {\partial z}{\partial y} = f_2 = D_2f = D_2f\)
偏导数求导法则
- 若 \(z=f(x,y)\)
- 为求 \(f_x\),把 y 看作常数,对 x 求导
- 为求 \(f_y\),把 x 看作常数,对 y 求导
例子
- \(f(x,y)=x^3+x^2y^3-2y^2\) 的偏导数分别为 \(f_x(x,y)=3x^2+2xy^3\),\(f_y(x,y)=3x^2y^2-4y\)
二元偏导数的几何意义
若 z=f(x,y)
\(f_x(a,b)\) 表示曲线 \(z=f(x,y), y=b\)(即 \(F(x,b,z)=0\)) 的斜率
\(f_y(a,b)\) 表示曲线 \(z=f(x,y), x=a\)(即 \(F(a,y,z)=0\)) 的斜率
例子
- \(f(x,y)=4-x^2-2y^2\) 的偏导数分别为 \(f_x(x,y)=-2x,f_y(x,y)=-4y\),那么 \(f_x(1,1)\) 表示 \(z=f(x,y)\) 沿着曲线 \(z=4-x^2-2,y=1\) 的切线斜率,那么 \(f_y(1,1)\) 表示 \(z=f(x,y)\) 沿着曲线 \(z=4-1-2y^2,x=1\) 的切线斜率
三元偏导数
\(f_x(x,y,z) = \lim\limits_{h\to 0}\frac {f(x+h,y,z)-f(x,y,z)}h\)
\(f_y(x,y,z) = \lim\limits_{h\to 0}\frac {f(x,y+h,z)-f(x,y,z)}h\)
\(f_z(x,y,z) = \lim\limits_{h\to 0}\frac {f(x,y,z+h)-f(x,y,z)}h\)
注:\(\omega = f(x,y,z)\) 在四维空间中,我们无法解释其几何意义
多元偏导数
令 u 是 n 元函数,\(u = f(x_1,x_2,\dots, x_n)\)
第 i 个变量的偏导数为:\(\frac {\partial u}{\partial x_i} = \lim\limits_{h\to 0} \frac {f(x_1,\dots,x_{i-1},x_i+h,x_{i+1},\dots, x_n) - f(x_1,\dots,x_i,\dots, x_n)}h\)
高阶导数
若 f 有两个变量,那么偏导数 \(f_x\),\(f_y\) 仍然是二元函数,
我们讨论导数 \((f_x)_x, (f_x)_y, (f_y)_x, (f_y)_y\),有如下定义:
- \((f_x)_x = f_{xx} = f_{11} = \frac {\partial }{\partial x}(\frac {\partial f}{\partial x}) = \frac {\partial ^2f}{\partial x^2} = \frac {\partial ^2z}{\partial x^2}\)
- \((f_x)_y = f_{xy} = f_{12} = \frac {\partial }{\partial y}(\frac {\partial f}{\partial x}) = \frac {\partial ^2f}{\partial y\partial x} = \frac {\partial ^2z}{\partial y\partial x}\)
- \((f_y)_x = f_{yx} = f_{21} = \frac {\partial }{\partial x}(\frac {\partial f}{\partial y}) = \frac {\partial ^2f}{\partial x\partial y} = \frac {\partial ^2z}{\partial x\partial y}\)
- \((f_y)_y = f_{yy} = f_{22} = \frac {\partial }{\partial y}(\frac {\partial f}{\partial y}) = \frac {\partial ^2f}{\partial y^2} = \frac {\partial ^2z}{\partial y^2}\)
克莱罗定理
在 f 的定义域 D 内含有点 (a,b),如果 \(f_{xy}, f_{yx}\) 都在 D 内连续,那么 \(f_{xy}(a,b) = f_{yx}(a,b)\)
偏微分方程举例
- \(\frac {\partial ^2u}{\partial x^2} + \frac {\partial ^2u}{\partial y^2} = 0\),解为 \(e^x\sin y\)
- \(\frac {\partial ^2u}{\partial t^2} = a^2 \frac {\partial ^2u}{\partial x^2}\),解为 \(\sin (x-at)\)
- 考伯-当拉斯产出函数定义为 \(P = P(L, K)\)(P 为收益,L 为劳动力,K 为资本)
- P 关于 L 的变化率 与 P/L 成比例:\(\frac {\partial P}{\partial L} = \alpha \frac PL\) (1)
- P 关于 K 的变化率 与 P/K 成比例:\(\frac {\partial P}{\partial K} = \beta \frac PK\) (2)
- 对 (1) 和 (2) 分别用“分离变量法”(参见 9.3) 得到:
- \(P(L, K_0) = C_1K_0L^{\alpha}\) ,(\(C_1 = \frac {C_1'}{K_0}\))
- \(P(L_0, K) = C_2L_0K^{\beta}\) ,(\(C_2 = \frac {C_2'}{L_0}\))
- 得到:\(P(L, K) = bL^{\alpha}K^{\beta}\),假定 \(\alpha,\beta > 0\)
- \(P(mL, mK) = m^{\alpha+\beta}bL^{\alpha}K^{\beta} = m^{\alpha+\beta}P(L,K)\)
- 当 \(\alpha+\beta=1\) 时,称 \(P(L,K) = bL^{\alpha}K^{1-\alpha}\) 为考伯-当拉斯产出函数
总结
- 二元函数偏导数:若函数 f 是二元的,它的两个偏导数分别定义为:\(f_x(x,y)=\lim\limits_{h\to0}\frac{f(x+h,y)-f(x,y)}h\),\(f_y(x,y)=\lim\limits_{h\to0}\frac{f(x,y+h)-f(x,y)}h\);对于函数方程 \(z=f(x,y)\),记:
- \(f_x=\frac{\partial f}{\partial x}=\frac\partial{\partial x}f=\frac{\partial z}{\partial x}=f_1=D_1f=D_xf\)
- \(f_y=\frac{\partial f}{\partial y}=\frac\partial{\partial y}f=\frac{\partial z}{\partial y}=f_2=D_2f=D_yf\)
- 二元函数偏导数的几何意义:
- \(f_x(x,y)\) 表示 \(z=f(x,y)\) 沿着向量曲线方程 \(\mathbf r(t)=(t,y,f(t,y))\) 在点 \((x,y,f(x,y))\) 上的切线斜率,该切线为 \(\mathbf r(t)=(x,y,f(x,y))+t(1,0,f_x(x,y))\)
- \(f_y(x,y)\) 表示 \(z=f(x,y)\) 沿着向量曲线方程 \(\mathbf r(t)=(x,t,f(x,t))\) 在点 \((x,y,f(x,y))\) 上的切线斜率,该切线为 \(\mathbf r(t)=(x,y,f(x,y))+t(0,1,f_y(x,y))\)
- 高阶偏导数:
- 若 f 是二元的,那么记 \((f_x)_x=f_{xx}=f_{11}=\frac{\partial}{\partial x}\left(\frac{\partial f}{\partial x}\right)=\frac{\partial^2f}{\partial x^2}=\frac {\partial^2z}{\partial x^2}\),以及 \((f_x)_y=f_{xy}=f_{12}=\frac{\partial}{\partial y}\left(\frac{\partial f}{\partial x}\right)=\frac{\partial^2f}{\partial y\partial x}=\frac {\partial^2z}{\partial y\partial x}\)
- 克莱罗定理(高阶偏导数交换律):假设 f 是二元的,若 \(f_{xy},f_{yx}\) 均在 \((a,b)\) 的邻域内连续,那么 \(f_{xy}(a,b)=f_{yx}(a,b)\)
- n 元函数的偏导数:若 \(u=f(x_1,\cdots,x_n)\),那么第 i 个变量的偏导数为 \(\frac{\partial u}{\partial x_i}=\lim\limits_{t\to0}\frac{f(x_1,\cdots,x_i+t,\cdots,x_n)-f(x_1,\cdots,x_n)}t\)
- n 元函数的高阶偏导数:\(\frac{\partial^ku}{\partial x_i^k}=f_i^{(k)}(\mathbf x)\)
练习
- 判断题
- 二元函数 f 的 n 阶偏导数有 \(2^n\) 种
- 若二元函数 f 的 n 阶偏导数均连续,那么这些偏导数有 \(n+1\) 种(Y)
- 计算 \(f(x,y)=\begin{cases}\frac{x^3y-xy^3}{x^2+y^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\) 的偏导数 \(f_x,f_y,f_{xy},f_{yx}\)
- 计算 \(f(x,y)=\frac{xe^{\sin(x^2y)}}{(x^2+y^2)^{3/2}}\) 的偏导数 \(f_x(1,0)\)
- 计算椭圆 \(4x^2+2y^2+z^2=16,y=2\) 在 \((1,2,2)\) 上的切线的向量方程
- 对于内角分别为 \(A,B,C\),相应对边为 \(a,b,c\) 的三角形,余弦定理为 \(a^2=b^2+c^2-2bc\cos A\),证明:(1) \(\frac{\partial A}{\partial a}=\frac a{bc\sin A}\),(2) \(\frac{\partial A}{\partial b}=\frac{c\cos A-b}{bc\sin A}\),(3) \(\frac{\partial A}{\partial c}=\frac{b\cos A-c}{bc\sin A}\)
- 假设 f 是二元的,证明:\(f_x(x,y)=x+4y,f_y(x,y)=3x-y\) 是矛盾的
- 对于并联电阻 \(R_1,\cdots,R_2\),总电阻满足 \(\frac1R=\sum\limits_{i=1}^n\frac1{R_i}\),证明:\(\forall i=1..n,\frac{\partial R}{\partial R_i}=\frac{R^2}{R_i^2}\)
- 证明:\(u=1/\sqrt{x^2+y^2+z^2}\) 是三维拉普拉斯方程 \(u_{xx}+u_{yy}+u_{zz}=0\) 的一个解
- 证明:(1) \(u=\sin(kx)\sin(akt)\),(2) \(u=t/(a^2t^2-x^2)\),(3) \(u=(x-at)^6+(x+at)^6\),(4) \(u=\sin(x-at)+\ln(x+at)\) 均是波动方程 \(u_{tt}=a^2u_{xx}\) 的一个解
- 若 \(f,g\) 二阶可微,那么 \(u(x,t)=f(x+at)+g(x-at)\) 是波动方程的解
- 证明:假设 \(\mathbf a,\mathbf x\in\mathbb R^n\),\(\mathbf a\cdot\mathbf a=1\),那么 \(u(\mathbf x)=e^{\bf a\cdot x}\) 是 \(\sum\limits_{i=1}^n\frac{\partial^2u}{\partial x_i^2}=u\) 的一个解
提示
(2) 若 \((x,y)\ne0\),有 \(f_x(x,y)=\frac{y(x^4+4x^2y^2-y^4)}{(x^2+y^2)^2}\),而 \(f_x(0,0)=\lim\limits_{t\to0}\frac{f(0+t,0)-f(0,0)}t=0\),于是 \(f_x(x,y)=\begin{cases}\frac{y(x^4+4x^2y^2-y^4)}{(x^2+y^2)^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\)
若 \((x,y)\ne0\),有 \(f_y(x,y)=\frac{x^5-4x^3y^2-xy^4}{(x^2+y^2)^2}\),而 \(f_y(0,0)=\lim\limits_{t\to0}\frac{f(0,0+t)-f(0,0)}t=0\),于是 \(f_y(x,y)=\begin{cases}\frac{x^5-4x^3y^2-xy^4}{(x^2+y^2)^2}&(x,y)\ne(0,0)\\0&(x,y)=(0,0)\end{cases}\)
若 \((x,y)\ne0\),有 \(f_{xy}=f_{yx}=\frac{x^6+9x^4y^2-9x^2y^4-y^6}{(x^2+y^2)^3}\)(由于克莱罗法则)
而 \(f_{xy}(0,0)=\lim\limits_{t\to0}\frac{f_x(0,0+t)-f_x(0,0)}t=\lim\limits_{t\to0}\frac{t(-t^4)/t^4}t=-1\),\(f_{yx}(0,0)=\lim\limits_{t\to0}\frac{f_y(0+t,0)-f_y(0,0)}t=\lim\limits_{t\to0}\frac{t^5/t^4 }t=1\)
于是 \(f_{xy}(x,y)=\begin{cases}\frac{x^6+9x^4y^2-9x^2y^4-y^6}{(x^2+y^2)^3}&(x,y)\ne(0,0)\\-1&(x,y)=(0,0)\end{cases}\),\(f_{yx}(x,y)=\begin{cases}\frac{x^6+9x^4y^2-9x^2y^4-y^6}{(x^2+y^2)^3}&(x,y)\ne(0,0)\\1&(x,y)=(0,0)\end{cases}\)
(3) \(f_x(1,0)=\lim\limits_{t\to0}\frac{f(1+t,0)-f(1,0)}t=\lim\limits_{t\to0}\frac{(1+t)^{-2}-1}t=\lim\limits_{t\to0}\frac{1-(1+t)^2}{t(1+t)^2}\) \(=\lim\limits_{t\to0}\frac{-2t-t^2}{t(1+t)^2}=\lim\limits_{t\to0}\frac{-2-t}{(1+t)^2}=-2\)
法2:\(f(x,0)=x(x^2)^{-3/2}=x^{-2}\),那么 \(f_x(x,0)=-2x^{-3}\),于是 \(f_x(1,0)=-3\)
(4) \(4x^2+2y^2+z^2=16\) 蕴含 \(8x+2z\frac{\partial z}{\partial x}=0\),蕴含 \(\frac{\partial z}{\partial x}=-4x/z\)
于是,在 \((1,2,2)\) 处,\(\frac{\partial z}{\partial x}=-2\),该处的切线向量方程为 \(\mathbf r(t)=(1,2,2)+t(1,0,-2)\)(因为该切线在平面 \(y=2\) )
(6) \(f_x(x,y)=x+4y\) 蕴含 \(f_{xy}(x,y)=4\)
\(f_y(x,y)=3x-y\) 蕴含 \(f_{yx}(x,y)=3\)
由[克莱罗定理]和 \(f_{xy},f_{yx}\) 均是连续的,有 \(f_{xy}=f_{yx}\),矛盾
(7) \(\forall i=1..n\),\(-\frac1{R^2}\frac{\partial R}{\partial R_i}=-\frac1{R_i^2}\),蕴含 \(\frac{\partial R}{\partial R_i}=\frac{R^2}{R_i^2}\)
(8) \(u=1/\sqrt{x^2+y^2+z^2}\) 蕴含 \(u_x=-\frac{2x}{2(x^2+y^2+z^2)^{3/2}}=-\frac{x}{(x^2+y^2+z^2)^{3/2}}\),蕴含 \(u_{xx}=\frac{-(x^2+y^2+z^2)^{3/2}-(-x)(3/2)\sqrt{x^2+y^2+z^2}(2x)}{(x^2+y^2+z^2)^3}=\frac{-(x^2+y^2+z^2)+3x^2}{(x^2+y^2+z^2)^{5/2}}\)
根据对称性 \(u_{yy}=\frac{-(x^2+y^2+z^2)+3y^2}{(x^2+y^2+z^2)^{5/2}}\),\(u_{zz}=\frac{-(x^2+y^2+z^2)+3z^2}{(x^2+y^2+z^2)^{5/2}}\)
于是 \(u_{xx}+u_{yy}+u_{zz}=0\)
(11) \(\forall i=1..n\) 有 \(\frac{\partial^2u}{\partial x_i^2}=\frac{\partial^2}{\partial x_i^2}(e^{\mathbf a\cdot\mathbf x})=\frac{\partial}{\partial x_i}((\mathbf a\cdot\mathbf x')e^{\mathbf a\cdot\mathbf x})=\frac{\partial}{\partial x_i}(a_ie^{\mathbf a\cdot\mathbf x})=a_i^2e^{\bf a\cdot x}\),于是 \(\sum\limits_{i=1}^n\frac{\partial^2u}{\partial x_i^2}=\sum\limits_{i=1}^na_i^2e^{\bf a\cdot x}=e^{\bf a\cdot x}\sum\limits_{i=1}^na_i^2=e^{\bf a\cdot x}=u\)
4.切平面 & 线性近似
一元微积分中,我们将函数曲线的一段小区间用它的切线近似
而二元微积分中,我们将函数曲面的一段小区域用它的切面来近似
多元可微函数同样也可以使用类似的近似方法
令 z=f(x,y) 的曲面 C 分别与 \(y=y_0\),\(x=x_0\) 相交于曲线 \(C_1,C_2\);点 \(P(x_0,y_0,z_0)\) 位于切平面 G 与曲面 C 的交点
由平面方程(12.5)有: \(G:~~A(x-x_0)+B(y-y_0)+C(z-z_0)=0\) \(\implies z-z_0=a(x-x_0)+b(y-y_0)\)
(\(a=-\frac AC,b=-\frac BC, C\ne0\))
记 \(T_1,T_2\) 分别为 \(C_1,C_2\) 在点 P 处的切线
通过 G 的方程,\(T_1,T_2\) 可以分别表示为 \(z-z_0=a(x-x_0), y=y_0\) 和 \(z-z_0=b(y-y_0), x=x_0\)
又由 14.2 可知 \(T_1,T_2\) 的斜率分别为 \(f_x(x_0,y_0), f_y(x_0,y_0)\),即 \(a=f_x(x_0,y_0), b=f_y(x_0,y_0)\)
最后得到 C 在 \(P(x_0,y_0,z_0)\) 处的切平面 G 为 \(z-z_0=f_x(x_0,y_0)(x-x_0)+f_y(x_0,y_0)(y-y_0)\)
曲面的切平面
假设二元函数 f 有连续偏导数,那么 \(z=f(x,y)\) 在 \((a,b)\) 处的切平面的向量参数方程为 \(\mathbf r(u,v)=(a,b,f(a,b))+u(1,0,f_x(a,b))+v(0,1,f_y(a,b))\)
或者,该切平面的向量方程为 \(z-f(a,b)=f_x(a,b)(x-a)+f_y(a,b)(y-b)\)
\(z=f(x,y)\) 在 \((a,b)\) 处沿着曲线 \(z=f(x,y),y=b\) 的切线向量为 \((1,0,f_x(a,b))\)
沿着曲线 \(z=f(x,y),x=a\) 的切线向量为 \((0,1,f_y(a,b))\),于是:
(1) \(z=f(x,y)\) 在 \((a,b)\) 处的切平面的向量参数方程为 \(\mathbf r(u,v)=(a,b,f(a,b))+u(1,0,f_x(a,b))+v(0,1,f_y(a,b))\)
(2) \(z=f(x,y)\) 在 \((a,b)\) 处的切平面的向量方程为 \(((1,0,f_x(a,b))\times(0,1,f_y(a,b)))\cdot((x,y,z)-(a,b,f(a,b)))=0\)
其中 \((1,0,f_x(a,b))\times(0,1,f_y(a,b))=(-f_x(a,b),-f_y(a,b),1)\),\((x,y,z)-(a,b,f(a,b))=(x-a,y-b,z-f(a,b))\)
于是 \(z-f(a,b)=f_x(a,b)(x-a)+f_y(a,b)(y-b)\)
\(\blacksquare\)
例子
- 计算 \(z=2x^2+y^2\) 在点 \((1,1,3)\) 上的切平面:设 \(f(x,y)=2x^2+y^2\),蕴含 \(f_x(x,y)=4x,f_y(x,y)=2y\),那么 \((1,1,3)\) 处的切平面为 \(z-3=f_x(1,1)(x-1)+f_y(1,1)(y-1)\),即 \(z-3=4(x-1)+2(y-1)\),即 \(z=4x+2y-3\)
线性近似
我们称 f 在 (a,b) 的线性化为:\(L(x, y) = f(a,b) + f_x(a,b)(x-a) + f_y(a,b)(y-b)\)
称 f 在点 (a,b) 的 线性近似 或 切平面近似 为:\(f(x,y) \approx f(a,b) + f_x(a,b)(x-a) + f_y(a,b)(y-b)\)
例子
- \(f(x,y)=xe^{xy}\) 有偏导数 \(f_x(x,y)=e^{xy}(1+xy),f_y(x,y)=x^2e^{xy}\),于是 f 在 \((1,0)\) 的线性近似为 \(g(x,y)=f(1,0)+f_x(1,0)(x-1)+f_y(1,0)(y-0)=x+y\);而 \(g(1,1,-0.1)=1\approx0.98542\approx f(1.1,-0.1)\)
由第 3 章,若 f(x) 在 a 处可微,那么 \(\Delta y = f'(a)\Delta x + \epsilon\Delta\),其中 \(\Delta\to 0\) 时 \(\epsilon\to 0\)(\(\Delta y = f(a + \Delta x) - f(a)\))
定义
若 z=f(x,y),那么 f 在点 (a,b) 是可微的,如果 \(\Delta z\) 可以表达为:
\(\Delta z = f_x(a,b)\Delta x + f_y(a,b)\Delta y + \epsilon_1\Delta x + \epsilon_2\Delta y\),
其中当 \(\epsilon_1 \to 0,\epsilon_2 \to 0\) 时,\((\Delta x, \Delta y) \to (0,0)\)
定理
如果偏导数 \(f_x\) 和 \(f_y\) 在 (a,b) 附近存在,并且 (a,b) 连续,则 f 在 (a,b) 点可微
全微分
可微函数 z=f(x,y) 的全微分定义为:\(d_z = f_x(x,y)d_x + f_y(x,y)d_y = \frac {\partial z}{\partial x}d_x + \frac {\partial z}{\partial y}d_y\)
例子
- 若 \(z=f(x,y)=x^2+3xy-y^2\),那么它的全微分为 \(dz=\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy=(2x+3y)dx+(-2y+3x)dy\)
- 若 \((2,3)\to(2.05,2.96)\),那么 \(\Delta z=f(2.05,2.96)-f(2,3)=0.6449\),而 \(dx=0.05,dy=-0.04,dz=(2\cdot2+3\cdot3)(0.05)+(-2\cdot3+3\cdot2)(-0.04)=0.65\)
Tip
- 在 (a,b) 附近,可以令 \(d_x=\Delta x = x-a, d_y=\Delta y = y-b\)
- 那么全微分 \(d_z = f_x(a,b)(x-a) + f_y(a,b)(y-b)\)
- \(f(x,y) \approx f(a,b) + d_z\) \(\implies\) \(\Delta z \approx d_z\)
三元函数的情况
线性近似:\(f(x,y,z) \approx f(a,b,c) + f_x(a,b,c)(x-a) + f_y(a,b,c)(y-b) + f_z(a,b,c)(z-c)\)
其线性化表达式 L(x,y,z) 等于上式的右边
若 \(\omega = f(x,y,z)\),那么 \(\omega\) 的增量是: \(\Delta \omega = f(x+\Delta x, y+\Delta y, z+\Delta z) - f(x,y,z)\)
微分 \(d_{\omega} = \frac {\partial \omega}{\partial x}d_x + \frac {\partial \omega}{\partial y}d_y + \frac {\partial \omega}{\partial z}d_z\)
总结
- 切平面:假设二元函数 f 有连续偏导数,那么 \(z=f(x,y)\) 在 \((a,b)\) 处的切平面的向量参数方程为 \(\mathbf r(u,v)=(a,b,f(a,b))+u(1,0,f_x(a,b))+v(0,1,f_y(a,b))\),对应的向量方程为 \(z-f(a,b)=f_x(a,b)(x-a)+f_y(a,b)(y-b)\)
- 线性近似:二元函数 f 在 \((a,b)\) 点的线性近似为 \(g(x,y)=f(a,b)+f_x(a,b)(x-a)+f_y(a,b)(y-b)\)(\((a,b)\) 附近有 \(g(x,y)\approx f(x,y)\))
- 可微:假设 \(z=f(x,y)\),若 \(\epsilon_1 \to 0,\epsilon_2 \to 0,\Delta x\to0,\Delta y\to0\) 时,有 \(f_x(a,b)\Delta x+f_y(a,b)\Delta y+\epsilon_1\Delta x+\epsilon_2\Delta y=\Delta z\),那么 f 在 \((a,b)\) 处可微
- 可微定理:若 \(f_x,f_y\) 在 \((a,b)\) 附近存在,并且在 \((a,b)\) 处连续,那么 f 在 \((a,b)\) 处可微
- 全微分:假设 f 是二元的,且 \(z=f(x,y)\),那么 f 的全微分定义为 \(dz=f_x(x,y)d_x+f_y(x,y)d_y\)
练习
- 计算切平面(假设 \(z=f(x,y)\)):(1) \(z=\sqrt{4-x^2-2y^2},(1,-1,1)\),(2) \(z=e^{x^2-y^2},(1,-1,1)\)
- 计算 \(f(x,y)=\tan^{-1}(x+2y)\) 在 \((1,0)\) 处的线性近似
- 计算 \(z=5x^2+y^2\) 从 \((1,2)\) 变到 \((1.05,2.1)\) 时,\(dz\) 和 \(\Delta z\) 的值
- 通过定义证明:\(f(x,y)=x^2+y^2\) 可微
- 证明:\(\lim\limits_{(\Delta x,\Delta y)\to(0,0)}f(a+\Delta x,b+\Delta y)=f(a,b)\)
提示
(1.1) \(f_x(x,y)=\frac{-2x}{2\sqrt{4-x^2-2y^2}}=\frac{-x}{\sqrt{4-x^2-2y^2}}\),\(f_y(x,y)=\frac{-4y}{2\sqrt{4-x^2-2y^2}}=\frac{-2y}{\sqrt{4-x^2-2y^2}}\)
于是 \(z=f(x,y)\) 在 \((1,-1)\) 处的切平面为 \(z-f(1,-1)=f_x(1,-1)(x-1)+f_y(1,-1)(y+1)\),即 \(z-1=-(x-1)+2(y+1)\),即 \(z=-x+2y+4\)
(1.2) \(f_x(1,-1)=d(e^{x^2-1})/dx\Big|_{x=1}=(2xe^{x^2-1})\Big|_{x=1}=2\),\(f_y(1,-1)=d(e^{1-y^2})/dx\Big|_{y=-1}=(-2ye^{1-y^2})\Big|_{y=-1}=2\)
于是 \(z=f(x,y)\) 在 \((1,-1)\) 处的切平面为 \(z-f(1,-1)=2(x-1)+2(y+1)\),即 \(z=2x+2y+1\)
(2) \(f_x(x,y)=\frac1{1+(x+2y)^2},f_y(x,y)=\frac2{1+(x+2y)^2}\),
于是 \(f(x,y)\) 在 \((1,0)\) 处的线性近似为 \(g(x,y)=f(1,0)+f_x(1,0)(x-1)+f_y(1,0)(y-0)=\pi/4+\frac12(x-1)+y=x/2+y+\pi/4-1/2\)
5.多元函数的链式法则
链式法则(情况 1)
\(z=f(x,y)\) 是一个关于 x 和 y 的可微函数,而 \(x=g(t)\) 和 \(y=h(t)\) 均为 t 的可微函数,那么 z 就是 t 的一个可微函数,
并且有: \(\frac {d_z}{d_t} = \frac {\partial f}{\partial x}\frac {d_x}{d_t} + \frac {\partial f}{\partial y}\frac {d_y}{d_t}\)
通常记为: \(\frac {d_z}{d_t} = \frac {\partial z}{\partial x}\frac {d_x}{d_t} + \frac {\partial z}{\partial y}\frac {d_y}{d_t}\)
例子
- 假设 \(z=x^2y+3xy^4,x=\sin 2t,y=\cos t\),计算 \(\frac{dz}{d_t}\):
- 传统链式法则:\(\frac{dz}{d_t}=(2x(2\cos2t))y+x^2(-s\sin t)+3(2\cos2t)y^4+3x(4y^3(-\sin t))\)
- 二元链式法则:\(\frac{dz}{d_t}=(2xy+3y^4)(2\cos2t)+(x^2+12xy^3)(-\sin t)\)
- 假设 \(z=e^x\sin y,x=st^2,y=s^2t\),那么 \(\frac{\partial z}{\partial s}=(e^x\sin y)(t^2)+(e^x\cos y)(2st)\),\(\frac{\partial z}{\partial t}=(e^x\sin y)(2st)+(e^x\cos y)(2s^2)\)
链式法则(情况 2)
\(z=f(x,y)\) 是一个关于 x 和 y 的可微函数,而 \(x=g(s,t)\) 和 \(y=h(s,t)\) 均为 s 和 t 的可微函数,那么 z 就是 s 和 t 的一个可微函数,
并且有: \(\frac {\partial z}{\partial s} = \frac {\partial f}{\partial x}\frac {\partial x}{\partial s} + \frac {\partial f}{\partial y}\frac {\partial y}{\partial s}\),\(\frac {\partial z}{\partial t} = \frac {\partial f}{\partial x}\frac {\partial x}{\partial t} + \frac {\partial f}{\partial y}\frac {\partial y}{\partial t}\)
Tip
- 由于 \(f(x,y) = f(g(s,t), h(s,t))\),即 f 可以是两个变量 s 和 t 的函数,所以使用偏微分符号 \(\frac {\partial z}{\partial s}\) 或 \(\frac {\partial z}{\partial t}\)
- 链式法则(情况 2)有些违反直觉,例如:\(\frac {\partial z}{\partial s} = \frac {\partial f}{\partial x}\frac {\partial x}{\partial s} + \frac {\partial f}{\partial y}\frac {\partial y}{\partial s} = 2\frac {\partial z}{\partial s}\) (等式右边可能不正确?)
链式法则(通用形式)
假设 u 是 n 个变量 \(x_1,x_2,\dots,x_n\) 的一个可微函数,每一个变量 \(x_i\) 都是 m 个变量 \(t_1,t_2,\dots,t_m\) 的可微函数,那么 u 是 \(t_1,t_2,\dots,t_m\) 的可微函数,那么:
\(\displaystyle \frac {\partial u}{\partial t_j} = \sum\limits_{i=1}^n\frac {\partial u}{\partial x_i}\frac {\partial x_i}{\partial t_j}\) (\(j=1..m\))
注:u 既可以表示为 \(u(x_1,x_2,\dots,x_n)\),也可以表示为 \(U(t_1,t_2,\dots,t_m)\)(注意映射符号的改变);上式则暗示 u 以 \(U(t_1,t_2,\dots,t_m)\) 的形式出现时的偏导数
推论:假设 g 是 u 的高阶高阶导数(“导数路径”为 \(x_{a_1},x_{a_2},\dots,x_{a_k}\)),那么 g 仍然是关于 \(t_1,t_2,t_m\) 的可微函数,同样有:\(\displaystyle \frac {\partial g}{\partial t_j} = \sum\limits_{i=1}^n\frac {\partial g}{\partial x_i}\frac {\partial x_i}{\partial t_j}\)
Tip
- 用“树图”的方式可以直观地表示 因变量,中间变量,独立变量 之间的关系(因变量作为这棵树的根结点)
例子
- \(w=f(x,y,z,u),x=x(s,t),y=y(s,t),z=z(s,t),u=u(s,t)\),那么 (1) \(\frac{\partial w}{\partial s}=\frac{\partial w}{\partial x}\frac{\partial x}{\partial s}+\frac{\partial w}{\partial y}\frac{\partial y}{\partial s}+\frac{\partial w}{\partial z}\frac{\partial z}{\partial s}+\frac{\partial w}{\partial u}\frac{\partial u}{\partial s}\),(2) \(\frac{\partial w}{\partial t}=\frac{\partial w}{\partial x}\frac{\partial x}{\partial t}+\frac{\partial w}{\partial y}\frac{\partial y}{\partial t}+\frac{\partial w}{\partial z}\frac{\partial z}{\partial t}+\frac{\partial w}{\partial u}\frac{\partial u}{\partial t}\)
- 计算一般的偏微分总是会计算梯度向量 \(\nabla f\)(参见[14.6])的分量
- \(g(s,t)=f(s^2-t^2,t^2-s^2)\) 且 f 可微,那么 \(\frac{\partial g}{\partial s}=f_1'\cdot(2s)+f_2'\cdot(-2s)\) 和 \(\frac{\partial g}{\partial t}=f_1'\cdot(-2t)+f_2'\cdot(2t)\),于是 \(t\frac{\partial g}{\partial s}+s\frac{\partial g}{\partial t}=0\)(有时为了记号“严谨”,会设 \(x=s^2-t^2,y=t^2-s^2\),蕴含 \(f(x,y)=f(s^2-t^2,t^2-s^2)\),蕴含 \(f_1'=\frac{\partial f}{\partial x},f_2'=\frac{\partial f}{\partial y}\))
- 假设 \(z=f(x,y)\) 有二阶偏导数,且 \(x=r^2+s^2,y=2rs\),那么 \(\frac{\partial z}{\partial r}=f_1'\cdot(2r)+f_2'\cdot(2s)\),计算 \(\frac{\partial^2z}{\partial r^2}\):
- 普通做法:\(\frac{\partial^2z}{\partial r^2}=\frac{\partial}{\partial r}\left(\frac{\partial z}{\partial r}\right)=(f_{11}''\cdot(2r)+f_{12}''\cdot(2s))\cdot(2r)+f_1'\cdot(2)+(f_{21}''\cdot(2r)+f_{22}''\cdot(2s))\cdot(2s)+f_2'\cdot0\) \(=4r^2f_{11}''+8rsf_{12}''+4s^2f_{22}''+2f_1'\)
- 优化做法:\(\frac{\partial^2z}{\partial r^2}=\frac{\partial}{\partial r}\left(\frac{\partial z}{\partial r}\right)=(2rf_{11}''+2sf_{21}'')(2r)+(2rf_{12}''+2sf_{22}'')(2s)+2f_1'=4r^2f_{11}''+8rsf_{12}''+4s^2f_{22}''+2f_1'\)
隐函数导数(一元)
根据微积分定理,当 F 定义在一个 盘型域,它上面的点 (a, b) 有 \(F(a,b)=0, F_y(a, b)\ne 0\),而且 \(F_x\) 和 \(F_y\) 在盘型域中连续,那么方程 F(x,y)=0 在点 (a,b) 附近定义了一个 y 作为 x 的一个函数,且这个函数是可微的
其偏导数为 \(\frac {d_y}{d_x} = -\frac {F_x}{F_y}\)
\(F(x,y)=0\) 两边对 x 求导,有 \(F_1'+F_2'\frac{dy}{dx}=0\)
假设 \(F_2'\ne0\),有 \(\frac{dy}{dx}=-F_1'/F_2'\),\(\frac{\partial z}{\partial y}=-F_2'/F_3'\)
\(\blacksquare\)
隐函数导数(二元)
根据微积分定理,当 F 定义在一个包含 (a,b,c) 的 球体 上,它上面的点 (a,b,c) 有 \(F(a,b,c)=0, F_z(a, b, c)\ne 0\),而且 \(F_x(a,b,c)\ne 0\),而且 \(F_x,F_y,F_z\) 在球体内部连续,那么方程 F(x,y,z)=0 在点 (a,b,c) 附近定义了一个 z 作为 x 和 y 的一个函数,且这个函数是可微的
其偏导数为 \(\frac {\partial z}{\partial x} = -\frac {F_x}{F_z}\),\(\frac {\partial z}{\partial y} = -\frac {F_y}{F_z}\)
\(F(x,y,z)=0\) 分别对 \(x,y\) 求偏导数,有 \(\begin{cases}F_1'+F_3'\frac{\partial z}{\partial x}=0\\F_2'+F_3'\frac{\partial z}{\partial y}=0\end{cases}\),
假设 \(F_3'\ne0\),有 \(\frac{\partial z}{\partial x}=-F_1'/F_3'\)
\(\blacksquare\)
例子
- 假设 \(x^3+y^3=6xy,y=f(x)\),设 \(F(x,y)=x^3+y^3-6xy\),于是 \(y'=-\frac{3x^2-6y}{3y^2-6x}=\frac{2y-x^2}{y^2-2x}\)
- 假设 \(x^3+y^3+z^3+6xyz=1,z=f(x,y)\),设 \(F(x,y,z)=x^3+y^3+z^3+6xyz-1\),于是 \(\frac{\partial z}{\partial x}=-\frac{3x^2+6yz}{3z^2+6xy}=-\frac{x^2+2yz}{z^2+2xy}\),\(\frac{\partial z}{\partial y}=-\frac{3y^2+6xz}{3z^2+6xy}=-\frac{y^2+2xz}{z^2+2xy}\)
总结
- 二元链式法则(递归定义):假设 f 是二元的,那么 \(z=f(x,y)\) 对 t 的偏导数为 \(\frac{\partial z}{\partial t}=\frac{\partial z}{\partial x}\frac{\partial x}{\partial t}+\frac{\partial z}{\partial y}\frac{\partial y}{\partial t}\) 或 \(\frac{\partial z}{\partial t}=f_1'\frac{\partial x}{\partial t}+f_2'\frac{\partial y}{\partial t}\)
- 特别的,若 \(z=(f\circ(g,h))(t)\),那么 \(\frac{dz}{dt}=\frac{\partial z}{\partial x}\frac{d x}{d_t}+\frac{\partial z}{\partial y}\frac{d y}{d_t}\)
- 多元链式法则:假设 f 是 n 元的,若 \(z=(f\circ(x_1,\cdots,x_n))(t_1,\cdots,t_m)\),那么 \(\forall i=1..m,\frac{\partial z}{\partial t_i}=\sum\limits_{j=1}^n\frac{\partial z}{\partial x_k}\frac{\partial x_k}{\partial t_i}\) 或者 \(\frac{\partial z}{\partial t_i}=\sum\limits_{k=1}^nf_k'\frac{\partial x_k}{\partial t_i}\)
- 其中,函数 \(\frac{\partial z}{\partial t_i}\) 可表示为 \(\frac{\partial z}{\partial t_i}=g(x_1,\cdots,x_n,t_i)\)
- 二阶偏导数:\(\frac{\partial^2z}{\partial t_j\partial t_i}=\mathbf u^T\begin{bmatrix}\frac{\partial x_1}{\partial t_i}\frac{\partial}{\partial x_1}\\\vdots\\\frac{\partial x_n}{\partial t_i}\frac{\partial}{\partial x_n}\end{bmatrix}\begin{bmatrix}\frac{\partial x_1}{\partial t_j}f_1'&\cdots&\frac{\partial x_n}{\partial t_j}f_n'\end{bmatrix}\mathbf u+\sum\limits_{k=1}^n\frac{\partial^2x_k}{\partial t_j\partial t_i}f_k'\),其中 \(\mathbf u^T=[1\cdots1]\)
- 隐函数偏导数:(更具实用性的隐函数求导,参见[3.6])
- 对于 \(F(x,y)=0,y=f(x)\),有 \(\frac{dy}{dx}=-F_1'/F_2'\)
- 对于 \(F(x,y,z)=0,z=f(x,y)\),有 \(\frac{\partial z}{\partial x}=-F_1'/F_3',\frac{\partial z}{\partial y}=-F_2'/F_3'\)
二级结论
- 微分应当分为“直接微分”(如:\(f_i'=\frac{\partial f}{\partial x_i}\))和“路径微分”(如:\(\frac{\partial f}{\partial t}=f_i'\frac{\partial x_i}{\partial t}\))
- 多元链式法则重用推论:假设 \(z=f(x,y),x=g(s,t),y=h(s,t)\),那么 \(\frac{\partial z}{\partial s}=[x_s'~~y_s']\begin{bmatrix}f_1'\\f_2'\end{bmatrix}\),\(\frac{\partial^2z}{\partial s\partial t}=[x_s'x_t'~~x_s'y_t'+x_t'y_s'~~y_s'y_t'~~x_{st}''~~y_{st}'']\begin{bmatrix}f_{11}''\\f_{12}''\\f_{22}''\\f_1'\\f_2'\end{bmatrix}\)
练习
- 判断题
- 假设一个 n 元函数间接依赖于 m 个变量,对 m 个变量进行二阶偏微分,可以得到项数为 \(\frac{n(n+1)}2+n=\frac{n(n+3)}2\) 的式子(Y)
- 若二元函数 f 满足 \(\forall t,f(tx,ty)=t^nf(x,y)\),那么称 f 是 n 阶齐次的
- 证明:\(f(x,y)=x^2y+2xy^2+5y^3\)
- 证明:[线性代数]中的 n 元二次型是 n 阶齐次的
- 证明:若 f 是 n 阶齐次函数,那么 f 是偏微分方程 \(x\frac{\partial f}{\partial x}+y\frac{\partial f}{\partial y}=nf(x,y)\) 的一个解
- 证明:若 f 是 n 阶齐次的,那么 f 是偏微分方程 \(x^2\frac{\partial^2f}{\partial x^2}+2xy\frac{\partial^2f}{\partial x\partial y}+y^2\frac{\partial^2f}{\partial y^2}=n(n-1)f(x,y)\) 的一个解
- 证明:若 f 是 n 阶齐次的,那么 f 是偏微分方程 \(f_x(tx,ty)=t^{n-1}f_x(x,y)\) 的一个解
- (环形依赖难题)假设 \(F(x,y,z)=0\) 定义了如下三个函数:\(z=f(x,y),y=g(x,z),x=h(y,z)\),并且 \(F_x',F_y',F_z'\) 均不为 0,证明:\(\frac{\partial z}{\partial x}\frac{\partial x}{\partial y}\frac{\partial y}{\partial z}=-1\)
- 假设 \(z=e^r\cos\theta,r=st,\theta=\sqrt{s^2+t^2}\),计算 \(\frac{\partial z}{\partial s},\frac{\partial z}{\partial t}\)
- (极坐标/柱面坐标的偏微分)假设 \(z=f(x,y),x=r\cos\theta,y=r\sin\theta\),
- 计算 \(\frac{\partial z}{\partial r},\frac{\partial z}{\partial \theta},\frac{\partial^2z}{\partial r^2},\frac{\partial^2z}{\partial\theta^2},\frac{\partial^2z}{\partial r\partial\theta}\)
- 证明:\(\left(\frac{\partial z}{\partial x}\right)^2+\left(\frac{\partial z}{\partial y}\right)^2=\left(\frac{\partial z}{\partial r}\right)^2+\frac1{r^2}\left(\frac{\partial z}{\partial\theta}\right)^2\)
- 证明:\(\frac{\partial^2z}{\partial x^2}+\frac{\partial^2z}{\partial y^2}=\frac{\partial^2z}{\partial r^2}+\frac1{r^2}\frac{\partial^2z}{\partial \theta^2}+\frac1r\frac{\partial z}{\partial r}\)
提示
(3) 若 \(z=f(x,y)\),根据隐函数求导法则 \(\frac{\partial z}{\partial x}=-F_1'/F_3'\)
同样地,若 \(y=g(x,z)\) 或 \(x=h(y,z)\),那么 \(\frac{\partial x}{\partial y}=-F_2'/F_1'\),\(\frac{\partial y}{\partial z}=-F_3'/F_2'\)
于是 \(\frac{\partial z}{\partial x}\frac{\partial x}{\partial y}\frac{\partial y}{\partial z}=\left(-\frac{F_1'}{F_3'}\right)\left(-\frac{F_2'}{F_1'}\right)\left(-\frac{F_3'}{F_2'}\right)=-1\)
(4) \(\frac{\partial z}{\partial s}=e^r\cos\theta\cdot t-e^r\sin\theta\cdot\frac s{\sqrt{s^2+t^2}}\)
\(\frac{\partial z}{\partial t}=e^r\cos\theta\cdot s-e^r\sin\theta\cdot\frac t{\sqrt{s^2+t^2}}\)
(5.1) 根据[14.5二级结论]有:
- \(\frac{\partial z}{\partial r}=\cos\theta f_1'+\sin\theta f_2'\)
- \(\frac{\partial z}{\partial \theta}=-r\sin\theta f_1'+r\cos\theta f_2'\)
- \(\frac{\partial^2z}{\partial r^2}=\cos^2\theta f_{11}''+2\cos\theta\sin\theta f_{12}''+\sin^2\theta f_{22}''+0\cdot f_1'+0\cdot f_2'\)
- \(\frac{\partial^2z}{\partial\theta^2}=r^2\sin^2\theta f_{11}''-2r^2\cos\theta\sin\theta f_{12}''+r^2\cos^2\theta f_{22}''+-\sin\theta f_1'+\cos\theta f_2'\)
- \(\frac{\partial^2z}{\partial r\partial\theta}=-r\sin\theta\cos\theta f_{11}''+r(\cos^2\theta-\sin^2\theta)f_{12}''+r\sin\theta\cos\theta f_{22}''-r\sin\theta f_1'-r\cos\theta f_2'\)
6.方向导数 & 梯度向量
我们希望找到 \((x_0,y_0)\) 附近,沿着任意方向的单位向量 \(\mathbf u=\langle a, b\rangle\) 中 z=f(x,y) 的变化率,
设 \(P(x_0,y_0,f(x_0,y_0))\) 是曲面 \(S_1\) (由 f 决定)上一点,\(S_2\) 是经过点 P 且平行于 \(\mathbf u\) 的垂直于 xoy 的平面,
令 \(Q(x,y,z)\) 为曲面 \(S_1\) 与曲面 \(S_2\) 的交线 C 上的一点,显然能表示为 \(Q(x_0+ha, y_0+hb, f(x_0+ha, y_0+hb))\)
得到线段 PQ 之间的差分之比:\(\frac {\Delta z}{h} = \frac {f(x_0+ha, y_0+hb) - f(x_0,y_0)}{h}\)
因而 \(\lim\limits_{h\to 0} \frac {f(x_0+ha, y_0+hb) - f(x_0,y_0)}{h}\) 为 z 的在点 \((x_0,y_0)\) 的 \(\mathbf u\) 方向上的变化率
方向导数
如果极限存在的话,函数 f 在点 \((x_0,y_0)\) 的关于一个向量 \(\mathbf u = \langle a,b\rangle\) 的方向导数是:
\(\displaystyle D_{\mathbf u}f(x_0,y_0) = \lim\limits_{h\to 0} \frac {f(x_0+ha, y_0+hb) - f(x_0,y_0)}{h}\)
Tip
- \(\displaystyle D_{\mathbf i} f = f_x(x_0,y_0) = \lim\limits_{h\to 0}\frac {f(x_0+h,y_0)-f(x_0,y_0)}h\)(\(\mathbf i = \langle 1,0 \rangle\))
- \(\displaystyle D_{\mathbf j} f = f_y(x_0,y_0) = \lim\limits_{h\to 0}\frac {f(x_0,y_0+h)-f(x_0,y_0)}h\)(\(\mathbf j = \langle 0,1 \rangle\))
梯度向量
如果 f 是 x 和 y 的一个两个变量函数,则 f 的梯度就是向量函数 \(\mathbf {grad} f\) 或 \(\nabla f\):
\(\nabla f(x,y) = \langle f_x(x,y), f_y(x,y)\rangle = \frac {\partial f}{\partial x}\mathbf i + \frac {\partial f}{\partial y}\mathbf j\)
定理
如果 f 是 x 和 y 的一个可微函数,那么对于任何一个单位向量 \(\mathbf u = \langle a,b \rangle\),f 都有一个方向导数,其表达式为:
\(D_{\mathbf u}f(x,y) = f_x(x,y)a + f_y(x,y)b\)
即 \(D_{\mathbf u}f(x,y) = \nabla f\cdot \mathbf u\)
Tip
- 若 \(a^2+b^2=1\)(即 \(\mathbf u\) 为单位向量),我们构造 \(a=\cos \theta, b=\sin \theta\),其中 \(\theta\) 为 \(\mathbf u\) 与 x 轴正方向的夹角;那么 \(D_{\mathbf u}f(x,y) = f_x(x,y)\cos\theta + f_y(x,y)\sin\theta\)
例子
- 假设 \(f(x,y)=x^3-3xy+4y^2\),\(\mathbf u=(\cos\frac\pi6,\sin\frac\pi6)\),那么 \(D_{\bf u}f(x,y)=(f_x(x,y),f_y(x,y))\cdot\mathbf u=(3x^2-3y,8y-3x)\cdot(\sqrt3/2,1/2)=\frac{\sqrt3}2(3x^2-3y)+\frac12(8y-3x)\)
- 假设 \(f(x,y)=\sin x+e^{xy}\),那么 \(\nabla f(x,y)=(\cos x+ye^{xy},xe^{xy})\)
- 计算 \(f(x,y)=x^2y^3-4y\) 在 \((2,-1)\) 对于 \(\mathbf u=(2,5)\) 的方向导数:\(D_{\bf u}f(2,-1)=(-4,8)\cdot(2,5)/\sqrt{2^2+5^2}=32/\sqrt{29}\)
三个变量函数的情况
如果下属极限存在,那么三元函数 f 在点 \((x_0,y_0,z_0)\) 的关于单位向量 \(\mathbf u=\langle a,b,c \rangle\) 的方向导数为:
\(D_{\mathbf u}f(x_0,y_0,z_0) = \lim\limits_{h\to 0}\frac {f(x_0+ha,y_0+hb,z_0+hc)-f(x_0,y_0,z_0)}h\)
梯度向量 \(\nabla f = \langle f_x,f_y,f_z \rangle = \frac {\partial f}{\partial x}\mathbf i + \frac {\partial f}{\partial y}\mathbf j + \frac {\partial f}{\partial z}\mathbf k\)
\(D_{\mathbf u}f(x_0,y_0,z_0) = \nabla f(x_0,y_0,z_0)\cdot \mathbf u\)
例子
- 计算 \(f(x,y,z)=x\sin yz\) 在 \((1,3,0)\) 处沿着 \(\mathbf u=(1,2,-1)\) 的方向导数:\(\text D_{\bf u}f=(\sin yz,xz\cos yz,xy\cos yz)\cdot\mathbf u/\|\mathbf u\|\),于是 \(\text D_{\bf u}f(1,3,0)=(0,0,3)\cdot(1,2,-1)/\sqrt6=-3/\sqrt6\)
n 个变量函数的情况
n 元函数 f 在 \((\mathbf {x_0}) = (x_{1,0},x_{2,0},\dots,x_{n,0})\) 处,关于向量 \(\mathbf u\) 的情况:
- \(D_{\mathbf u}f(\mathbf {x_0}) = \lim\limits_{h\to 0}\frac {f(\mathbf{x_0} + h\mathbf u)-f(\mathbf{x_0})}h\)
- \(\nabla f = \langle f_{x_{1,0}},f_{x_{2,0}},\dots,f_{x_{n,0}} \rangle\)
- \(D_{\mathbf u}f(\mathbf {x_0}) = \nabla f(\mathbf {x_0})\cdot \mathbf u\)
方向导数最大值
假设 f 是 n 元的,\(\mathbf a\in\mathbb R^n\),
那么\(\bf a\) 处的方向导数的最大值为 \(\max\limits_{\mathbf u\in\mathbb R^n}\{\text D_{\bf u}f(\mathbf a)\}=\|\nabla f(\mathbf a)\|\),即 \(\arg\max\limits_{\mathbf u\in\mathbb R^n}\text D_{\bf u}f(\mathbf a)=\nabla f(\mathbf a)\)
\(\forall\mathbf u\in\mathbb R^n\),\(\text D_{\bf u}f=\frac{\nabla f\cdot\mathbf u}{\|\mathbf u\|}\le\|\nabla f\|\|\mathbf u\|/\|\mathbf u\|=\|\nabla f\|\)
而 \(\text D_{\nabla f}f=\frac{\nabla f\cdot\nabla f}{\|\nabla f\|}=\|\nabla f\|\)
于是当 \(\mathbf u=\nabla f\) 时,\(\text D_{\bf u}f\) 有最大值,即 \(\arg\max\limits_{\mathbf u\in\mathbb R^n}\text D_{\bf u}f=\nabla f\)
\(\blacksquare\)
例子
- \(f(x,y)=xe^y\) 在 \((2,0)\) 上方向导数的最大值为 \(\text D_{\nabla f}f(2,0)=\|\nabla f(2,0)\|=\|(e^0,2e^0)\|=\sqrt5\)
假设 S 是 \(F(x,y,z)=k\) 确定的曲面(即 三元函数的等值面/等高面 或 二元函数的图像)
\(F(x,y,z)=k\) 可以表示为 \(F(\mathbf r(t))=F(x(t),y(t),z(t))=k\),
两边对 t 求微分有:\(\frac {\partial F}{\partial x}\frac {d_x}{d_t} + \frac {\partial F}{\partial y}\frac {d_y}{d_t} + \frac {\partial F}{\partial z}\frac {d_z}{d_t} = 0\) \(\implies\) \(\nabla F \cdot \mathbf r'(t) = 0\)
上式说明 \(\nabla F\) 与任意 S 上经过点 \(P(x(t),y(t),z(t))\) 的曲线 C 在 P 处的切线向量 \(\mathbf r'(t)\) 垂直,
这些切线向量构成平面为:\(F_x(x,y,z)(x_1-x) + F_y(x,y,z)(y_1-y) + F_z(x,y,z)(z_1-z) = 0\),称之为切平面(切平面由点 \((x_1,y_1,z_1)\) 构成)
上述切平面的法线方程为:\(\frac {x_2-x}{F_x(x,y,z)} = \frac {y_2-y}{F_y(x,y,z)} = \frac {z_2-z}{F_z(x,y,z)}\) (法线由点 \((x_2,y_2,z_2)\) 构成)
曲面的 切平面 & 法向量
给定三元函数等值面 或 二元隐函数 \(F(x,y,z)=k\),求 \((x_0,y_0,z_0)\) 处的 切平面 或 法向量:
- 切平面方程:\(F_x(x_0,y_0,z_0)(x-x_0) + F_y(x_0,y_0,z_0)(y-y_0) + F_z(x_0,y_0,z_0)(z-z_0) = 0\)
- 法线方程:\(\frac {x-x_0}{F_x(x_0,y_0,z_0)} = \frac {y-y_0}{F_y(x_0,y_0,z_0)} = \frac {z-z_0}{F_z(x_0,y_0,z_0)}\)
给定显式二元函数 \(F(x,y,z)-k = f(x,y)-z = 0\),求 \((x_0,y_0,z_0)\) 处的 切平面 或 法向量:
- 切平面方程:\(f_x(x_0,y_0)(x-x_0) + f_y(x_0,y_0)(y-y_0) - (z-z_0) = 0\)
- 法线方程:\(\frac {x-x_0}{f_x(x_0,y_0)} = \frac {y-y_0}{f_y(x_0,y_0)} = \frac {z-z_0}{-1}\)
例子
- \(\frac{x^2}4+y^2+\frac{z^2}9=3\) 在 \((-2,1,-3)\) 的切平面为 $$
梯度向量的含义
- \(\nabla F(\mathbf {x_0})\) 给出 f 增长最快的方向
- \(\nabla F(\mathbf {x_0})\) 正交于 f 过点 \(P(\mathbf {x_0})\) 的等值区域 S
总结
- 方向导数:假设 \(\mathbf a,\mathbf u\in\mathbb R^n\),函数 f 是 n 元可微的,那么 f 在点 \(\bf a\) 上关于 \(\mathbf u\) 的方向导数为 \(\text D_{\bf u}f(\mathbf a)=\lim\limits_{t\to0}\frac{f(\mathbf a+t\mathbf u)-f(\mathbf a)}t\)(注:方向导数可以称为变化率)
- 若 \(n=2\),那么 (1) \(\text D_{\bf u}f(a_1,a_2)=\lim\limits_{t\to0}\frac{f(a_1+tu_1,a_2+tu_2)-f(a_1,a_2)}t\),(2) \(\text D_{\bf i}f(a_1,a_2)=f_x'(a_1,a_2)\),(3) \(\text D_{\bf j}f(a_1,a_2)=f_y'(a_1,a_2)\)
- 梯度:假设函数 f 是 n 元可微的,那么 f 的梯度定义为 \(\nabla f=(f_1',\cdots,f_n')\),或者记为 \(\mathbf{grad}f\)
- 定理:假设函数 f 是 n 元可微的,那么 \(\forall\mathbf u\in\mathbb R^n\),有 \(\text D_{\bf u}f=\frac{(\nabla f)\cdot \mathbf u}{\|\mathbf u\|}\)
- 方向导数的最值:假设 \(\mathbf a\in\mathbb R^n\),并且 f 是 n 元可微的,那么 f 在 \(\bf a\) 处沿着 \(\nabla f\) 方向时,方向导数取最大值,即 \(\max\limits_{\mathbf u\in\mathbb R^n}\{\text D_{\bf u}f(\mathbf a)\}=\|\nabla f(\mathbf a)\|\) 或 \(\arg\max\limits_{\mathbf u\in\mathbb R^n}\text D_{\bf u}f(\mathbf a)=\nabla f(\mathbf a)\)
- 曲面的切平面,法线:在 \(\mathbb R^3\) 上,
- 曲面 \(f(x,y,z)=0\) 在 \((a,b,c)\) 处的切平面为 \(\nabla f(a,b,c)\cdot(x-a,y-b,z-c)=0\),法线为 \(\mathbf u=(a,b,c)+t\nabla f(a,b,c)\)(其中 \(\mathbf u=(x,y,z)\) 是未知向量)
- 函数曲面 \(z=f(x,y)\) 在 \((a,b,c)\) 处的切平面为 \((f_1'(a,b,c),f_2'(a,b,c),-1)\cdot(x-a,y-b,z-c)=0\),法线为 \(\mathbf u=(a,b,c)+t(f_1'(a,b,c),f_2'(a,b,c),-1)\)
- 切空间:假设 \(\mathbf a\in\mathbb R^n\),f 是 n 元的,那么几何空间 \(f(\mathbf x)=0\) 在 \(\bf x=a\) 处的切空间为 \(\nabla f(\mathbf a)\cdot(\mathbf x-\mathbf a)=0\)
- 若 \(n=2\),那么 \(f(x,y)=0\) 在 \((a,b)\) 的切线为 \(\nabla f(a,b)\cdot(x-a,y-b)=0\)
- 若 \(n=3\),那么 \(f(x,y,z)=0\) 在 \((a,b,c)\) 处的切平面为 \(\nabla f(a,b,c)\cdot(x-a,y-b,z-c)=0\)
一级结论
- 梯度算子的性质:假设 \(u,v\) 是 n 元可微的,\(c\in\mathbb R\),那么 (1) \(\nabla(cu)=c\nabla u\),(2) \(\nabla(uv)=u\nabla v+v\nabla u\),(3) \(\nabla\frac uv=\frac{v\nabla u-u\nabla v}{v^2}\)
练习
- 证明:\(\sqrt x+\sqrt y+\sqrt z=\sqrt d\) 在任意一处的切平面在三个坐标轴的截距之和为 d
- 计算[10.5]讨论的曲线的切线,以及[12.6]讨论的曲面的切平面
- 如何计算函数 f 的梯度 \(\nabla f\)?如何计算 f 在 \(\bf a\) 处沿着向量 \(\bf u\) 的方向导数 \(\text D_{\bf u}(\mathbf a)\)?方向导数和梯度有什么关系?
- 梯度的最大值,最小值如何计算?
提示
(1) 该平面在任意一处 \((a,b,c)\) 的切平面为 \((1/\sqrt a,1/\sqrt b,1/\sqrt c)\cdot(x-a,y-b,z-c)=0\),即 \((1/\sqrt a,1/\sqrt b,1/\sqrt c)\cdot(x,y,z)=(1/\sqrt a,1/\sqrt b,1/\sqrt c)\cdot(a,b,c)\),即 \(x/\sqrt a+y/\sqrt b+z/\sqrt c=\sqrt a+\sqrt b+\sqrt c\)
3 个截距之和为 \(\sqrt a(\sqrt a+\sqrt b+\sqrt c)+\sqrt b(\sqrt a+\sqrt b+\sqrt c)+\sqrt c(\sqrt a+\sqrt b+\sqrt c)=(\sqrt a+\sqrt b+\sqrt c)^2=(\sqrt d)^2=d\)
7.多元函数的 极大值 & 极小值
正如第 4 章所见,导数的主要用途之一是计算 极值 或 最值
定义
如果对所有与 (a,b) 邻近的 (x,y) 均有 \(f(x,y)\le f(a,b)\),则称 (a,b) 是二元函数 f 的极大值点 (或以 (a,b) 为圆心的某一圆周之内的所有点 (x,y),均有 \(f(x,y)\le f(a,b)\)),f(a,b) 为一个极大值
如果对所有与 (a,b) 邻近的 (x,y) 均有 \(f(x,y)\ge f(a,b)\),则称 (a,b) 是二元函数 f 的极小值点 (或以 (a,b) 为圆心的某一圆周之内的所有点 (x,y),均有 \(f(x,y)\ge f(a,b)\)),f(a,b) 为一个极小值
定理(极值的必要条件)
如果 f 在 (a,b) 达到 极大 或 极小,则该点 f 的一阶偏导数存在,且有 \(f_x(x,y)=0\),\(f_y(x,y)=0\)
注:可以用 Fermat 定理证明
临界点 或 驻点,鞍点
如果有 \(f_x(a,b)=0\) 和 \(f_y(a,b)=0\) 或其中之一不存在,
则称 (a,b) 为 f 的 临界点 或 驻点
如果一个 临界点 不是极值点,那么称为 鞍点
二阶导数判别
设函数 f 的二阶导数在某一以 (a,b) 为圆心的圆形区域内连续,并且设 \(f_x(a,b)=0\) 及 \(f_y(a,b)=0\)(即 (a,b) 是 f 的临界点)
令 \(D = D(a,b) = f_{xx}(a,b)f_{yy}(a,b) - [f_{xy}(a,b)]^2 = \left|\begin{matrix}{f_{xx}}&{f_{xy}}\\ {f_{yx}}&{f_{yy}}\\ \end{matrix}\right|\)
- \(D > 0\)
- 如果 \(f_{xx}(a,b) > 0\),则 \(f(a,b)\) 是极小值
- 如果 \(f_{xx}(a,b) < 0\),则 \(f(a,b)\) 是极大值
- \(D < 0\),则 \(f(a,b)\) 既不是极小值,也不是极大值
- \(D = 0\),则判别规则无效(无法提供任何信息)
部分证明详见:P274
例子
- 讨论 \(f(x,y)=x^4+y^4-4xy+1\) 的极值,鞍点:
- \(\nabla f(x,y)=(4x^3-4y,4y^3-4x)\),解方程 \(\nabla f(x,y)=\mathbf0\) 有 \((x,y)=\) \((0,0)\) 或 \((1,1)\) 或 \((-1,-1)\)
- 记 \(g(x,y)=f_{11}''(x,y)f_{22}''(x,y)-(f_{12}'')^2(x,y)=(12x^2)(12y^2)-(-4)^2=4^2(9x^2y^2-1)\)
- \(f_{11}''(0,0)=0\),于是 \((0,0)\) 是鞍点
- \(f_{11}''(1,1)=12>0,g(1,1)=128>0\),于是 \((1,1)\) 是极小值点
- \(f_{11}''(-1,-1)=12>0,g(-1,-1)=128>0\),于是 \((-1,-1)\) 是极小值点
- 借助计算器对 \(f(x,y)=10x^2y-5x^2-4y^2-x^4-2y^4\) 的临界点进行分类
应用
- 点 到 平面 \(ax+by+cz+d=0\) 的距离可以使用上述定理转化为极值问题
- 计算无盖长方体盒子的最大体积(限制:表面积固定)
在 \(\mathbb R^2\) 中,我们定义:
闭集:该集合与其所有边界点的并集(wiki的解释:开集的补集是闭集)
有界集:能被某个圆包含在其中的集合
在 闭集 和 有界集 的基础上,给出二维空间中的极值定理:
两个变量的函数的 极值定理
若 f 在 \(\mathbb R^2\) 中的有界闭集 D 上连续,则 f 在 D 中的某两个点 \((x_1,y_1)\) 和 \((x_2,y_2)\) 处取到最大值 \(f(x_1,y_1)\) 和最小值 \(f(x_2,y_2)\)
连续函数 f 在有界集合 D 上的最值
- 求 f 在 D 上临界点处的函数值
- 求 f 在 D 的边界点上的极值
- 步骤 1 和 2 的最大的值为最大值,最小的则是最小值
例子
- 假设 \(f(x,y)=x^2-2xy+2y\),\(D_f=[0,3]\times[0,2]\),计算 f 的最值:
- \(\nabla f(x,y)=(2x-2y,2-2x)\),解方程 \(\nabla f(x,y)=0\) 有 \((x,y)=(1,1)\),而 \(f(1,1)=1\)(而 \(g(x,y)=(f_{11}''f_{22}''-(f_{12}'')^2)(x,y)=2\cdot(-2)-(-2)^2=-8<0\),\(f_{11}''=2>0\),于是 \((1,1)\) 是极小值点)
- 若 \(x=0\),那么 \(f(x,y)=2y\),此时极小值,极大值分别为 \(f(0,0)=0,(0,2)=4\)
- 若 \(x=3\),那么 \(f(x,y)=9-4y\),此时极小值,极大值分别为 \(f(3,2)=1,f(3,0)=9\)
- 若 \(y=0\),那么 \(f(x,y)=x^2\),此时极小值,极大值分别为 \(f(0,0)=0,f(3,0)=9\)
- 若 \(y=2\),那么 \(f(x,y)=x^2-4x+4=(x-2)^2\),此时极小值,极大值分别为 \(f(2,2)=0,f(0,2)=4\)
- 通过比较上述 1 个临界值和 8 个边界值,f 的最小值为 \(f(0,0)=f(2,2)=0\),最大值为 \(f(3,0)=9\)
总结
- 最值,最值点:假设 f 是 n 元的
- 若 \(\exists\mathbf u\in\mathbb R^n,\forall\mathbf a\in\mathbb R^n\) 使得 \(f(\mathbf u)\ge f(\mathbf a)\),那么 \(\mathbf u\) 称为 f 的最大值点,\(f(\mathbf u)\) 称为 f 的最大值,记 \(\mathbf u=\arg\max\limits_{\mathbf a\in D_f}f(\mathbf a)\)
- 若 \(\exists\mathbf u\in\mathbb R^n,\forall\mathbf a\in\mathbb R^n\) 使得 \(f(\mathbf u)\le f(\mathbf a)\),那么 \(\mathbf u\) 称为 f 的最小值点,\(f(\mathbf u)\) 称为 f 的最小值,记 \(\mathbf u=\arg\min\limits_{\mathbf a\in D_f}f(\mathbf a)\)
- 极值,极值点:假设 f 是 n 元的,那么 \(\begin{cases}\mathbf u是极大值点&\mathbf u=\arg\max\limits_{\mathbf x\in U(\mathbf a,\delta)}f(\mathbf x)\\\mathbf u是极小值点&\mathbf u=\arg\min\limits_{\mathbf x\in U(\mathbf a,\delta)}f(\mathbf x)\end{cases}\)
- 费马定理(n 元的情况):假设 f 是 n 元的,若 \(\bf a\) 是 f 的极值点,那么 \(\nabla f(\mathbf a)=\mathbf 0\)
- 临界点(驻点),鞍点:假设 f 是 n 元的,若 \(\nabla f(\mathbf a)=\mathbf 0\) 或 \(\nabla f(\mathbf a)\) 不存在,那么 \(\bf a\) 称为 f 的临界点或驻点;又若 \(\bf a\) 不是极值点,那么 \(\bf a\) 又称鞍点(注:极值点是临界的非鞍点)
- (极值的)二阶导数判别法:假设 f 是二元的,\(A(\mathbf u)=\begin{bmatrix}f_{11}''(\mathbf u)&f_{12}''(\mathbf u)\\f_{21}(\mathbf u)&f_{22}''(\mathbf u)\end{bmatrix}\),若 \(\nabla f(\mathbf u)=\mathbf 0\),那么 \(\begin{cases}\mathbf u是f的一个极大值点&|A(\mathbf u)|>0,f_{11}''<0\\\mathbf u是f的一个极小值点&|A(\mathbf u)|>0,f_{11}''>0\\\mathbf u是f的一个鞍点&|A(\mathbf u)|<0\\不提供信息&|A(\mathbf u)=0|\end{cases}\)
- 最值存在定理:假设 f 是二元的,若 \(D_f\) 是有界闭集,那么 \(\exists\mathbf u_1,\mathbf u_2\in\mathbb R^2\) 使得 \(\mathbf u_1,\mathbf u_2\) 分别是 f 的最大值点,最小值点
- 最值判定定理:假设 f 是定义在有界闭集上的函数,那么 f 的最值点是 f 的 (1) 边界点 和 (2) 极值点 中的最值点(有时无需结合极值判别法来获取极值点,而只需讨论边界点和临界点)
二级结论
- 特殊点分类:\(\begin{cases}临界点(驻点)\begin{cases}极值点\\鞍点\end{cases}\\边界点\end{cases}\);最值点是极值点或边界点
练习
- 计算三角形闭区域内函数的最值:
- \(f(x,y)=1+4x-5y\),\(D_f\) 以 \((0,0),(2,0),(0,3)\) 为顶点
- \(f(x,y)=3+xy-x-2y\),\(D_f\) 以 \((1,0),(5,0),(1,4)\) 为顶点
- 计算 \(f(x,y)=x^3-3x-y^3+12y\) 的最值,其中 \(D_f\) 是以 \((-2,3),(2,3),(2,2),(-2,-2)\) 为顶点的四边形
提示
8.lagrange 乘子
lagrange 乘子算法
为了找到函数 f(x,y,z) 在 g(x,y,z)=k 条件下的最大值和最小值
假设这些值存在,且在曲面 g(x,y,z)=k 上有 \(\nabla g \ne 0\)
- 找出所有 x, y, z, \(\lambda\) 的值,使得:\(\nabla f(x,y,z)=\lambda \nabla g(x,y,z)\) 且 \(g(x,y,z)=k\)
- 求出 f 在 (1) 中所得的所有点 (x,y,z) 对应的值;在这些值中最大的就是 f 的最大值,最小的就是 f 的最小值
lagrange 乘子算法性质
\(\nabla f = \lambda \nabla g\) 和 g(x,y,z)=k 等价于:
\(\displaystyle \begin{cases} f_x = \lambda g_x \\ f_y = \lambda g_y \\ f_z = \lambda g_z \\ g(x,y,z)=k \end{cases}\)
例子
- 假设 \(x,y,z\ne0\),计算 \(f(x,y,z)=xyz\) 在 \(xy+2(x+y)z-12=0\) 的条件下的最大值:由[拉格朗日乘子算法],\(\exists\lambda\) 使得 \(\nabla f(x,y,z)=\lambda\nabla g(x,y,z)\),即 \((yz,xz,xy)=\lambda(y+2z,x+2z,2(x+y))\),解得 \((x,y,z)=(2,2,1)\),所以最值为 \(f(2,2,1)=4\)(注:)
- 计算 \(f(x,y)=x^2+2y^2\) 在 \(x^2+y^2=1\) 的条件下的极值:\(\exists\lambda\) 使得 \(\nabla f(x,y)=\lambda\nabla g(x,y)\),即 \((2x,4y)=\lambda(2x,2y)\)
- 若 \(x\ne0\),蕴含 \(\lambda=1\),蕴含 \(y=0\),蕴含 \(x=\pm1\)
- 若 \(y\ne0\),蕴含 \(\lambda=2\),蕴含 \(x=0\),蕴含 \(y=\pm1\)
- 于是 f 在 \((\pm1,0)\) 处取最小值,在 \((0,\pm1)\) 处最大值
- 假设 \(f(x,y)=x^2+2y^2\),并且 \(D_f=\{(x,y)|~x^2+y^2\le1\}\) 的最值
- 讨论临界点:假设 \(\nabla f(x,y)=(2x,4y)\),解方程 \(\nabla f(x,y)=0\) 得 \((x,y)=(0,0)\),\(f(0,0)=0\)
- 讨论边界点:\(\exists\lambda,\nabla f(x,y)=\lambda\nabla g(x,y)\),即 \((2x,4y)=\lambda(2x,2y)\),类似于 (2) 有 \((x,y)=(\pm1,\pm1)\)
- 于是 f 的最小值为 \(f(0,0)=0\),最大值为 \(f(0,\pm1)=2\)
两个约束条件下的 lagrange 乘子算法
求 f(x,y,z) 在满足 g(x,y,z)=k 和 h(x,y,z)=c 的约束条件下的极值:
存在两个常数 \(\lambda\) 和 \(\mu\)(lagrange 乘子),使得 \(\nabla f = \lambda \nabla g + \mu \nabla h\)
其等价于 \(\displaystyle \begin{cases} f_x = \lambda g_x + \mu h_x \\ f_y = \lambda g_y + \mu h_y \\ f_z = \lambda g_z + \mu h_z \\ g(x,y,z)=k \\ h(x,y,z)=c \end{cases}\)
例子
- 计算 \(f(x,y,z)=x+2y+3z\) 在限制 \(g(x,y,z)=x-y+z-1=0,h(x,y,z)=x^2+y^2-1=0\) 下的最大值:
- \(\exists u,v\) 使得 \(\nabla f=u\nabla g+v\nabla h\),即 \((1,2,3)=u(1,-1,1)+v(2x,2y,0)\)
- 初步解得 \(x=\pm2/\sqrt{29},y=\pm5/\sqrt{29}\),而 \(z=1-x+y\),可以计算得到最大值为 \(3+\sqrt{29}\)
扩展到 n 个变量
总结
- 拉格朗日乘子算法:假设 \(c,d\in\mathbb R\),f 是三元的,\(\nabla g\ne0\)
- 若 \(\mathbf u=\arg\max\limits_{\mathbf x\in D_f,g(\mathbf x)=c}f(\mathbf x)\),那么 \(\exists\lambda\in\mathbb R\),使得 \(\begin{cases}\nabla f(\mathbf u)=\lambda\nabla g(\mathbf u)\\g(\mathbf u)=c\end{cases}\)
- 若 \(\mathbf u=\arg\max\limits_{\mathbf x\in D_f,g(\mathbf x)=c,h(\mathbf x)=d}f(\mathbf x)\),那么 \(\exists\lambda,\mu\in\mathbb R\) 使得 \(\begin{cases}\nabla f(\mathbf u)=\lambda\nabla g(\mathbf u)+\nabla h(\mathbf u)\\g(\mathbf u)=c\\h(\mathbf u)=d\end{cases}\)
- 注:在实际运用该算法时,注意先假设 \(\nabla g\) 的各个分量非零时的情况
一级结论
练习
- (几何平均值,算术平均值)假设 \(\mathbf x\in\mathbb R^n,c\in\mathbb R\)
- 证明:\(f(\mathbf x)=\sqrt[n]{\prod\limits_{i=1}^nx_i}\) 在 \(\sum\limits_{i=1}^nx_i=c\) 的限制下的最大值为 \(\frac cn\)
- 由 (1) 可知 \(\forall\mathbf x\in\mathbb R^n,\sqrt[n]{\prod\limits_{i=1}^nx_i}\le\frac1n\sum\limits_{i=1}^n\),讨论何时等式成立?
- (柯西-施瓦茨不等式)假设 \(\mathbf x,\mathbf y,\mathbf a,\mathbf b\in\mathbb R^n\)
- 证明:\(f(\mathbf x,\mathbf y)\) 在 \(\sum\limits_{i=1}^nx_i^2=1,\sum\limits_{i=1}^ny_i^2=1\) 的限制条件下的最大值为 1
- 令 \(\forall i=1..n,x_i=\frac{a_i}{\sqrt{\sum\limits_{j=1}^na_j^2}},y_i=\frac{b_i}{\sqrt{\sum\limits_{j=1}^nb_j^2}}\),证明:\(\sum\limits_{i=1}^na_ib_i\le\sqrt{\sum\limits_{i=1}^na_i^2}\sqrt{\sum\limits_{i=1}^nb_i^2}\)
- 计算 \(\mathbb R^3\) 中的椭圆曲线 \(4x-3y+8z=5,z^2=x^2+y^2\) 的最高点,最低点
- 计算 \(\mathbb R^3\) 中的椭圆曲线 \(x+y+2z=2,z=x^2+y^2\) 离原点的最近点,最远点
- 长方形盒子表面积为 a,所有边周长为 b,计算盒子体积的最大值
- 证明:矩形周长为 p 时,矩形为正方形时面积最大
- 证明:三角形周长为 p 时,三边相等时面积最大(海伦公式:三角形面积为 \(\sqrt{s(s-x)(s-y)(s-z)}\),其中 \(s=p/2\),\(x,y,z\) 分别为三角形的三条边)
- 计算给定条件下的最值:(假设 \(g,h\) 为限制函数)
- \(f(x,y)=x^2-y^2,x^2+y^2=1\)
- \(f(x,y,z)=x^2+y^2+z^2,x^4+y^4+z^4=1\)
- \(f(x,y,z)=x^2y^2z^2,x^2+y^2+z^2=1\)
- \(f(x,y,z)=yz+xy,xy=1,y^2+z^2=1\)
- 计算 f 的最值:
- \(f(x,y)=2x^2+3y^2-4x-5,D_f=\{(x,y)|~x^2+y^2\le16\}\)
- \(f(x,y)=e^{-xy},D_f=\{(x,y)|~x^2+4y^2\le1\}\)
提示
(1.1) \(\exists\lambda,\nabla f(\mathbf x)=\lambda\nabla g(\mathbf x)\),即 \(\sqrt[n]{\prod\limits_{i=1}^nx_i}\left(\frac1{nx_1},\cdots,\frac1{nx_n}\right)=\lambda(1,\cdots,1)\)
解得 \(x_1=\cdots=x_n\),即 \(\forall i=1..n,x_i=\frac cn\)
(1.2) 仅当 \(\forall i\ne j,x_i=x_j\) 时成立
(3) 假设 \(f(x,y,z)=z,g(x,y,z)=4x-3y+8z-5,h(x,y,z)=x^2+y^2-z^2\),
于是 \(\exists u,v\) 使得 \(\nabla f(x,y,z)=u\nabla g(x,y,z)+v\nabla h(x,y,z)\),即 \((0,0,1)=u(4,-3,8)+v(2x,2y,-2z)\),消去 \(u,v\) 得 \(x=-\frac43y\)
然后解方程组 \(\begin{cases}x=-\frac43y\\4x-3y+8z=5\\x^2+y^2=z^2\end{cases}\) 得 \((x,y,z)=\) \((\frac4{13},-\frac3{13},\frac5{13})\) 或 \((-\frac43,1,\frac53)\)
所以椭圆上的最高点为 \((-\frac43,1,\frac53)\),高度为 \(\frac53\)
椭圆上的最低点为 \((\frac4{13},-\frac3{13},\frac5{13})\),高度为 \(\frac5{13}\)
(4) 记 \(f(x,y,z)=x^2+y^2+z^2,g(x,y,z)=x+y+2z-2,h(x,y,z)=x^2+y^2-z\)
\(\exists u,v\) 使得 \(\nabla f(x,y,z)=u\nabla g(x,y,z)+v\nabla h(x,y,z)\),即 \((2x,2y,2z)=u(1,1,2)+v(2x,2y,-1)\) 或 \(\begin{bmatrix}1&2x\\1&2y\\2&-1\end{bmatrix}\begin{bmatrix}u\\v\end{bmatrix}=\begin{bmatrix}2x\\2y\\2z\end{bmatrix}\),后者对系数进行初等变换有 \(\begin{bmatrix}1&2x&2x\\1&2y&2y\\2&-1&2z\end{bmatrix}\sim\begin{bmatrix}1&2x&2x\\0&y-x&y-x\\0&1+4x&4x-2z\end{bmatrix}\)
- 若 \(y\ne x\),蕴含 \(v=1\),那么 \(1+4x=4x-2z\),即 \(z=-1/2\),而与 \(z=x^2+y^2\ge0\) 矛盾
- 若 \(y=x\),可以得到方程组 \(\begin{cases}x+z=1\\z=2x^2\end{cases}\),结合 \(y=x\) 的假设,解得 \((x,y,z)=\) \((-1,-1,2)\) 或 \((1/2,1/2,1/2)\)
于是椭圆上离原点最远的点是 \((1/2,1/2,1/2)\),此时距离为 \(\sqrt{f(1/2,1/2,1/2)}=\sqrt3/2\)
椭圆上离原点最远的点是 \((-1,-1,2)\),此时距离为 \(\sqrt{f(-1,-1,2)}=\sqrt6\)
(5) 记 \(f(x,y,z)=xyz,2(xy+yz+zx)=a,2(x+y+z)=b\)
存在 \(u,v\) 使得 \(\nabla f(x,y,z)=u\nabla g(x,y,z)+v\nabla h(x,y,z)\),容易解得 \(x=y\) 或 \(y=z\) 或 \(x=z\)
...
(8.1) \(f(x,y)=x^2-y^2,g(x,y)=x^2+y^2-1\)
\(\exists u,\nabla f=u\nabla g\),即 \((2x,-2y)=u(2x,2y)\),解得 \((x,y)=\) \((0,\pm1)\) 或 \((\pm1,0)\)
于是 f 的最大值为 \(f(\pm1,0)=1\),最小值为 \(f(0,\pm1)=-1\)
(8.2) \(f(x,y,z)=x^2+y^2+z^2,x^4+y^4+z^4=1\)
\(\exists u,\nabla f=u\nabla g\),即 \((2x,2y,2z)=u(4x^3,4y^3,4z^3)\)
- 若 \(x\ne0\),可以得到四种可能:\(x^2=y^2=z^2\) 或 \(x^2=y^2,z=0\) 或 \(y=0,x^2=z^2\) 或 \(y=0,z=0\),可以解得 \((x,y,z)=\) \((\pm\frac1{\sqrt[4]3},\pm\frac1{\sqrt[4]3},\pm\frac1{\sqrt[4]3})\) 或 \((\pm\frac1{\sqrt[4]2},\pm\frac1{\sqrt[4]2},0)\) 或 \((\pm\frac1{\sqrt[4]2},0,\pm\frac1{\sqrt[4]2})\) 或 \((\pm1,0,0)\)?
- \(x=0\) 或 \(y\ne0\) 或 \(y=0\) 或 \(z\ne0\) 或 \(z=0\) 时,可以得到类似的解?
可以得到 f 的最大值为 \(f(\pm\frac1{\sqrt[4]2},\pm\frac1{\sqrt[4]2},\pm\frac1{\sqrt[4]2})=\sqrt3\),最小值为 \(f(\pm1,0,0)=1\)