4.向量空间
- 4.1 给出一些基本定义
- 4.3~4.5 说明其他向量空间是如何类似于 \(\mathbb R^n\) 的
- 4.6 讨论本章的重点——秩,利用向量空间的术语将矩阵的重要知识连在一起
- 4.8 将本章的理论应用到离散信号和差分方程,它们用于像航天飞机中用到的数字控制系统
- 4.9 马尔可夫(markov)链,它为第5章中出现的概念提供了较好的例子
1. 向量空间,子空间
向量空间(公理)
向量空间:由一些被称为向量的对象构成的非空集合 V
V 中定义了两种运算:加法,标量乘法
假设 \(\mathbf u,\mathbf v,\mathbf w\in V\),\(c,d\in\mathbb R\)(或者 \(c,d\in\mathbb C\)),V 满足以下公理:
- \(\mathbf u+\mathbf v\in V\)(加法封闭性?)
- 加法交换律 \(\mathbf u+\mathbf v=\mathbf v+\mathbf u\),加法结合律 \((\mathbf u+\mathbf v)+\mathbf w=\mathbf u+(\mathbf v+\mathbf w)\)
- 加法单位元 \(\mathbf 0\in V\)(\(\mathbf u+\mathbf 0=\mathbf u\)),加法逆元 \(-\mathbf u\in V\)(\(\mathbf u+(-\mathbf u)=\mathbf 0\))
- \(c\mathbf u\in V\)(标量乘法封闭性?)
- 加法与标量乘法的相互分配律 \(c(\mathbf u+\mathbf v)=c\mathbf u+c\mathbf v\),\((c+d)\mathbf u=c\mathbf u+d\mathbf u\)
- 实数乘法与标量乘法的结合律 \(c(d\mathbf u)=(cd)\mathbf u\)
- 标量乘法单位元 \(1\mathbf u=\mathbf u\)
注:(1)-(3) 描述了向量加法的公理;(4)-(7) 描述了标量乘法的公理(实数公理与向量空间公理的耦合)
定理
若 \(\mathbf u\in V,c\in\mathbb R\),那么:
\(0\mathbf u=\mathbf 0\),\(c\mathbf 0=\mathbf 0\),\(-\mathbf u=(-1)\mathbf u\)
证明:
1)\(0\mathbf u=\mathbf 0+0\mathbf u=0\mathbf u+[-(0\mathbf u)]+0\mathbf u=(0+0)\mathbf u+[-(0\mathbf u)]=0\mathbf u+[-(0\mathbf u)]=\mathbf 0\)
2)\(c\mathbf 0=c(0\mathbf 0)=(c0)\mathbf 0=0\mathbf 0=\mathbf 0\)
3)$$
\(\blacksquare\)
例子
- 空间 \(\mathbb R^n\) 为向量空间的首要例子;\(\mathbb R^3\) 的集合直觉可以帮助我们使本章的许多概念清晰化并且直观化
- 设 V 是三维空间中所有有向线段的集合,如果其中两个向量相同并且长度相等,那么二者相等
- 由平行四边形法则定义加法;加法交换律,结合律,单位元,逆元 可用几何方式表示
- 信号空间
- 全体 n 次多项式集合:次数最高为 n 的多项式集合定义为 \(\mathbb P_n\)(\(n\ge0\));集合中的元素形如 \(\mathbf p(t)=\sum\limits_{i=0}^na_it^i\)(\(a_i,t\in\mathbb R\))
- \(\mathbf p(t)=0\) 称为零多项式;\(\mathbf p(t)=a_0\ne0\) 的次数为 0
- 假设 \(\mathbf q(t)=\sum\limits_{i=0}^nb_it^i\),\(\mathbf p+\mathbf q\) 定义为 \((\mathbf p+\mathbf q)(t)=\mathbf p(t)+\mathbf q(t)=\sum\limits_{i=0}^n(a_i+b_i)t^i\)
- 标量乘法 \(c\mathbf p\) 定义为 \((c\mathbf p)(t)=c\mathbf p(t)=\sum\limits_{i=0}^n(ca_i)t^i\)
- 满足向量空间公理:多项式集合的加法和标量乘法均满足封闭性公理;零多项式可以作为向量公理中的零向量(加法单位元),\((-1)\mathbf p\) 作为 \(\mathbf p\) 的负向量;其他公理均可以通过实数公理验证
- 全体实值函数集合:设 V 是定义在集合 \(\mathbb D\) 上的全体实值函数的集合(\(\mathbb D\) 是实数集或实轴上的区间;\(\forall\mathbf f\in V\),\(\mathbf f~:~\mathbb D\to\mathbb R\))
- 定义 \(\mathbf f+\mathbf g\) 仍为函数(\(\mathbf f+\mathbf g\in V\);\(\forall t\in\mathbb D,(\mathbf f+\mathbf g)(t)=\mathbf f(t)+\mathbf g(t)\));\(c\mathbf f\) 仍为函数(\(\mathbf f\in V\);\(\forall t\in\mathbb D,(c\mathbf f)(t)=c\mathbf f(t)\))
- \(\mathbf f=\mathbf g\),当且仅当 \(\forall t\in\mathbb D,f(t)=g(t)\);\(\mathbf 0\in V\) 是零向量,即 \(\forall t\in\mathbb D,\mathbf f(t)=0\);\(\forall t\in\mathbb D\),\(\mathbf f\) 的负向量为 \((-1)\mathbf f\)
在许多问题中,一个向量空间是由一个大的向量空间中适当的向量的子集所构成;在此情形下,向量空间的 10 个公理中只需要验证三个,其余的自然成立
子空间
向量空间 V 的一个子空间是 V 的一个满足以下性质的子集 H:
- V 中的零向量在 H 中
- H 对向量加法封闭,即 \(\forall \mathbf u,\mathbf v\in H\),\(\mathbf u+\mathbf v\in H\)
- H 对标量乘法封闭,即 \(\forall \mathbf c\in\mathbb R,u\in H\),\(c\mathbf u\in H\)
H 加法和标量乘法的封闭性,并且包含加法单位元(3 个公理);加法逆元 \(-\mathbf u\in H\) 也成立,因为标量乘法的封闭性有 \((-1)\mathbf u\in H\);其他公理自然满足,因为 \(H\subset V\) 蕴涵 \(\forall \mathbf u\in H,\mathbf u\in V\) 而且 V 满足这些公理
于是子空间 H 也是一个向量空间
例子
- 零子空间:向量空间 V 中最小的子空间为零子空间,它仅包含零向量 \(\mathbf 0\),该子空间记作 \(\{\mathbf 0\}\)
- 全体实系数多项式集合:令 \(\mathbb P\) 是全体实系数多项式的集合,\(\mathbb P\) 中的运算的定义与函数运算相同,则 \(\mathbb P\) 是定义在 \(\mathbb R\) 上的全体实值函数的空间 V 的一个子空间
- 全体 n 次实系数多项式集合 \(\mathbb P_n\) 是 \(\mathbb P\) 的子空间(\(\mathbb P_n\subset\mathbb P\),\(\mathbb 0\in\mathbb P_n\),\(\mathbb P_n\) 满足加法和标量乘法的封闭性)
- \(\mathbb R^2\) 不是 \(\mathbb R^3\) 的子空间,因为 \(\mathbb R^2\not\subset\mathbb R^3\)(\(\mathbb R^3\) 中的向量有三个元素,而 \(\mathbb R^2\) 中的向量有两个元素)
- \(H=\left\{\left[\begin{array}{}s\\t\\0\end{array}\right]:s,t\in\mathbb R\right\}\) 也是 \(\mathbb R^3\) 的子空间
- \(\mathbb R^3\) 中不通过原点的平面(如 \(H=\left\{\left[\begin{array}{}s\\t\\1\end{array}\right]:s,t\in\mathbb R\right\}\))不是 \(\mathbb R^3\) 的子空间,因为 \(\mathbf0\not\in H\)
- \(\mathbb R^2\) 中不通过原点的直线(如 \(H=\left\{\left[\begin{array}{}s\\1\end{array}\right]:s\in\mathbb R\right\}\))不是 \(\mathbb R^2\) 的子空间,因为 \(\mathbf0\not\in H\)
线性组合一词表示一些向量的任意标量乘法之和,\(\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}\) 表示所有 \(\mathbf v_1,\dots,\mathbf v_p\) 的线性组合的向量集合
张成子空间(生成子空间),张成集(生成集)
张成子空间(生成子空间):我们称 \(\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}\) 是由 \(\{\mathbf v_1,\dots,\mathbf v_p\}\) 生成(或张成)的子空间
(性质:\(\forall i=1..p,\mathbf v_i\in\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}\))
张成集(生成集):给定 V 的任一子空间 H,H 的张成集是集合 \(\{\mathbf v_1,\dots,\mathbf v_p\}\subset H\),满足 \(H=\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}\)(即生成集是子空间 H 中的一组能张成 H 本身向量集合)
定理
设 \(\mathbf v_1,\mathbf v_2\) 是向量空间 V 中的向量,那么 \(H=\text{Span}\{\mathbf v_1,\mathbf v_2\}\) 也是 V 的子空间
推广:若 \(\mathbf v_1,\dots,\mathbf v_p\in V\)(V 是向量空间),那么 \(H=\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}\) 是 V 的子空间
证明:(由于 \(H\subset V\),所以 H 自然满足除了 零向量,加法封闭性,标量乘法封闭性;因此只需证明这三个公理成立即可)
显然 \(\mathbf v_1,\mathbf v_2\in H\)
1) \(0\mathbf v_1+0\mathbf v_2\in H\),而 \(0\mathbf v_1+0\mathbf v_2=\mathbf 0\),于是 \(\mathbf 0\in H\)
2) 假设 \(\mathbf u=s_1\mathbf v_1+t_1\mathbf v_2,\mathbf w=s_2\mathbf v_1+t_2\mathbf v_2\)(\(s_1,t_1,s_2,t_2\in\mathbb R\)),于是 \(\mathbf u+\mathbf w=(s_1\mathbf v_1+t_1\mathbf v_2)+(s_2\mathbf v_1+t_2\mathbf v_2)=(s_1+s_2)\mathbf v_1+(t_1+t_2)\mathbf v_2\),那么 \(\mathbf u+\mathbf w\in H\)
3) 假设 \(\mathbf u=s\mathbf v_1+t\mathbf v_2,c\in\mathbb R\)(\(s,t\in\mathbb R\)),于是 \(c\mathbf u=c(s\mathbf v_1+t\mathbf v_2)=c(s\mathbf v_1)+c(t\mathbf v_2)=(cs)\mathbf v_1+(ct)\mathbf v_2\),那么 \(c\mathbf u\in H\)
\(\blacksquare\)
例子
- 形如 \((a-3b,b-a,a,b)\) 的集合 \(H=\{(a-3b,b-a,a,b)~:~a,b\in\mathbb R\}\) 是 \(\mathbb R^4\) 的子空间
- 因为 \(\begin{bmatrix}a-3b\\b-a\\a\\b\end{bmatrix}=a\begin{bmatrix}1\\-1\\1\\0\end{bmatrix}+b\begin{bmatrix}3\\1\\0\\1\end{bmatrix}\),于是 \(H=\text{Span}\{\mathbf v_1,\mathbf v_2\}\),因此 H 是 \(\mathbb R^4\) 的子空间
总结
- 向量空间公理:若 \(\forall\mathbf u,\mathbf v,\mathbf w\in V\),\(c,d\in\mathbb R\),那么
- \(\exists\mathbf u+\mathbf v\),\(c\mathbf u\),\(\mathbf 0\),\(-\mathbf u\in V\)
- \(\mathbf u+\mathbf v=\mathbf v+\mathbf u\),\((\mathbf u+\mathbf v)+\mathbf w=\mathbf u+(\mathbf v+\mathbf w)\)
- \(c(\mathbf u+\mathbf v)=c\mathbf u+c\mathbf v\),\((c+d)\mathbf u=c\mathbf u+d\mathbf u\)
- \(c(d\mathbf u)=(cd)\mathbf u\),\(1\mathbf u=\mathbf u\)
- 推论:\(0\mathbf u=\mathbf 0\),\(c\mathbf 0=\mathbf 0\),\(-\mathbf u=(-1)\mathbf u\)
- 向量空间的例子:\(\mathbb R^n\),三维有向线段的集合,全体 n 次多项式集合 \(\mathbb P_n\),全体多项式集合 \(\mathbb P\),\(\mathbb R\) 中的闭区间 \([a,b]\) 上全体实值函数集合 \(C[a,b]\);向量空间的子空间(零子空间,向量空间子集张成的子空间 \(H=\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}\))
- \(\mathbb R^n,\mathbb P_n,\mathbb P,\mathbb F,\{\mathbf 0\},H,\text{Span}(S)\)(H 是 V 的子空间;\(S\subset H\))
- 子空间:若 \(\mathbf u,\mathbf v\in H,c\in\mathbb R\) 并且 \(H\subset V\)(V 是向量空间),那么 \(\mathbf 0,\mathbf u+\mathbf v,c\mathbf u\in H\),则 H 是向量空间 V 的子空间
- 张成子空间,张成集:\(\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}=\left\{\sum\limits_{i=1}^pc_i\mathbf v_i~:~\forall i=1..p,c_i\in\mathbb R\right\}\) 称为由 \(\{\mathbf v_1,\dots,\mathbf v_p\}\) 生成的子空间;若子空间 H 的子集 \(S=\{\mathbf v_1,\dots,\mathbf v_p\}\subset H\) 张成的子空间为 H 本身(即 \(\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}=H\)),那么 S 称为 H 的张成集
一级结论
- \(\forall\mathbf x\in\text{Span}\{\mathbf v_1,\cdots,\mathbf v_p\}\),\(\exists c_1,\cdots,c_p\) 使得 \(\mathbf x=\sum\limits_{i=1}^pc_i\mathbf v_i\)
练习
- 证明:点集 \(H=\{(3s,2+5s)~:~s\in\mathbb R\}\) 不是 \(\mathbb R^2\) 的子空间
- 证明:\(\forall i=1..p\),\(\mathbf v_i\in\text{Span}\{\mathbf v_1,\dots,\mathbf v_p\}\)
- 证明:若 S 是所有对称矩阵的集合(\(\{A~:~A=A^T,A\in M_{n\times n}\}\)),而 \(M_{n\times n}\) 是所有 \(n\times n\) 矩阵的向量空间,那么 S 是 \(M_{n\times n}\) 的子空间
- 判断题
- 若 f 是 \(\mathbb R\) 上所有实值函数的向量空间 V 中的一个函数,且对某个 t 由 \(f(t)=0\),则 f 是 V 中的零向量(X)
- 在三维空间中,向量是一个箭头(有向线段)(X)
- 对向量空间 V 的一个子集 H,若零向量在 H 中,则 H 是 V 的一个子空间(X)
- 一个子空间仍是一个向量空间(Y)
- 一个向量是一个向量空间中任意一个元素(Y)
- 若 \(\mathbf u\) 是向量空间 V 中的一个向量,则 \((-1)\mathbf u\) 与 \(\mathbf u\) 的负向量相同(Y)
- 一个向量空间仍是一个子空间(Y)
- \(\mathbb R^2\) 是 \(\mathbb R^3\) 的子空间(X)
- 一个向量空间 V 的子集 H 若满足 (1) V 的零向量在 H 中,(2) \(\mathbf u,\mathbf v,\mathbf u+\mathbf v\in H\),(3) \(c\in\mathbb R^n\),\(c\mathbf u\in H\),那么 H 是 V 的一个子空间(X)
- 令 V 是 \(xy\) 平面的第一象限,即 \(V=\left\{(x,y)~:~x,y\ge0\right\}\)
- 若 \(\mathbf u,\mathbf v\in V\),证明:\(\mathbf u+\mathbf v\in V\)
- 证明:\(\exists c\in\mathbb,c\mathbf u\not\in V\)
- 令 W 是 \(xy\) 平面中第一,三象限的并集,即 \(W=\{(x,y)~:~xy\ge0\}\)
- 证明:\(\forall\mathbf u\in W,c\in\mathbb R\),\(c\mathbf u\in W\)
- 证明:\(\exists \mathbf u,\mathbf v\in W\),\(\mathbf u+\mathbf v\not\in W\)
- 令 H 是 \(xy\) 平面上所有单位圆内和圆上的点集,即 \(H=\{(x,y)~:~x^2+y^2\le 1\}\),证明:H 不是 \(\mathbb R^2\) 的子空间
- 用几何证明,\(\mathbb R^2\) 中不过原点的直线对向量的加法不封闭
- 证明:假设 \(a\in\mathbb R\),那么 (1) 多项式 \(\mathbf p(t)=at^2\) 形成的集合是向量空间,(2) 多项式 \(\mathbf p(t)=a+t^2\) 形成的集合不是向量空间
- 定义在 \(\mathbb R\) 中闭区间 \([a,b]\) 上的全体实值连续函数的集合 \(C[a,b]\)
- 证明:\(C[a,b]\) 是定义在 \([a,b]\) 上的全体实值函数的向量空间的一个子空间
- 证明:\(H=\{\mathbf f\in C[a,b]:~\mathbf f(a)=\mathbf f(b)\}\) 也是 \(C[a,b]\) 的一个子空间
- 证明:假设 \(F\in M_{3\times 2},H=\{A\in M_{2\times 4}:~FA=0\in M_{3\times 4}\}\),那么 H 是 \(M_{2\times 4}\) 的一个子空间
- 证明:假设 \(H,K\) 是向量空间 V 的子空间,那么 (1) \(H\cap K\) 是 H 的子空间,(2) \(H\cup K\) 通常不是 H 的子空间
- 假设 \(H,K\) 是向量空间 V 的子空间,定义 H 和 K 的和为集合 \(H+K=\{\mathbf u+\mathbf v:\mathbf u\in H,\mathbf v\in K\}\),记为 W
- 证明:\(H+K\) 是 V 的子空间
- 证明:\(H,K\) 都是 \(H+K\) 的子空间
提示
(1) 除了 \(H\subset V\) 外,子空间的三个条件均不满足(零向量,加法封闭性,标量乘法封闭性)
(2) 对于 \(\mathbf v_i\),权的仅给第 i 个权赋值为 1,其他取零,可得 \(\mathbf v_i\in H\)
(3) 假设 \(A,B\in S,c\in\mathbb R\)
- \(O=O^T\),于是 \(O\in S\)
- \(A+B=A^T+B^T=(A+B)^T\),于是 \(A+B\in S\)
- \(cA=cA^T=(cA)^T\),于是 \(cA\in S\)
(5) 令 \(\mathbf u=(x_1,y_1),\mathbf v=(x_2,y_2)\)
- 由 \(\mathbf u+\mathbf v=(x_1+x_2,y_1+y_2)\),其中 \(x_1+x_2,y_1+y_2\ge0\),于是 \(\mathbf u+\mathbf v\in V\)
\(-1\mathbf u=(-x_1,y_1)\),其中 \(-x_1,-y_1\le0\),所以 \(\exists x_1,y_1>0\) 使得 \(-x_1,-y_1<0\),进而 \(\mathbf u\not\in V\) (6)
令 \(\mathbf u=(x,y)\),\(c\mathbf u=(cx,cy)\),其中 \((cx)(cy)=c^2xy\ge0\),所以 \(c\mathbf u\in W\)
- 存在 \(\mathbf u=(1,2),\mathbf v=(-2,-1)\in W\),\(\mathbf u+\mathbf v=(-1,1)\),而 \(-1\cdot 1=-1\not\ge0\),所以 \(\mathbf u+\mathbf v\not\in W\)
(7) 存在 \(\mathbf u=(1,1),\mathbf v=(0,1)\in H\),使得 \(\mathbf u+\mathbf v=(1,2)\),而 \(2>1\),所以 H 不是 \(\mathbb R^2\) 的子空间
(10.1)
- 常数函数 \(\mathbf f(t)=0\) 是连续的
- 两个连续函数之和 \(\mathbf f(t)+\mathbf g(t)\) 也是连续的
- 连续函数的标量乘积 \(c\mathbf f(t)\) 也是连续的
于是 \(C[a,b]\) 是子空间
(10.2)
- \(\mathbf 0(a)=0=\mathbf 0(b)\),于是零函数 \(\mathbf 0(t)\in C[a,b]\)
- \(\forall\mathbf f,\mathbf g\in H\),\((\mathbf f+\mathbf g)(a)=\mathbf f(a)+\mathbf g(a)=\mathbf f(b)+\mathbf g(b)=(\mathbf f+\mathbf g)(b)\),于是 \(\mathbf f+\mathbf g\in H\)
- \(\forall c\in\mathbb R,\mathbf f\in H\),\((c\mathbf f)(a)=c\mathbf f(a)=c\mathbf f(b)=(c\mathbf f)(b)\),于是 \(c\mathbf f\in H\)
于是 H 是 \(C[a,b]\) 的子空间
(11)
- 对于 \(0\in M_{2\times 4}\),\(F0=0\),于是 \(0\in H\)
- \(\forall A,B\in H,F(A+B)=FA+FB=0\),于是 \(A+B\in H\)
- \(\forall c\in\mathbb R,A\in H,F(cA)=cFA=c0=0\),于是 \(cA\in H\)
(13.1)
- \(\mathbf 0+\mathbf 0=\mathbf 0\),于是 \(\mathbf 0\in W\)
- \(\forall\mathbf x,\mathbf y\in W\),\(\exists\mathbf x_1,\mathbf y_1\in H,\mathbf x_2,\mathbf y_2\in K\) 使得 \(\bf x=x_\text1+x_\text2,y=y_\text1+y_\text2\),\(\mathbf x+\mathbf y=(\mathbf x_1+\mathbf x_2)+(\mathbf y_1+\mathbf y_2)=(\mathbf x_1+\mathbf y_1)+(\mathbf x_2+\mathbf y_2)\),于是 \(\mathbf x+\mathbf y\in W\)
- \(\forall c\in\mathbb R,\mathbf x\in W\),\(\exists\mathbf x_1\in H,\mathbf y_1\in K\) 使得 \(\bf x=x_\text1+x_\text2\),\(c\mathbf x=c(\mathbf x_1+\mathbf y_1)=c\mathbf x_1+c\mathbf y_1\),于是 \(c\mathbf x\in W\)
于是 W 也是 V 的子空间
2. 零空间,列空间,线性变换
在线性代数的应用中,\(\mathbb R^n\) 的子空间通常由以下两种方式产生:
- 作为线性方程组的解集
- 作为确定向量的线性组合的集合
矩阵的零空间
矩阵 A 的零空间定义为齐次方程 \(A\mathbf x=\mathbf 0\) 的全体解的集合,记作 \(\text{Nul}A=\{\mathbf x~:~\mathbf x\in\mathbb R^n,A\mathbf x=\mathbf 0\}\)
或者描述为 \(\mathbb R^n\) 中通过线性变换 \(\mathbf x\mapsto A\mathbf x\) 映射到 \(\mathbb R^m\) 中的零向量的全体向量 \(\mathbf x\) 的集合(\(\forall \mathbf x\in\text{Nul}A,A\mathbf x=\mathbf 0\))
注:\(\text{Nul}A\) 是线性变换 \(\mathbf x\mapsto A\mathbf x\) 中 \(\mathbf 0\) 的原像的集合
定理
- \(A\in\mathbb R^{m\times n}\) 的零空间 \(\text{Nul}A\) 是 \(\mathbb R^n\) 的一个子空间
- 等价地,m 个方程,n 个未知数的齐次线性方程组 \(A\mathbf x=\mathbf 0\) 的解集是 \(\mathbb R^n\) 的一个子空间
证明:
易知 \(\text{Nul}A\subset\mathbb R^n\),
- 由于 \(A\mathbf 0=\mathbf 0\)(注:左右两边的零向量维数可能不同),所以 \(\mathbf 0\in \text{Nul}A\)
- 若 \(\mathbf u,\mathbf v\in \text{Nul}A\),有 \(A\mathbf u=\mathbf 0,A\mathbf v=\mathbf 0\),于是 \(\mathbf 0=A\mathbf u+A\mathbf v=A(\mathbf u+\mathbf v)\),那么 \(\mathbf u+\mathbf v\in\text{Nul}A\)
- 若 \(\mathbf u\in \text{Nul}A,c\in\mathbb R\),有 \(A\mathbf u=\mathbf 0\),于是 \(A(c\mathbf u)=c(A\mathbf u)=c\mathbf 0=\mathbf 0\),那么 \(c\mathbf u\in\text{Nul}A\)
\(\blacksquare\)
例子
- \(H=(a,b,c,d)\in\mathbb R^4\) 满足方程 \(\begin{cases}a-2b+5c=d\\c-a=b\end{cases}\),那么 H 是 \(\mathbb R^4\) 的子空间
\(\text{Nul}A\) 中的向量与 A 的元素之间没有明显的关系,我们称 \(\text{Nul}A\) 被隐式地定义
\(\text{Nul}A\) 的一个显式刻画
- 使用 [行化简算法],将增广矩阵 \([A~\mathbf 0]\) 变换为简化阶梯型
- 用自由变量表示基本变量得到通解
- 将通解表示为 p 个向量的线性组合,其中每个向量的权是自由变量,而这 p 个向量构成 \(\text{Nul}A\) 的一个生成集(\(\text{Span}\{\mathbf v_1,\dots\mathbf v_p\}=\text{Nul}A\))
注:上述 \(\text{Nul}A\) 的生成集 \(\{\mathbf v_1,\dots\mathbf v_p\}\) 是线性无关的(因为,仅当该生成集的线性组合的权全部为 0 时,该线性组合才为零向量 \(\mathbf 0\))
注2:\(\text{Nul}A\) 包含非零向量时,其生成集的个数等于 \(A\mathbf x=\mathbf 0\) 的自由变量的个数
Tip
- \(\begin{bmatrix}-3&6&-1&1&-7\\1&-2&2&3&-1\\2&-4&5&8&-4\end{bmatrix}\) 的零空间为 \(\text{Span}\{\begin{bmatrix}2\\1\\0\\0\\0\end{bmatrix},\begin{bmatrix}1\\0\\-2\\1\\0\end{bmatrix},\begin{bmatrix}-3\\0\\2\\0\\1\end{bmatrix}\}\)
矩阵的列空间
矩阵 \(A\in\mathbb R^{m\times n}\) 的列空间 \(\text{Col}A\) 由 A 的列的所有线性组合组成的集合
若 \(A=[\mathbf a_1,\dots,\mathbf a_n]\),则 \(\text{Col}A=\text{Span}\{\mathbf a_1,\dots,\mathbf a_n\}\);或者记为 \(\text{Col}A=\{\mathbf b~:~\mathbf b=A\mathbf x,\mathbf x\in\mathbb R^n\}\)
注:\(\text{Col}A\) 是线性变换 \(\mathbf x\mapsto A\mathbf x\) 的值域
定理
矩阵 \(A\in\mathbb R^{m\times n}\) 的列空间是 \(\mathbb R^m\) 的一个子空间
注:根据 4.1 的定理直接有该结论
定理
矩阵 \(A\in\mathbb R^{m\times n}\) 的列空间等于 \(\mathbb R^m\),当且仅当 \(\forall\mathbf b\in\mathbb R^m\),\(A\mathbf x=\mathbf 0\) 有一个解
例子
- 若 \(A\in\mathbb R^{m\times n}\),那么 \(\text{Col}A\) 是 \(\mathbb R^m\) 的子空间,\(\text{Nul}A\) 是 \(\mathbb R^n\) 的子空间
- A 是方阵时,\(\text{Col}A\) 和 \(\text{Nul}A\) 可能具有一些相同的非零向量
- 验证 \(\mathbf u\in\text{Nul}A\):若 \(A\mathbf u=\mathbf 0\) 成立(其中 \(\mathbf u\in\mathbb R^n\));或者验证矩阵方程 \(B\mathbf x=\mathbf u\) 相容(B 由 \(\text{Nul}A\) 的生成集构成)
- 验证 \(\mathbf u\in\text{Col}A\):若矩阵方程 \(A\mathbf x=\mathbf u\) 相容(有解)
零空间,列空间的关系
\(\text{Nul}A\) \(\text{Col}A\) \(\text{Nul}A=\{\mathbf x~:~\mathbf x\in\mathbb R^n,A\mathbf x=\mathbf 0\}\)(隐式定义) \(\text{Col}A=\text{Span}\{\mathbf a_1,\dots,\mathbf a_n\}=\{A\mathbf x~:~\mathbf x\in\mathbb R^n\}\)(显式定义) \(\text{Nul}A\) 是 \(\mathbf R^n\) 的一个子空间 \(\text{Col}A\) 是 \(\mathbf R^m\) 的一个子空间 \(\forall \mathbf u\in\text{Nul}A\),\(A\mathbf u=\mathbf 0\) 成立 \(\forall \mathbf u\in\text{Col}A\),方程 \(A\mathbf x=\mathbf u\) 相容 计算生成集需要对 \([A~\mathbf 0]\) 做行变换以计算通解的线性组合形式 生成集是 A 的各列 易于验证 \(\mathbf u\in\text{Nul}A\) 验证 \(\mathbf u\in\text{Col}A\) 需要对 \([A~\mathbf u]\) 做行变换以判断是否可容 \(\text{Nul}A=\{\mathbf 0\}\),当且仅当方程 \(A\mathbf x=\mathbf 0\) 仅有一个平凡解 \(\text{Col}A=\mathbb R^m\),当且仅当 \(\forall \mathbf b\in\mathbb R^m\),方程 \(A\mathbf x=\mathbf b\) 有解 \(\text{Nul}A=\{\mathbf 0\}\),当且仅当线性变换 \(\mathbf x\mapsto A\mathbf x\) 是一对一的(单射) \(\text{Col}A=\mathbb R^m\),当且仅当线性变换 \(\mathbf x\mapsto A\mathbf x\) 将 \(\mathbb R^n\) 映上到 \(\mathbb R^m\)(满射)
我们经常需要用线性变换而不是矩阵来描述除 \(\mathbb R^n\) 以外的向量空间的子空间;为了更准确,将 1.8 节中给出的定义进行推广
线性变换 && 核/值域
由向量空间 V 映射到向量空间 W 内的线性变换 T 是一个规则,它将 V 中每个向量 \(\mathbf x\) 映射成 W 中唯一向量 \(T(\mathbf x)\),且满足:
- \(\forall \mathbf u,\mathbf v\in V\),\(T(\mathbf u+\mathbf v)=T(\mathbf u)+T(\mathbf v)\)
- \(\forall \mathbf u\in V,c\in\mathbb R\),\(T(c\mathbf u)=cT(\mathbf u)\)
核(零空间):线性变换 T 的核是 \(T(\mathbf u)=\mathbf 0\) 的解集 \(\{\mathbf u~:~T(\mathbf u)=\mathbf 0\}\)(其中 \(\mathbf 0\in W\))
值域:线性变换 T 的值域是 W 中具有 \(T(\mathbf x)\) 的形式的向量的集合 \(\{T(\mathbf u)~:~\mathbf u\in V\}\)
注:若 T 是关于矩阵 A 的矩阵变换,那么 T 的核与值域分别对应 A 的零空间,列空间
证明:线性变换 \(T:V\to W\) 的核 H 是向量空间;只需证明核是向量空间 V 的子空间
假设 \(\mathbf u,\mathbf v\in H,c\in\mathbb R\)
- \(\mathbf 0=0T(\mathbf u)=T(0\mathbf u)=T(\mathbf 0)\),于是 \(\mathbf 0\in V\)
- \(T(\mathbf u)=T(\mathbf v)=\mathbf 0\),有 \(T(\mathbf u)+T(\mathbf v)=\mathbf 0+\mathbf 0\),即 \(T(\mathbf u+\mathbf v)=\mathbf 0\),于是 \(\mathbf u+\mathbf v\in V\)
- \(T(\mathbf u)=\mathbf 0\),有 \(cT(\mathbf u)=c\mathbf 0\),即 \(T(c\mathbf u)=\mathbf 0\),于是 \(c\mathbf u\in V\)
证明:线性变换 \(T:V\to W\) 的值域 H 是向量空间;只需证明值域是向量空间 W 的子空间
假设 \(\forall\mathbf u,\mathbf v\in W,\exists\mathbf s,\mathbf t\in V,\mathbf u=T(\mathbf s),\mathbf v=T(\mathbf t)\),\(c\in\mathbb R\)
根据 V 是线性空间有 \(\mathbf 0,\mathbf s+\mathbf t,c\mathbf s\in V\),于是 \(T(\mathbf 0),T(\mathbf s+\mathbf t),T(c\mathbf s)\in W\)
- \(\mathbf 0=0T(\mathbf u)=T(0\mathbf u)=T(\mathbf 0)\)(注:等式两边的 \(\mathbf 0\) 是不相等的)
- \(\mathbf u+\mathbf v=T(\mathbf s)+T(\mathbf t)=T(\mathbf s+\mathbf t)\in W\)
- \(c\mathbf u=cT(\mathbf s)=T(c\mathbf s)\in W\)
\(\blacksquare\)
例子
- 令 V 是定义在 \([a,b]\) 上所有连续可导的实函数 f 构成的向量空间,W 是定义在 \([a,b]\) 上所有连续的实函数构成的向量空间
- 假设 \(D~:~V\to W\) 是将 V 中的 f 变为其导数 \(f'\) 的变换,可证明该变换是线性变换(\(D(f+g)=D(f)+D(g),D(cf)=cD(f)\))
- 可证明 D 的核是 \([a,b]\) 上的常函数的集合,D 的值域是 \([a,b]\) 上所有连续函数的集合 W
- 微分方程 \(y''+\omega^2y=0\) 的解集就是将 \(y=f(t)\) 映成 \(f''(t)+\omega^2f(t)\) 的线性变换的核
总结
- 矩阵的零空间:\(A\in\mathbb R^{n\times m}\) 的零空间为对应的齐次方程的解集 \(\text{Nul}A=\{\mathbf x~:~\mathbf x\in\mathbb R^n,A\mathbf x=\mathbf 0\}\);\(\forall\mathbf x\in\text{Nul}A\),\(\mathbf x\in\mathbb R^n,A\mathbf x=\mathbf 0\)
- 张成集表示形式:通过[行化简算法]求解 A 对应的齐次方程 \(A\mathbf x=\mathbf 0\) 的解集 \(\mathbf x=\sum\limits_{i=1}^pc_i\mathbf v_i\),那么 \(\text{Nul}A=\text{Span}\{\mathbf v_1,\cdots,\mathbf v_p\}\)(\(\mathbf v_i\) 与自由变量或非主元列一一对应);注意:\(\mathbf v_i\) 并不等于 A 的简化阶梯型 C 的非主元列
- 矩阵的列空间:\(A=[\mathbf a_1~\cdots~\mathbf a_n]\in\mathbb R^{n\times m}\) 的行空间为 A 的列的所有线性组合的集合 \(\text{Col}A=\text{Span}\{\mathbf a_1,\cdots,\mathbf a_n\}=\{A\mathbf x~:~\mathbf x\in\mathbb R^n\}\)
- \(\text{Col}A=\mathbb R^m\) \(\iff\) \(\forall\mathbf b\in\mathbb R^m\),方程 \(A\bf x=b\) 有解
- \(\text{Nul}A\) 是 \(\mathbb R^n\) 的子空间(包含 m 个方程 n 个变量的方程组的解集是 \(\mathbb R^n\) 的子空间);\(\text{Col}A\) 是 \(\mathbb R^m\) 的子空间
- \(\text{Nul}A,\text{Col}A\) 的共同问题:检验法(\(\mathbf u\) 是否在其中),“超空间”判断(是谁的子空间),张成集,等价命题(当 \(\text{Nul}A=\{\mathbf 0\}\) 或 \(\text{Col}A=\mathbb R^m\) 时等价于什么)
- 线性变换:映射或规则 \(T~:~V\to W\) 满足,\(\forall \mathbf u,\mathbf v\in V,c\in\mathbb R\),\(T(\mathbf u+\mathbf v)=T(\mathbf u)+T(\mathbf v),T(c\mathbf u)=cT(\mathbf u)\)
- 核(零空间):线性变换 \(T~:~V\to W\) 的核是 \(T(\mathbf u)=\mathbf 0\) 的解集 \(\{\mathbf u~:~\mathbf u\in V,T(\mathbf u)=\mathbf 0\}\)
- 值域:线性变换 \(T~:~V\to W\) 的值域是 W 中具有 \(T(\mathbf x)\) 的形式的向量的集合 \(\{T(\mathbf u)~:~\mathbf u\in V\}\)
- \(\text{Nul}A,\text{Col}A,核,值域\) 分别是 \(\mathbb R^n,\mathbb R^m,V,W\) 的子空间
一级结论
- \(\forall\mathbf x\in\text{Col}A,\exists\mathbf y\in\mathbb R^n,A\mathbf y=\mathbf x\);\(\forall\mathbf x\in\mathbb R^n,A\mathbf x\in\text{Col}A\)(常用)
- \(\forall\mathbf x\in\text{Nul}A,A\mathbf x=\mathbf 0\)
- \(\text{Nul}A=\{\mathbf 0\}\iff A\mathbf x=\mathbf 0仅有平凡解\iff \mathbf x\mapsto A\mathbf x 是一对一的(单射)\)
- \(\text{Col}A=\mathbb R^m\iff \forall \mathbf b\in\mathbb R^m,A\mathbf x=\mathbf b有解\iff \mathbf x\mapsto A\mathbf x将\mathbb R^n映上到\mathbb R^m(满射)\)(对应于[1.9节]的定理)
二级结论
- \(A\mathbf x=\mathbf b有解\iff\text{rank}[A~~\mathbf b]=\text{rank}A\)
- 若线性变换 \(T~:~\mathbb R^n\to\mathbb R^m\) 是一对一的,那么 T 的核与值域分别是 \(0,n\) 维的
- 若线性变换 \(T~:~\mathbb R^n\to\mathbb R^m\) 是满的,那么 T 的核与值域分别是 \(n-m,m\) 维的
练习
- 证明:\(W=\left\{\begin{bmatrix}a\\b\\c\end{bmatrix}~:~a-3b-c=0\right\}\) 是 \(\mathbb R^3\) 的子空间
- 假设 \(A=\begin{bmatrix}7&-3&5\\-4&1&-5\\-5&2&-4\end{bmatrix},\mathbf v=\begin{bmatrix}2\\1\\-1\end{bmatrix},\mathbf w=\begin{bmatrix}7\\6\\-3\end{bmatrix}\),已知 \(A\mathbf x=\mathbf v,A\mathbf x=\mathbf w\) 都是相容的;那么方程 \(A\mathbf x=\mathbf v+\mathbf w\) 有什么结论?
- 假设 A 是 n 阶方阵,\(\text{Col}A=\text{Nul}A\),证明:\(\text{Nul}A^2=\mathbb R^n\)
- 判断题(\(A\in\mathbb R^{m\times n}\))
- A 的零空间是 \(A\mathbf x=\mathbf 0\) 的解集(Y)
- A 的零空间包含在 \(\mathbb R^m\) 中(X)
- A 的列空间是映射 \(\mathbf x\mapsto A\mathbf x\) 的值域(Y)
- 若 \(A\mathbf x=\mathbf b\) 相容,那么 \(\text{Col}A=\mathbb R^m\)(X)
- 线性变换的核是一个向量空间(Y)
- \(\text{Col}A\) 是对某 \(\mathbf x\) 所有能写成 \(A\mathbf x\) 的向量的集合(Y)
- 零空间是向量空间(Y)
- A 的列空间包含在 \(\mathbb R^m\) 中(Y)
- \(\text{Col}A\) 是 \(A\mathbf x=\mathbf b\) 的所有解的集合(X)
- \(\text{Nul}A\) 是映射 \(\mathbf x\mapsto A\mathbf x\) 的核(Y)
- 一个线性变换的值域是一个向量空间(Y)
- 一个齐次线性微分方程的所有解的集合是一个线性变换的核(Y)
- \(A=\begin{bmatrix}3&-5&-3\\6&-2&0\\-8&4&1\end{bmatrix}\),检验 \(\begin{bmatrix}1\\3\\-4\end{bmatrix}\in\text{Nul}A\)
- \(A=\begin{bmatrix}1&3&5&0\\0&1&4&-2\end{bmatrix}\),计算 \(\text{Nul}A\) 的显式表示(张成空间表示)
- 判断这些空间是否是向量空间:(1) \(\left\{\begin{bmatrix}a\\b\\c\end{bmatrix}~:~\begin{matrix}a+b+c=2\end{matrix}\right\}\),(2) \(\left\{\begin{bmatrix}a\\b\\c\\d\end{bmatrix}~:~\begin{matrix}a-2b=4c\\2a=c+3d\end{matrix}\right\}\),(3) \(\left\{\begin{bmatrix}b-2d\\d\\b+3d\\d\end{bmatrix}~:~b,d\in\mathbb R\right\}\),\(\left\{\begin{bmatrix}b-5d\\2b\\2d+1\\d\end{bmatrix}~:~b,d\in\mathbb R\right\}\)
- 如何计算 \(\mathbb R^{m\times n}\) 的零空间,列空间的维数
- 如何求出某个 \(\text{Nul}A,\text{Col}A\) 中的非零向量?
- 如何判定 \(\mathbf u\in\text{Nul}A\) 或 \(\mathbf v\in\text{Col}A\)?
提示
(1)
- 法1:\(W=\left\{\mathbf x~:~[1~-3~-1]\mathbf x=\mathbf 0\right\}=\text{Nul}[1~-3~-1]\)
- 法2:\(W=\left\{b\begin{bmatrix}3\\1\\0\end{bmatrix}+c\begin{bmatrix}1\\0\\1\end{bmatrix}\right\}=\text{Span}\left\{\begin{bmatrix}3\\1\\0\end{bmatrix},\begin{bmatrix}1\\0\\1\end{bmatrix}\right\}\)
- 法3:根据[4.1]对子空间的定义
(2) 由 \(A\mathbf x=\mathbf v,A\mathbf x=\mathbf w\) 都是相容的,有 \(\mathbf v,\mathbf w\in\text{Col}A\)
而 \(\text{Col}A\) 是向量空间,于是 \(A\mathbf x=\mathbf v+\mathbf w\) 是相容的
(3) 根据列空间的定义有 \(\forall \mathbf x\in\mathbb R^n,A\mathbf x\in\text{Col}A\)
由于 \(\text{Col}A=\text{Nul}A\),有 \(\forall \mathbf x\in\mathbb R^n,A\mathbf x\in\text{Nul}A\),进而 \(A(A\mathbf x)=\mathbf 0\),即 \(A^2\mathbf x=\mathbf 0\),于是 \(\forall\mathbf x\in\mathbb R^n,x\in\text{Nul}A^2\),即 \(\mathbb R^n\subset \text{Nul}A^2\),又 \(\text{Nul}A^2\subset\mathbb R^n\),于是 \(\text{Nul}A^2=\mathbb R^n\)
(5) 参考[4.2一级结论],(6) 参考[4.2总结]
(7) ①和③都是向量空间(分别可以表示成矩阵的零空间,列空间),②和④都不是向量空间
(8) m, n
(9) 计算它们的张成集,然后选定一个适当的权值向量进行构造
(10) \(\mathbf u\in\text{Nul}A\),若 \(A\mathbf u=\mathbf 0\) 成立;\(\mathbf v\in\text{Col}A\),若方程组 \(A\mathbf x=\mathbf v\) 相容
\(\supset\cup\over\cap\subset\) \(\subset\cap\over\cup\supset\)
3. 线性无关集,基
本节确认并研究尽可能“有效地”生成一个向量空间 V 或一个子空间 H 的子集;其关键是线性无关,这与定义在 \(\mathbb R^n\) 中的一样
线性无关,线性相关(关系)
线性无关:V 中向量的一个指标集 \(\{\mathbf v_1,\dots,\mathbf v_p\}\) 称为线性无关的,如果向量方程 \(\sum\limits_{i=1}^pc_i\mathbf v_i=\mathbf 0\) 只有平凡解(零解)(即 \(\forall c_i=0\))
线性相关:\(\{\mathbf v_1,\dots,\mathbf v_p\}\) 称为线性相关的,如果向量方程 \(\sum\limits_{i=1}^pc_i\mathbf v_i=\mathbf 0\) 存在一个非平凡解(非零解)(即 \(\exists c_i\ne0\));此时上式称为线性相关关系
注:向量空间中的线性相关性与 \(\mathbb R^n\) 中的线性相关性是有区别的
例子
- \(\{\mathbf u\}\) 线性无关,当且仅当 \(\mathbf u\ne\mathbf 0\)
- \(\{\mathbf u,\mathbf v\}\) 线性无关,当且仅当 \(\mathbf u\ne\mathbf 0\) 且 \(\forall k\in\mathbb R,\mathbf v\ne k\mathbf u\)
- \(\{\mathbf u\}\) 线性相关,当且仅当 \(\mathbf u=\mathbf 0\)
- \(\{\mathbf u,\mathbf v\}\) 线性相关,当且仅当 \(\mathbf u=\mathbf 0\) 或 \(\exists k\in\mathbb R,\mathbf v=k\mathbf u\)
- S 线性相关,若 \(\mathbf 0\in S\)
线性相关判定定理
向量集合 \(\{\mathbf v_1,\dots,\mathbf v_p\}\)(\(p\ge2\))是线性相关的,
当且仅当 \(\mathbf v_1=\mathbf 0\) 或 存在 \(\mathbf v_i\)(\(i\ge2\))是前 \(i-1\) 个向量的线性组合(即 \(\exists i\ge2\),使得 \(\mathbf v_i\in\text{Span}\{\mathbf v_1,\dots,\mathbf v_{i-1}\}\))
例子
- \(\mathbf p_1(t)=1,\mathbf p_2(t)=t,\mathbf p_3(t)=4-t\),由于 \(\mathbf p_3=4\mathbf p_1-\mathbf p_2\),从而 \(\{\mathbf p_1,\mathbf p_2,\mathbf p_3\}\) 是线性相关的
- 集合 \(\{\sin t,\cos t\}\) 在 \(C[0,1]\) 中是线性无关的,因为 \(\forall t\in[0,1]\),\(\not\exists k\in\mathbb R\) 使得 \(\cos t=k\sin t\)
- 集合 \(\{\sin t\cos t,\sin 2t\}\) 是线性相关的,因为 \(\forall t\in[0,1]\),有 \(\sin 2t=2\sin t\cos t\)
基
令 H 是向量空间 V 的一个子空间;V 中向量的指标集 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_p\}\) 称为 H 的一个基,如果:
- \(\mathcal B\) 是一个线性无关集
- 由 \(\mathcal B\) 生成的子空间与 H 相同,即 \(H=\text{Span}\{\mathbf b_1,\cdots,\mathbf b_p\}\)
等价地,H 的 基 \(\mathcal B\) 就是 H 的线性无关的张成集
注:\(\forall \mathbf x\in H,\exists c_1,\dots,c_p\in\mathbb R\),\(\mathbf x=\sum\limits_{i=1}^pc_i\mathbf b_i\)
例子
- 若 A 是 \(n\times n\) 的可逆矩阵,那么 A 的各列线性无关,且 \(\text{Span}\{\mathbf a_1,\cdots,\mathbf a_n\}=\text{Col}A=\mathbb R^n\),于是 A 的各列是 \(\mathbb R^n\) 的一个基
- 标准基:令 \(\mathbf e_1=\begin{bmatrix}1\\\vdots\\0\end{bmatrix},\cdots,\mathbf e_n=\begin{bmatrix}0\\\vdots\\1\end{bmatrix}\) 是 \(n\times n\) 单位矩阵 \(I_n\) 的各列,那么 \(\{\mathbf e_1,\cdots,\mathbf e_n\}\) 称为 \(\mathbb R^n\) 的标准基
- 令 \(\mathbf v_1=\begin{bmatrix}3\\0\\-6\end{bmatrix},\mathbf v_2=\begin{bmatrix}-4\\1\\7\end{bmatrix},\mathbf v_3=\begin{bmatrix}-2\\1\\5\end{bmatrix}\),判断 \(\{\mathbf v_1,\mathbf v_2,\mathbf v_3\}\) 是否为 \(\mathbb R^3\) 的一个基:
- 法1:由于向量个数和向量维数相同,\(A=[\mathbf v_1,\mathbf v_2,\mathbf v_3]\) 可逆,当且仅当 \(\det A\ne0\)
- 法2:使用[4.3]的线性相关性的判别定理来判断向量组是否线性无关,然后验证向量组是否张成 \(\mathbb R^3\)
- 令 \(S=\{1,t,\cdots,t^n\}\),证明 S 是 \(\mathbb P_n\) 的一个基,此基称为 \(\mathbb P_n\) 的标准基:易知 S 生成 \(\mathbb P_n\);假设 \(c_0,\dots,c_n\) 满足 \(\sum\limits_{i=0}^nc_it^i=\mathbf 0(t)\),由代数基本定理(\(\mathbb P_n\) 中的多项式若有多于 n 个根,那么此多项式为零多项式)可知,\(\forall t\in\mathbb R\),仅当 \(c_0=\cdots=c_n=0\) 时成立;于是,S 是 \(\mathbb P_n\) 的一个基(关于 \(\mathbb P_n\) 中线性无关和生成问题的讨论,使用 [4.4] 的方法处理更合适)
可以发现一个基是一个不包含不必要的向量的“高效率”的生成集;一个基可以通过生成集去掉不必要的向量而构造出来
生成集定理
令 \(S=\{\mathbf v_1,\cdots,\mathbf v_p\}\) 是 V 中的向量集,也是 H 的生成集 \(H=\text{Span}\{\mathbf v_1,\cdots,\mathbf v_p\}\)
- 若 S 中某一个向量 \(\mathbf v_i\) 是 S 中其余向量的线性组合,则 S 去掉 \(\mathbf v_i\) 后的集合仍然可以生成 H
- 若 \(H\ne\{\mathbf 0\}\),则 S 的某一(非空)子集是 H 的一个基
注:\(|S|\ge|\cal B|\)
证:
1) 重排 S 中向量的顺序,使得 \(\mathbf v_p\) 的线性组合,即 \(\mathbf v_p=\sum\limits_{i=1}^{p-1}a_i\mathbf v_i\)(1)
\(\forall\mathbf x\in H\) 有 \(\mathbf x=\sum\limits_{i=1}^pc_i\mathbf v_i\)(2)
联立(1)和(2)有 \(\mathbf x=\sum\limits_{i=1}^{p-1}c_i\mathbf v_i+\sum\limits_{i=1}^{p-1}a_i\mathbf v_i=\sum\limits_{i=1}^{p-1}(c_i+a_i)\mathbf v_i\);即 \(\forall \mathbf x\in H\),\(\mathbf x\in\text{Span}\{\mathbf v_1,\cdots,\mathbf v_{p-1}\}\),于是 \(H\subset \text{Span}\{\mathbf v_1,\cdots,\mathbf v_{p-1}\}\)
而 \(\text{Span}\{\mathbf v_1,\cdots,\mathbf v_{p-1}\}\subset H\),于是 \(\text{Span}\{\mathbf v_1,\cdots,\mathbf v_{p-1}\}=H\)
2) 若生成集 S 是线性无关的,则 S 是 H 的基
否则,根据 1) 的过程重复去掉能表示为其余向量的线性组合的向量,直到生成集线性无关,从而 S 是 H 的一个基;若 S 仅剩一个向量,则该向量是非零向量(因为假定了 \(H\ne\{\mathbf 0\}\)),从而 S 线性无关,于是 S 是 H 的基
\(\blacksquare\)
例子
- \(\mathbf v_1=\begin{bmatrix}0\\2\\-1\end{bmatrix},\mathbf v_2=\begin{bmatrix}2\\2\\0\end{bmatrix},\mathbf v_3=\begin{bmatrix}6\\16\\-5\end{bmatrix}\),\(H=\text{Span}\{\mathbf v_1,\mathbf v_2,\mathbf v_3\}\),证明 \(\text{Span}\{\mathbf v_1,\mathbf v_2,\mathbf v_3\}=\text{Span}\{\mathbf v_1,\mathbf v_2\}\),并求 H 的一个基:
- 讨论 \(\text{Col}A\) 的基
- A 行化简为 B 时,\(A\mathbf x=\mathbf 0\) 和 \(B\mathbf x=\mathbf 0\) 的解集相同(注:齐次方程通常用来表示线性相关关系),因而 \(\sum\limits_{i=1}^nx_i\mathbf a_i=0\) 和 \(\sum\limits_{i=1}^nx_i\mathbf b_i=0\) 也有相同的解集,即 A 的列和 B 的列具有完全相同的线性相关关系
- 尝试计算 \(\text{Col}A\) 的基:(1) \(A=\begin{bmatrix}1&4&0&2&0\\0&0&1&-1&0\\0&0&0&0&1\\0&0&0&0&0\end{bmatrix}\),(2) \(\begin{bmatrix}1&4&0&2&-1\\3&12&1&5&5\\2&8&1&3&2\\5&20&2&8&8\end{bmatrix}\)(提示:两个矩阵行等价)
- 讨论 \(\text{Nul}A\) 的基:参考[4.2]的方法计算 \(\text{Nul}A\) 的生成集时,该集合就已经是线性无关的了,于是便得到了 A 的零空间的基
例子 (2),(3) 的总结如下:
定理
- 矩阵 A 的主元列构成 \(\text{Col}A\) 的一个基
- 矩阵 A 对应的齐次方程的通解中的向量构成 \(\text{Nul}A\) 的一个基
- 等价地,\(\text{Nul}A\) 的生成集就是 \(\text{Nul}A\) 的一个基
注:\(\text{Col}A\),\(\text{Nul}A\) 的基都能用[行化简算法]得到
证:
使用[行化简算法]得到 A 的简化阶梯型 B;由于 B 的主元列中任一向量都不是前面主元列的线性组合,所以 B 中的主元列线性无关
又由 A 行等价于 B,A 中列的任何线性相关关系对应于 B 中列的线性相关关系,所以 A 中的主元列也是线性无关的
而 A 中每个非主元列是 A 中主元列的线性组合,由[生成集定理],A 中非主元列可从 \(\text{Col}A\) 的生成集中去掉,剩下的 A 的主元列是 \(\text{Col}A\) 的一个基
\(\blacksquare\)
Tip
- 警告:当矩阵 A 仅被化简为简化阶梯形时,A 的主元列是明显的;对 \(\text{Col}A\) 的基,要慎重使用本身的主元列,行变换可以改变矩阵的列空间;阶梯形 B 的主元列通常不在 A 的列空间中,比如,例 8 中 B 的列最后一个元素均为零,所以它们不能生成例 9 中的列空间
- 向量空间 V 的子集 S 适当的扩充或缩减向量,可以得到 V 的基
- 基是一个尽可能小的生成集,尽可能大的线性无关集
总结
- 线性无关:向量空间 V 中的指标集 \(\{\mathbf v_1,\dots,\mathbf v_p\}\) 线性无关,若向量方程 \(\sum\limits_{i=1}^pc_i\mathbf v_i=\mathbf 0\) 只有平凡解(零解,\(\forall c_i=0\))
- 线性相关:向量空间 V 中的指标集 \(\{\mathbf v_1,\dots,\mathbf v_p\}\) 线性相关,若向量方程 \(\sum\limits_{i=1}^pc_i\mathbf v_i=\mathbf 0\) 存在一个非平凡解(非零解,\(\exists c_i\ne0\));那么上式称为线性相关关系
- 线性相关判定定理:向量集合 \(\{\mathbf v_1,\dots,\mathbf v_p\}\) 线性相关,当且仅当 \(\mathbf v_1=\mathbf 0\) 或\(\exists i\ge2\), \(\mathbf v_i\) 是前 \(i-1\) 个向量的线性组合(即 \(\exists i\ge2\),使得 \(\mathbf v_i\in\text{Span}\{\mathbf v_1,\dots,\mathbf v_{i-1}\}\),也即 \(\exists i\ge2\) 使得 \(\mathbf v_i=\sum\limits_{j=1}^{i-1}c_i\mathbf v_j\) 相容)
- 基:\(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_p\}\subset H\) 是 V 的子空间 H 的基,若 \(\cal B\) 是 H 的线性无关的张成集(三个性质:线性无关,张成,子集)
- \(\forall \mathbf x\in H,\exists c_1,\dots,c_p\in\mathbb R\),\(\mathbf x=\sum\limits_{i=1}^pc_i\mathbf b_i\),即 \(\forall \mathbf x\in H,\mathbf x\in\text{Span}\{\mathbf v_1,\cdots,\mathbf v_p\}\),即 \(H\subset\text{Span}\{\mathbf v_1,\cdots,\mathbf v_p\}\)
- 生成集定理:假设 \(S\subset H\) 是子空间 H 的张成集,(1) 若 \(\mathbf v_i\in S\) 是 S 中其余向量的线性组合,那么 S 去掉 \(\mathbf v_i\) 仍然可以张成 H,(2) 若 \(H\ne\{\mathbf 0\}\),则 S 的某一(非空)子集是 H 的一个基(其中 \(|S|\ge|\cal B|\))
- 基的例子:\(n\times n\) 可逆矩阵 A 的各列是 \(\text{Col}A\) 的基,\(I_n\) 的各列 \(\left\{\mathbf b_1,\cdots,\mathbf b_n\right\}\)(标准基) 是 \(\mathbb R^n\) 的基;\(S=\{1,t,\cdots,t^n\}\) 是 \(\mathbb P_n\) 的标准基;\(\text{Col}A\) 的基为矩阵 A 的主元列集合(并非 A 的阶梯型的 B 的主元列);\(\text{Nul}A\) 的基为矩阵 A 对应齐次方程的解集中的各向量
- 基是一个尽可能小的生成集,尽可能大的线性无关集(H 的子集 S 能通过适当缩减或扩充向量以得到 H 的基)
- 矩阵列之间的线性相关关系不会因初等变换而改变
一级结论
- 线性无关集 S 是 \(\text{Span}(S)\) 的一组基
- \(\exists c_1,\cdots,c_p\) 使得 \(\sum\limits_{i=1}^pc_i\mathbf v_i=\mathbf 0\)
二级结论
- 假设 H 是向量空间 V 的子空间,S 可以缩减为 H 的一个基,当且仅当 S 能张成 H(满足 \(|S|\ge\dim V\))
- S 缩减为线性无关集 T 后,T 是最大“父空间” V 的一个基,当且仅当 \(|T|=\dim V\)
练习
- \(\mathbf v_1=\begin{bmatrix}1\\-2\\3\end{bmatrix},\mathbf v_2=\begin{bmatrix}-2\\7\\-9\end{bmatrix}\):判断 \(\{\mathbf v_1,\mathbf v_2\}\) 是否是 \(\mathbb R^3\) 或 \(\mathbb R^2\) 的一个基
- \(\mathbf v_1=\begin{bmatrix}1\\-3\\4\end{bmatrix},\mathbf v_2=\begin{bmatrix}6\\2\\-1\end{bmatrix},\mathbf v_3=\begin{bmatrix}2\\-2\\3\end{bmatrix},\mathbf v_4=\begin{bmatrix}-4\\-8\\9\end{bmatrix}\):求 \(\{\mathbf v_1,\mathbf v_2,\mathbf v_3,\mathbf v_4\}\) 生成的子空间 W 的一个基
- \(\mathbf v_1=\begin{bmatrix}1\\0\\0\end{bmatrix},\mathbf v_2=\begin{bmatrix}0\\1\\0\end{bmatrix},H=\left\{\begin{bmatrix}s\\s\\0\end{bmatrix}~:~s\in\mathbb R\right\}\):其中 \(H=\left\{s\mathbf v_1+s\mathbf v_2~:~s\in\mathbb R\right\}\),那么 \(\{\mathbf v_1,\mathbf v_2\}\) 是 H 的一个基吗?
- 假设 V 和 W 是向量空间,\(T:V\to W,U:V\to W\) 是线性变换,\(\{\mathbf v_1,\cdots,\mathbf v_p\}\) 是 V 的一个基,\(\forall i=1..p,T(\mathbf v_i)=U(\mathbf v_i)\),证:\(\forall x\in V,T(\mathbf x)=U(\mathbf x)\)
- 判断题
- 单独一个向量是线性相关的(X)
- 若 \(H=\text{Span}\{\mathbf b_1,\cdots,\mathbf b_p\}\),则 \(\{\mathbf b_1,\cdots,\mathbf b_p\}\) 是 H 的一个基(X)
- 一个 \(n\times n\) 的可逆矩阵的列构成 \(\mathbb R^n\) 的一个基(Y)
- 基是一个尽可能大的生成集(X,参见本节末尾)
- 在某些情形,矩阵列之间的线性相关关系受某种初等行变换影响(X?)
- 子空间 H 中一个线性无关集是 H 的一个基(X)
- 若非零向量的一个有限集合 S 生成一个向量空间 V,则 s 的某子集是 V 的一个基(Y)
- 基是一个尽可能大的线性无关集(Y,参见本节末尾)
- [4.2]描述的对 \(\text{Nul}A\) 产生一个生成集的标准方法有时对产生 \(\text{Nul}A\) 的基不起作用(X?)
- 若 B 是矩阵 A 的阶梯型,则 B 的主元列构成 \(\text{Col}A\) 的一个基(X)
- 给定 \(\mathbb R^n\) 下的向量集 S,如何判断 S 是否为 线性无关集 或 \(\mathbb R^n\) 的张成集?(重要)
- 计算 \(\mathbb R^3\) 上的平面 \(x+2y+z=0\) 中向量的集合的一个基
- 证明:\(S=\{\mathbf v_1,\cdots,\mathbf v_n\}\) 张成 \(\mathbb R^n\),那么 S 是 \(\mathbb R^n\) 的一个基
- 证明:\(S=\{\mathbf v_1,\cdots,\mathbf v_n\}\) 是 \(\mathbb R^n\) 的一个线性无关集,那么 S 是 \(\mathbb R^n\) 的一个基
提示
(1)
- \(\{\mathbf v_1,\mathbf v_2\}\) 不是 \(\mathbb R^3\) 的基(因为对应的齐次方程的矩阵中最多有两行有主元位置,根据[1.4定理2]知该向量组不生成 \(\mathbb R^3\),不满足生成集的其中一个条件)
- \(\{\mathbf v_1,\mathbf v_2\}\) 也不是 \(\mathbb R^2\) 的基(因为 \(\{\mathbf v_1,\mathbf v_2\}\not\subset\mathbb R^2\) 或 \(\mathbf v_1,\mathbf v_2\in\mathbb R^2\),所以该向量组不满足生成集的其中一个条件)
(3) \(\text{Span}\{\mathbf v_1,\mathbf v_2\}=\left\{s\mathbf v_1+t\mathbf v_2~:~s,t\in\mathbb R\right\}\ne H\);\(\{\mathbf v_1,\mathbf v_2\}\) 既不是 H 的子集,又不生成 H,所以 \(\{\mathbf v_1,\mathbf v_2\}\) 不是 H 的一个张成集(进而不是一个基)
(4) 由 \(\{\mathbf v_1,\cdots,\mathbf v_p\}\) 是 V 的一个基,所以 \(\forall \mathbf x\in V,\exists c_1,\dots,c_p\in\mathbb R\),有 \(\mathbf x=\sum\limits_{i=1}^pc_i\mathbf v_i\)
又由 \(T,V\) 是线性变换,有 \(T(\mathbf x)=T(\sum\limits_{i=1}^pc_i\mathbf v_i)=\sum\limits_{i=1}^pc_iT(\mathbf v_i)=\sum\limits_{i=1}^pc_iU(\mathbf v_i)=U(\mathbf x)\)
(6) 假设 S 对应的矩阵是 \(A\in\mathbb R^{n\times|S|}\)
- 法1:假设 \(|S|=n\),A 可逆,当且仅当 S 是线性无关集,并且是张成集;否则 S 既不是线性无关集,也不是张成集
- 法2:\(A 的主元位置个数=|S|\),当且仅当 S 线性无关;\(A 的主元位置个数=n\),当且仅当 S 是 \(\mathbb R^n\) 的一个张成集
- 其他判断:若 \(n<|S|\),则 S 不是线性无关的;若 \(n>|S|\),则 S 不是 \(\mathbb R^n\) 的张成集
注:A 的主元位置个数实质是 \(\text{Col}A\) 的维数
(7) 原方程等价于齐次方程 \(A\mathbf x=[1~~2~~1]\begin{bmatrix}x\\y\\z\end{bmatrix}=0\),解得 \(\begin{bmatrix}x\\y\\z\end{bmatrix}=\begin{bmatrix}-2\\1\\0\end{bmatrix}y+\begin{bmatrix}-1\\0\\1\end{bmatrix}z\),于是 \(\text{Nul}A\) 的基为 \(\left\{\begin{bmatrix}-2\\1\\0\end{bmatrix},\begin{bmatrix}-1\\0\\1\end{bmatrix}\right\}\)
(8),(9): 长度为 n 的集合 S 是 \(\mathbb R^n\) 的张成集 或 线性无关集,等价于 S 对应的矩阵 A 是可逆的,分别等价于 S 是线性无关集 或 张成集,于是 S 是 \(\mathbb R^n\) 的一个基
常见问题总结
- 给定 \(\mathbb R^m\) 中的 S,判断 S 判定是否线性无关,张成 \(\mathbb R^m\)
- 计算基:(1)给定 S,(2)给定 A,求 \(\text{Nul}A,\text{Col}A\) 的基,(3)给定 \(\mathbb R^2,\mathbb R^3\) 上的经过原点的直线或平面
4. 坐标系
为一个向量空间 V 指定一个基 \(\mathcal B\) 的主要原因是,给 V 强加上一个“坐标系”,使得 V 中的每个向量能被一组实数唯一表示
唯一表示定理
假设 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是向量空间 V 的一个基,那么:
\(\forall \mathbf x\in V\),唯一存在 \(c_1,\cdots,c_n\in\mathbb R\),使得 \(\mathbf x=\sum\limits_{i=1}^nc_i\mathbf b_i\)
证:假设还存在一组数 \((d_1,\cdots,d_n)\ne(c_1,\cdots,c_n)\)(即 \(\exists i=1..n,c_i\ne d_i\)),使得 \(\mathbf x=\sum\limits_{i=1}^nd_i\mathbf b_i\)
于是 \(\mathbf x-\mathbf x=\sum\limits_{i=1}^nd_i\mathbf b_i-\sum\limits_{i=1}^nc_i\mathbf b_i\) 或 \(\mathbf 0=\sum\limits_{i=1}^n(d_i-c_i)\mathbf b_i\)
根据 \(\mathcal B\) 是线性无关的,有 \(\forall i=1..n\),\(d_i-c_i=0\) 或 \(d_i=c_i\),与假设矛盾
\(\blacksquare\)
坐标,坐标映射
假设 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是向量空间 V 的一个基,
\(\forall \mathbf x\in V\),唯一存在实数组 \((c_1,\cdots,c_n)\) 使得 \(\mathbf x=\sum\limits_{i=1}^nc_i\mathbf b_i\),
那么 \((c_1,\cdots,c_n)\) 称为 \(\mathbf x\) 相对于基 \(\mathcal B\) 的坐标(向量)(或 \(\mathbf x\) 的 \(\mathcal B-坐标(向量)\)),
记 \([\mathbf x]_{\mathcal B}=\begin{bmatrix}c_1\\\vdots\\c_n\end{bmatrix}\)(于是 \(\mathbf x=[\mathbf b_1~\cdots~\mathbf b_n][\mathbf x]_{\cal B}\))
坐标映射:\(\mathbf x\mapsto[\mathbf x]_{\mathcal B}\)(假设 \(\mathcal B\) 有序或已经指定排列顺序)
例子
- \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\),已知 \(\mathbf x\),计算 \(\mathbf c=[\mathbf x]_{\mathcal B}\)
- 令 \(B=[\mathbf b_1,\cdots,\mathbf b_n]\),求解矩阵方程 \(B\mathbf c=\mathbf x\),得到 \(\mathbf c\)
- \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\),已知 \([\mathbf x]_{\mathcal B}\),计算 \(\mathbf x\)
- \(\mathbf x=[\mathbf b_1,\cdots,\mathbf b_n][\mathbf x]_{\mathcal B}\)
- \(\mathbf x\in\mathbb R^n\) 是 \(\bf x\) 相对于 \(\mathbb R^n\) 的标准基 \(\cal E=\{\bf e_1,\cdots,\bf e_n\}\) 的坐标
坐标的几何意义
坐标变换矩阵
假设 \(\mathcal B=[\bf b_1,\cdots,\bf b_n]\) 是 \(\mathbb R^n\) 上的一个基,
定义从 \(\cal B\) 到 \(\mathbb R^n\) 的标准基 \(\cal E\) 的坐标变换矩阵为 \(P_{\cal B}=[\bf b_1,\cdots,b_n]\),
于是 \(\mathbf x=P_{\mathcal B}[\mathbf x]_{\cal B}\iff \mathbf x=\sum\limits_{i=1} ^nc_i\mathbf b_i\)
可以得到 \(\mathbf x\) 的 \(\cal B-坐标\):\([\mathbf x]_{\cal B}=P_{\mathcal B}^{-1}\mathbf x\)
注:\(P_{\cal B}\) 可逆;\([\mathbf x]_{\cal B}\mapsto\mathbf x\) 和 \(\mathbf x\mapsto[\mathbf x]_{\cal B}\) 都是单射
Tip
- \(\mathbf x=P_{\mathcal B}[\mathbf x]_{\cal B}\) 可以形象地称为“向量的基分解”
坐标映射定理
假设 \(\cal B=\{\bf b_1,\cdots,\bf b_n\}\) 是向量空间 V 的一个基,则坐标映射 \(\mathbf x\mapsto[\mathbf x]_{\cal B}\) 是一个由 V 映上到 \(\mathbb R^n\) 的一对一的线性变换(双射的线性变换)
等价地,若向量空间 V 的基 \(\cal B\) 若含有 n 个向量,那么 V 与 \(\mathbb R^n\) 同构
证:
1) 加法封闭性:
\(\forall \mathbf u,\mathbf v\in V\),\(\mathbf u=\sum\limits_{i=1}^nc_i\mathbf b_i,\mathbf w=\sum\limits_{i=1}^nd_i\mathbf b_i\)
\(\mathbf u+\mathbf w=\sum\limits_{i=1}^n(c_i+d_i)\mathbf b_i\),
于是 \([\mathbf u+\mathbf w]_{\cal B}=\begin{bmatrix}c_1+d_1\\\vdots\\c_d+d_n\end{bmatrix}=\begin{bmatrix}c_1\\\vdots\\c_d\end{bmatrix}+\begin{bmatrix}d_1\\\vdots\\d_n\end{bmatrix}=[\mathbf u]_{\cal B}+[\mathbf w]_{\cal B}\)
2) 标量乘法封闭性:
\(\forall k\in\mathbb R,\mathbf u\in V\),\(\mathbf u=\sum\limits_{i=1}^nc_i\mathbf b_i\)
\(k\mathbf u=k\sum\limits_{i=1}^nc_i\mathbf b_i=\sum\limits_{i=1}^n(kc_i)\mathbf b_i\),
于是 \([r\mathbf u]_{\cal B}=\begin{bmatrix}rc_1\\\vdots\\rc_n\end{bmatrix}=r\begin{bmatrix}c_1\\\vdots\\c_n\end{bmatrix}=r[\mathbf u]_{\cal B}\)
3) 坐标映射是一对一的,并且将 V 映上到 \(\mathbb R^n\):详见练习 23 和 24
\(\blacksquare\)
Tip
- 上述定理的坐标映射是由 V 到 \(\mathbb R^n\) 上同构的重要例子
- 一般而言,从一个向量空间 V 映上到另一个向量空间 W 的一对一线性变换称为从 V 和 W 上的一个同构(isomorphism)
- V 和 W 的记号和术语可能不同,但这两个空间作为向量空间则不加以区分(每一个在 V 中向量空间的计算可以完全相同地出现在 W 中,反之亦然;参见[习题 25/26])
例子
- \(\mathbb P_3\) 的标准基为 \(\mathcal B=\{1,t,t^2,t^3\}\)
- \(\forall \mathbf p\in\mathbb P_3,t\in\mathbb R\),\(\mathbf p(t)=a_0+a_1t+a_2t^2+a_3t^3\),\([\mathbf p(t)]_{\cal B}=(a_0,a_1,a_2,a_3)\)
- 坐标映射 \(\mathbf p\mapsto[\mathbf p]_{\cal B}\) 是 \(\mathbb P_3\) 到 \(\mathbb R^4\) 的同构
- 推广:\(\mathbb P_n\) 与 \(\mathbb R^{n+1}\) 同构
- 证明 \(1+2t^2,4+t+5t^2,3+2t\) 是线性相关:通过坐标映射 \(\mathbf p\mapsto[\mathbf p]_{\cal B}\) 得到 \((1,0,2),(4,1,5),(3,2,0)\);将这些向量写成矩阵 A 的列并行,化简齐次方程 \(A\mathbf x=\mathbf 0\) 的增广矩阵:
- \(\begin{bmatrix}1&4&3&0\\0&1&2&0\\2&5&0&0\end{bmatrix}\sim\begin{bmatrix}1&4&3&0\\0&1&2&0\\0&0&0&0\end{bmatrix}\),即 A 的列线性相关,进而对应的多项式也线性相关
- 事实上,容易检查线性相关关系 \(3+2t=2(4+t+5t^2)-5(1+2t^2)\)
- \(\mathbf v_1=\begin{bmatrix}3\\6\\2\end{bmatrix},\mathbf v_2=\begin{bmatrix}-1\\0\\1\end{bmatrix},\mathbf x=\begin{bmatrix}3\\12\\7\end{bmatrix}\),\(\cal B\) 是 \(H=\text{Span}\{\mathbf v_1,\mathbf v_2\}\) 的一个基:\(\mathbf x\) 的 \(\cal B-坐标\) 为 \([\mathbf x]_{\cal B}=\begin{bmatrix}2\\3\end{bmatrix}\)(通过解非齐次方程)
- 观察到 \(\mathbb R^3\) 上的子空间 H 是与 \(\mathbb R^2\) 同构的平面
总结
- 唯一表示定理,坐标(向量),坐标映射:假设 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是向量空间 V 的一个基,那么 \(\forall \mathbf x\in V\),唯一存在实数组 \((c_1,\cdots,c_n)\) 使得 \(\mathbf x=\sum\limits_{i=1}^nc_i\mathbf b_i\);其中 \(\mathbf x\) 的 \(\cal B-坐标向量\) 为该实数组,记作 \([\mathbf x]_{\cal B}=(c_1,\cdots,c_n)\);坐标映射定义为 \(\mathbf x\mapsto[\mathbf x]_{\mathcal B}\)(\(\mathbb R^n\) 上的坐标映射为 \([\mathbf x]_{\cal B}=P_{\cal B}^{-1}\mathbf x\))
- 坐标变换矩阵:假设 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是 \(\mathbb R^n\) 的一个基,那么[唯一表示定理]可记为 \(\mathbf x=P_{\cal B}[\mathbf x]_{\cal B}\),其中 \(P_{\cal B}=[\mathbf b_1~\cdots~\mathbf b_n]\) 定义为从 \(\cal B\) 到 \(\cal E\) 的坐标变换矩阵(注意:[唯一表示定理]表达了坐标映射的逆,而且 \(P_{\cal B}\) 可逆;\(\cal E\) 为 \(\mathbb R^n\) 上的标准基)
- 坐标映射定理:假设 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是向量空间 V 的一个基,那么坐标映射 \(\mathbf x\mapsto[\mathbf x]_{\mathcal B}\) 是由 V 映上到 \(\mathbb R^n\) 的一对一的线性变换(双射线性变换);即若向量空间 V 的基 \(\cal B\) 有 n 个向量,那么 V 与 \(\mathbb R^n\) 同构(或者 V 与 \(\mathbb R^{\dim V}\) 同构)
- 同构:从一个向量空间 V 映上到另一个向量空间 W 的一对一线性变换称为从 V 和 W 上的一个同构;每一个在 V 中向量空间的计算可以完全相同地出现在 W 中,反之亦然
- 同构的例子:\(\mathbb P_n\) 与 \(\mathbb R^{n+1}\) 同构
一级结论
- 根据[坐标映射定理],若存在 V 的一个基 \(\cal B\),使得 \(\exists \mathbf v\in V,[\mathbf v]_{\cal B}\in\mathbb R^n\),那么 V 与 \(\mathbb R^n\) 同构
二级结论
- 假设 \(\cal B\) 是子空间 H 的一个基,那么坐标映射 \(\mathbf x\mapsto[\mathbf x]_{\cal B}\) 指的是变换 \(H\to\mathbb R^{\dim H}\)
练习
- \(\mathbf b_1=\begin{bmatrix}1\\0\\0\end{bmatrix},\mathbf b_2=\begin{bmatrix}-3\\4\\0\end{bmatrix},\mathbf b_3=\begin{bmatrix}3\\-6\\3\end{bmatrix},\mathbf x=\begin{bmatrix}-8\\2\\3\end{bmatrix}\)
- 证明 \(\mathcal B=\{\mathbf b_1,\mathbf b_2,\mathbf b_3\}\) 是 \(\mathbb R^3\) 的一个基
- 求由 \(\mathcal B\) 到标准基 \(\cal E\) 的坐标变换矩阵
- 求 \(\mathbb R^3\) 中 \(\mathbf x\) 与 \([\mathbf x]_{\cal B}\) 相关联的方程
- 求 \([\mathbf x]_{\cal B}\)
- \(\mathcal B=\{1+t,1+t^2,t+t^2\}\) 是 \(\mathbb P_2\) 的一个基,求 \(\mathbf p(t)=6+3t-t^2\) 关于 \(\cal B\) 的坐标向量
- 判断题
- \(\mathbf x\in V\) 且 \(\cal B\) 包含 n 个向量,则 \([\mathbf x]_{\cal B}\in\mathbb R^n\)(Y)
- 若 \(P_{\cal B}\) 是坐标变换矩阵,则 \(\forall\mathbf x\in V,[\mathbf x]_{\cal B}=P_{\cal B}\mathbf x\)(X)
- \(\mathbb P_3\) 与 \(\mathbb R^3\) 同构(X)
- 若 \(\cal B\) 是 \(\mathbb R^n\) 的标准基,则 \(\forall \mathbf x\in\mathbb R^n\),\(\mathbf x=[\mathbf x]_{\cal B}\)(Y)
- 对应 \([\mathbf x]_{\cal B}\mapsto\mathbf x\) 称为坐标映射(X)
- 在某些情况下,\(\mathbb R^3\) 中的平面与 \(\mathbb R^2\) 同构(Y)
- 已知基和坐标向量 \(\mathcal B=\left\{\begin{bmatrix}3\\-5\end{bmatrix},\begin{bmatrix}-4\\6\end{bmatrix}\right\},[\mathbf x]_{\cal B}=\begin{bmatrix}5\\3\end{bmatrix}\);计算 \(\mathbf x\)
- 已知基和向量 \(\mathcal B=\left\{\begin{bmatrix}1\\-3\end{bmatrix},\begin{bmatrix}2\\-5\end{bmatrix}\right\},\mathbf x=\begin{bmatrix}-2\\1\end{bmatrix}\);计算 \([\mathbf x]_{\cal B}\)
- 给定 \(\mathbb R^n\) 的基 \(\cal B\),求从 \(\cal B\) 到 \(\cal E\) 的坐标变换矩阵 \(P_{\cal B}\)
- \(\mathbf B=\{1+t^2,t+t^2,1+2t+t^2\}\) 是 \(\mathbb P_2\) 的一个基,求 \(\mathbf p(t)=1+4t+7t^2\) 关于 \(\cal B\) 的坐标向量
- 证明:若 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是向量空间 V 的一个基,那么 \(\forall i=1..n,[\mathbf b_i]_{\cal B}=\mathbf e_i\)
- 证明:若向量空间 V 的有限集 S,满足 \(\forall \mathbf x\in V\),\(\mathbf x\) 可以唯一表示为 S 中元素的线性组合,那么 S 是 V 的一个基(唯一存在定理的逆定理)
- 证明:\(\{\mathbf v_1,\cdots,\mathbf v_n\}\) 是向量空间 V 的一个线性相关生成集,那么 \(\forall\mathbf w\in V\),\(\mathbf w\) 可以表示为多种 \(\mathbf v_1,\cdots,\mathbf v_n\) 的线性组合
- 重要证明(假设 V 是向量空间,\(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是 V 的一个基,坐标映射为 \(\mathbf x\mapsto [\mathbf x]_{\cal B}\))
- 证明:坐标映射是一对一的(即 \(\forall \mathbf u,\mathbf v\in V,[\mathbf u]_{\cal B}=[\mathbf v]_{\cal B}\),使得 \(\mathbf u=\mathbf v\))
- 证明:坐标映射是映上到 \(\mathbb R^n\) 的(即 \(\forall \mathbf y\in\mathbb R^n\),\(\exists\mathbf u\in V,[\mathbf u]_{\cal B}=\mathbf y\))
- 证明:V 中的子集 \(\{\mathbf u_1,\cdots,\mathbf u_p\}\) 线性无关,当且仅当坐标向量 \(\{[\mathbf u_1]_{\cal B},\cdots,[\mathbf u_p]_{\cal B}\}\) 也线性无关(提示:坐标映射是一对一的,因此 \(\begin{cases}\sum\limits_{i=1}^pc_i\mathbf u_i=\mathbf 0\\ [\sum\limits_{i=1}^pc_i\mathbf u_i]_{\cal B}=[\mathbf 0]_{\cal B}\end{cases}\) 这两个方程有相同的解)
- 证明:假设 \(\mathbf u_1,\cdots,\mathbf u_p,w\in V\),\(\mathbf w\) 是 \(\mathbf u_1,\cdots,\mathbf u_p\) 的线性组合,当且仅当 \([\mathbf w]_{\cal B}\) 是坐标向量 \([\mathbf u_1]_{\cal B},\cdots,[\mathbf u_p]_{\cal B}\) 的线性组合
提示
(1)
1) \(P_{\cal B}=[\mathbf b_1,\mathbf b_2,\mathbf b_3]\) 行等价于单位矩阵是明显的,根据[可逆矩阵定理],\(P_{\cal B}\) 可逆,且它的列构成 \(\mathbb R^3\) 的一个基
2) \(P_{\cal B}=\begin{bmatrix}1&-3&3\\0&4&-6\\0&0&3\\\end{bmatrix}\)
3) \(\mathbf x=P_{\cal B}[\mathbf x]_{\cal B}\)
4) 使用[行化简算法]直接计算 \([\mathbf x]_{\cal B}\),或者计算 \(P_{\cal B}^{-1}\) 得到 \([\mathbf x]_{\cal B}=P_{\cal B}^{-1}\mathbf x\)
(2) \(\mathbb P_2\) 与 \(\mathbb R^3\) 同构,设 \(\mathcal B'=\left\{\begin{bmatrix}1\\1\\0\end{bmatrix},\begin{bmatrix}1\\0\\1\end{bmatrix},\begin{bmatrix}0\\1\\1\end{bmatrix}\right\},\mathbf p'=\begin{bmatrix}6\\3\\-1\end{bmatrix}\)
\([\mathbf p']_{\cal B'}\) 可以通过 \(P_{\cal B'}[\mathbf p']_{\cal B'}=\mathbf p'\) 使用[行化简算法]解出
解得 \([\mathbf p']_{\cal B'}=(-5,2,1)\),于是 \([\mathbf p(t)]_{\cal B}=(-5,2,1)\)
5. 向量空间的维数
定理1
假设向量空间 V 具有一组基 \(\cal B=\{\bf b_1,\cdots,b_n\}\),若 V 的一个子集 S 包含大于 n 个向量,那么该集合线性相关
推论:V 的线性无关集由不大于 n 个的向量所组成
注:该定理可以推广到 V 的无穷集中
令 \(\{\bf u_1,\cdots,u_p\}\) 是 V 中一个含有不少于 \(n+1\) 个向量的集合(\(p\ge n+1\)),
由于坐标向量 \([\mathbf u_1]_{\cal B},\cdots,[\mathbf u_p]_{\cal B}\) 的个数(p)多于每个向量中元素的个数(n),所以 \([\mathbf u_1]_{\cal B},\cdots,[\mathbf u_p]_{\cal B}\) 线性相关
于是 \(\exists c_i\ne0,\sum\limits_{i=1}^pc_i[\mathbf u_i]_{\cal B}=\mathbf 0\),根据坐标映射是线性变换有 \([\sum\limits_{i=1}^pc_i\mathbf u_i]_{\cal B}=\mathbf 0\)
上式右边的零向量展示了从 \(\cal B\) 中的基向量构建向量 \(\sum\limits_{i=1}^pc_i\mathbf u_i\) 所需的 n 个权,即 \(\sum\limits_{i=1}^pc_i\mathbf u_i=\sum\limits_{i=1}^n0\mathbf b_i=\mathbf 0\)
因为 \(\exists c_i\ne0\),所以 \(\{\mathbf u_1,\cdots,\mathbf u_p\}\) 线性相关
\(\blacksquare\)
定理2
向量空间 V 有一组基含有 n 个向量,那么 V 的每一组基恰好有 n 个向量
有限维,无穷维;维数
- 有限维:若 V 由一个有限集生成,则 V 称为有限维的,V 的维数记为 \(\dim V\)(V 的基中向量的个数)
- 无穷维:若 V 不是由一个有限集生成,则 V 称为无穷维的
例子
- 零子空间的维数为 \(\dim\{\mathbf 0\}=0\)
- \(\mathbb R^n,\mathbb P_n,\mathbb P,C[a,b]\) 的维数分别为 \(\dim \mathbb R^n=n,\dim\mathbb P_n=n+1,\dim\mathbb P=+∞,\dim C[a,b]=+∞\)
- \(\dim\text{Span}\{\mathbf v_1,\mathbf v_2\}=2\)(\(\mathbf v_1,\mathbf v_2\) 线性无关)
- \(H=\left\{\begin{bmatrix}a-3b+6c\\5a+4d\\b-2c-d\\5d\end{bmatrix}~:~a,b,c,d\in\mathbb R\right\}\),计算 \(\dim H\)
- 易知 H 的生成集有 4 个向量,根据[线性相关判定定理]和[生成集定理],剔除“不必要的”向量得到线性无关集,即得到基
- 经过计算 \(\dim H=3\)
- 将 \(\mathbb R^3\) 按维数分类:
- 零维子空间:\(\{\mathbf 0\}\)
- 一维子空间:\(\text{Span}\{\mathbf v\}\)(\(\mathbf v\ne\mathbf 0\)),几何上表示经过原点的直线
- 二维子空间:\(\text{Span}\{\mathbf u,\mathbf v\}\)(\(\mathbf u,\mathbf v\) 线性无关),几何上表示经过原点的平面
- 三维子空间:\(\text{Span}\{\mathbf u,\mathbf v,\mathbf w\}\)(\(\mathbf u,\mathbf v,\mathbf w\) 线性无关),即 \(\mathbb R^3\) 本身
定理3
令 H 是有限维向量空间 V 的子空间,则 H 中任一个线性无关集 S 均可扩充为 H 的一个基
H 也是有限维的,并且 \(\dim H\le\dim V\)
1) 若 \(H=\{\mathbf 0\}\),有 \(\dim H=0\le\dim V\)
2) 否则,令 \(S=\{\mathbf u_1,\cdots,\mathbf u_k\}\) 是 H 的任一线性无关集
若 S 生成 H,则 S 是 H 的一个基
否则,\(\exists \mathbf u_{k+1}\in H,\mathbf u_{k+1}\not\in\text{Span}S\),蕴涵 \(u_{k+1}\) 不是 \(\{\mathbf u_1,\cdots,\mathbf u_k\}\) 的线性组合,而 \(\{\mathbf u_1,\cdots,\mathbf u_k,\mathbf u_{k+1}\}\) 是线性无关的
只要这个新集合不生成 H,我们就可以继续扩充 S 到 H 中一个更大的线性无关集,根据[4.5定理1],该线性无关集的维数不大于 V 的维数,所以 S 的扩充最终生成 H 而且是 H 的一个基,同时 \(\dim H\le \dim V\)
\(\blacksquare\)
基定理
假设 V 是 p 维向量空间(\(p\ge1\)),S 是含有 p 个元素的 V 的子集
若 S 是线性无关集或 V 的生成集,那么 S 是 V 的一个基
证由[4.5定理2],含 p 个元素的线性无关集 S 可以扩充为 P 的一个基;但由于 \(\dim V=p\):因此基必须恰好包含 p 个向量;所以 S 己经是的一个基,现假设 S 含有 p 个元素且生成 V;因为 V 是非零的,故生成集定理蕴涵 S 的一个子集S'是 V 的一个基,因为 \(\dim V=p\),故 S' 一定包含 p 个向量,从而 \(S=S'\)
\(\blacksquare\)
例子
- 结合基的定义,V 的子集 S 若满足以下条件之二,那么 S 是 V 的一个基:(1) \(|S|=\dim V\),(2) \(\text{Span}S=V\),(3) S 是线性无关集
\(\text{Nul}A,\text{Col}A\) 的维数
- \(\dim\text{Nul}A\) 为 \(A\mathbf x=\mathbf 0\) 中自由变量的个数
- \(\dim\text{Col}A\) 为 A 中主元列的个数
总结
- 定理1:向量空间 V 有一组基含有 n 个向量,若 V 的一个子集 S 包含大于 n 个向量,那么 S 线性相关
- 定理2:向量空间 V 有一组基含有 n 个向量,那么 V 的每一组基恰好有 n 个向量
- 有限维,维数,无穷维:若 V 由有限集生成,则 V 称为有限维的,V 的维数为 \(\dim V\)(即 V 的基中向量的个数);若 V 不是由一个有限集生成,则 V 称为无穷维的
- 维数的例子:\(\dim\{\mathbf 0\}=0\),\(\dim\mathbb R^n=n\),\(\dim\mathbb P_n=n+1\),\(\dim\mathbb P=∞\),\(\dim C[a,b]=+∞\),\(\dim\text{Span}\{\mathbf v_1,\cdots,\mathbf v_p\}=n\)(其中 \(\{\mathbf v_1,\cdots,\mathbf v_n\}\) 是最大线性无关子集,且 \(n\le p\));\(\dim\text{Nul}A\) 为 \(A\mathbf x=\mathbf 0\) 中自由变量的个数,\(\dim\text{Col}A\) 为 A 中主元列的个数
- 子空间按维数分类:可以将维数为 n 的向量空间的子空间分为 \(n+1\) 类,分别为 \(0,1,\cdots,n\) 维子空间(其中零维子空间为 \(\{0\}\),n 维子空间为 V 本身)
- 定理3:假设 H 是有限维向量空间 V 的子空间,则 H 中任一个线性无关集 S 均可扩充为 H 的一个基,且 H 的也是有限维的,并且 \(\dim H\le \dim V\)
- 基定理:假设 V 是 n 维向量空间(\(n\ge1\)),S 是含有 n 个元素的 V 的子集,若 S 是线性无关集或 V 的生成集,那么 S 是 V 的一个基
一级结论
- 向量空间 V 的子集 S 是 V 的一个基,若同时满足以下任意两个条件:(1) \(|S|=\dim V\),(2) S 是线性无关集,(3) \(\text{Span}(S)=V\)
- \(\mathbb R^n\) 的一维子空间是 \(\mathbb R^n\) 中的直线(逆命题不成立)
- \(\mathbb R^n\) 的 \(n-1\) 维子空间,等价于包含 n 个未知量的齐次线性方程
习题
- 判断题(V 是非零有限维向量空间)
- \(\dim V=p\),S 是 V 的一个线性相关的子集,那么 S 包含多于 p 个向量(X)
- 若 S 生成 V,T 是 V 的一个子集且含有的向量个数多于 S 中的向量个数,那么 T 是线性相关的(Y)
- 假设 H 和 K 是向量空间 V 的子空间,[4.1习题32]说明了 \(H\cap K\) 也是 V 的子空间,证明:\(\dim(H\cap K)\le\dim H\)
- 判断题1
- 矩阵主元列的个数等于列空间的维数(Y)
- \(\mathbb R^3\) 中的平面是 \(\mathbb R^3\) 的二维子空间(X)
- 向量空间 \(\mathbb P_4\) 的维数为 4(X)
- 若 \(\dim V=n\),S 是 V 中一个线性无关集,则 S 是 V 的一个基(X)
- \(\{\mathbf v_1,\cdots,\mathbf v_p\}\) 生成一个有限维向量空间 V,T 是 V 中多于 p 个向量的集合,则 T 是线性相关的(Y)
- \(\mathbb R^2\) 是 \(\mathbb R^3\) 的一个二维子空间(X)
- 方程 \(A\mathbf x=\mathbf 0\) 中变量个数等于 \(\text{Nul}A\) 的维数(X)
- 一个向量空间是无穷维的,如果它由一个无限集生成(X)
- 若 \(\dim V=n\),S 生成 V,则 S 是 V 的一个基(X)
- \(\mathbb R^3\) 只有一个三维子空间,即 \(\mathbb R^3\) 自身(Y)
- 判断题2
- 若存在集合 \(\{\mathbf v_1,\cdots,\mathbf v_p\}\) 生成 V,则 \(\dim V\le p\)(Y)
- 若 V 中存在线性无关集 \(\{\mathbf v_1,\cdots,\mathbf v_p\}\),则 \(\dim V\ge p\)(Y)
- 若 \(\dim V=p\),则 V 存在一个 \(p+1\) 个向量的生成集(Y)
- 若 V 中存在一个线性相关集 \(\{\mathbf v_1,\cdots,\mathbf v_p\}\),则 \(\dim V\le p\)(X)
- 若 V 中任意由 p 个元素组成的集合均不能生成 V,则 \(\dim V>p\)(Y)
- 若 \(p\ge 2\),\(\dim V=p\),则每个由 \(p-1\) 个非零向量构成的集合是线性无关的(X)
- 计算子空间的基,维数:(1) \(\left\{\begin{bmatrix}s-2t\\s+t\\3t\end{bmatrix}~:~s,t\in\mathbb R\right\}\),(2) \(\left\{\begin{bmatrix}2c\\a-b\\b-3c\\a+2b\end{bmatrix}~:~a,b,c\in\mathbb R\right\}\),(3) \(\{(a,b,c)~:~a-3b+c=0,b-2c=0,2b-c=0\}\)
- 求 \(\mathbb R^3\) 中所有第一个和第三个元素相等的子空间的维数
- 求 \(\begin{bmatrix}1\\0\\2\end{bmatrix},\begin{bmatrix}3\\1\\1\end{bmatrix},\begin{bmatrix}9\\4\\-2\end{bmatrix},\begin{bmatrix}-7\\-3\\1\end{bmatrix}\) 生成的子空间的维数
- 计算 \(\text{Nul}A,\text{Col}A\) 的维数:(1) \(A=\begin{bmatrix}1&-6&9&0&-2\\0&1&2&-4&5\\0&0&0&5&1\\0&0&0&0&0\end{bmatrix}\),(2) \(A=\begin{bmatrix}1&0&9&5\\0&0&1&-4\end{bmatrix}\),(3) \(A=\begin{bmatrix}1&-1&0\\0&4&7\\0&0&5\end{bmatrix}\)
- 证明:前 4 个艾尔米特(Hermite)多项式 \(1,2t,-2+4t^2,-12t+8t^3\) 构成 \(\mathbb P_3\) 的一个基
- 证明:前 4 个拉盖尔(Laguerre)多项式 \(1,1-t,2-4t+t^2,6-18t+9t^2-t^3\) 构成 \(\mathbb P_3\) 的一个基
提示
(1)
- \(S=\{\mathbf 0\}\) 与命题矛盾
- 根据[生成集定理],S 的向量个数不小于基 \(\cal B\) 的向量个数,即 \(|S|\ge|\cal B|\);又 \(|T|>|S|\),有 \(|T|>|\cal B|\),根据[4.5定理1],T 是线性相关的
(2) 设 \(S=\{\mathbf v_1,\cdots,\mathbf v_p\}\) 是 \(H\cap K\) 的一组基,则 S 是 H 的线性无关子集
根据[4.5定理3],S 能被扩充为 H 的一组基;由于子空间的维数等于基的向量数,故 \(\dim(H\cap K)=p\le\dim H\)
(5) 等价于求 \(\text{Col}A\) 或 \(\text{Nul}A\) 的维数
(6),(7) 等价于求 \(\dim\text{Col}A\)
6. (矩阵的)秩
设想一个 \(40\times 50\) 矩阵 A 中放置 \(2000\) 个随机数,然后确定 A 中线性无关列的最大个数,以及 \(A^T\) 的线性无关列的最大个数(即 A 中线性无关行的最大个数)
一个事实就是,这两个数相等,为此我们引入矩阵 A 的秩;为解释该现象,需要检查由 A 的行生成的子空间
行空间
\(A\in\mathbb R^{m\times n}\) 的行向量的线性组合的集合,称为 A 的行空间,记为 \(\text{Row}A\)
注:“行向量”指的是 A 的行构成的向量(而非一个矩阵);\(\text{Row}A=\text{Col}A^T\)
例子
- 若 \(A=(\mathbf r_1,\cdots,\mathbf r_m)^T\),那么 \(\text{Row}A=\text{Span}\{\mathbf r_1,\cdots,\mathbf r_m\}\)
定理
- 若两个矩阵 A和 B 行等价,那么它们的行空间相同(\(\text{Row}A=\text{Row}B\))
- 若 B 是阶梯型矩阵,那么 B 的非零行构成 A 的行空间的一个基,同时也是 B 的行空间的一个基
(1) B 由 A 经行变换得到,那么 B 的行是 A 的行的线性组合,于是 B 的行的任意线性组合也是 A 的行的线性组合,从而 \(\text{Row}A\subset\text{Row}B\)
由于行变换可逆,同理有 \(\text{Row}B\subset\text{Row}A\)
(2) 若 B 是阶梯型,则其非零行线性无关(任意一个非零行不为其上面的非零行的线性组合)
于是 B 的非零行构成 B 的行空间的一个基,也是 A 的行空间的一个基
\(\blacksquare\)
例子
- 求 \(A=\begin{bmatrix}-2&-5&8&0&-17\\1&3&-5&1&5\\3&11&-19&7&1\\1&7&-13&5&-3\end{bmatrix}\) 的行空间,列空间,零空间的基
- A 通过行化简得到阶梯型 B,其非零行为 \(\text{Row}A\) 的基;B 的主元位置确定 A 的主元位置,从而确定 A 的主元列,即为 \(\text{Col}A\) 的基
- B 再次通过行化简得到简化阶梯型 C,\(A\mathbf x=\mathbf 0\) 等价于 \(C\mathbf x=\mathbf 0\),其解空间的基即为 \(\text{Nul}A\) 的基
- 注:一般 \(\text{Row}A,\text{Nul}A\) 不直接与 A 的元素相关,而 \(\text{Col}A\) 直接与 A 的元素相关
- \(\begin{bmatrix}-2&-5&8&0&-17\\1&3&-5&1&5\\3&11&-19&7&1\\1&7&-13&5&-3\end{bmatrix}\sim\begin{bmatrix}1&3&-5&1&5\\0&1&-2&2&-7\\0&0&0&-4&20\\0&0&0&0&0\end{bmatrix}\sim\begin{bmatrix}1&0&1&0&1\\0&1&-2&0&3\\0&0&0&1&-5\\0&0&0&0&0\end{bmatrix}\)
- \(\text{Row}A,\text{Col}A,\text{Nul}A\) 的基分别为:\(\{(1,3,-5,1,5),(0,1,-2,2,-7),(0,0,0,-4,20)\}\),\(\left\{\begin{bmatrix}-2\\1\\3\\1\end{bmatrix},\begin{bmatrix}-5\\3\\11\\7\end{bmatrix},\begin{bmatrix}0\\1\\7\\5\end{bmatrix}\right\}\),\(\left\{\begin{bmatrix}-1\\2\\1\\0\\0\end{bmatrix},\begin{bmatrix}-1\\-3\\0\\5\\1\end{bmatrix}\right\}\)
秩,秩定理
秩:矩阵 A 的秩定义为 A 的列空间的维数(\(\dim\text{Col}A\)),记作 \(\text{rank}A\);零空间的维数称为 A 的零维
秩定理:矩阵 \(A\in\mathbb R^{m\times n}\) 的列空间和行空间的维数相等(\(\dim\text{Col}A=\dim\text{Row}A\)),这个公共的秩数(即 A 的秩)还等于 A 的主元位置的个数,且满足 \(\text{rank}A+\dim\text{Nul}A=n\)
(1) 由[4.3定理],\(\text{rank}A\) 是 A 中主元列的个数,也是 A 的阶梯型 B 中主元位置的个数
B 的每个主元与非零行一一对应,这些行也构成 A 的行空间的基,进而 \(\text{rank}A\) 也等于 A 的行空间的维数
(2) 由[4.5节],\(\text{Nul}A\) 的维数等于方程 \(A\mathbf x=\mathbf 0\) 中自由变量的个数,进而 \(\text{Nul}A\) 的维数是 A 中非主元列的个数
而 \(\{主元列个数\}+\{非主元列个数\}=\{列的个数\}\),得证
\(\blacksquare\)
例子
- A 是 \(7\times 9\) 矩阵具有二维零空间(\(\text{Nul}A=2\)),那么 \(\text{rank}A=9-\text{Nul}A=7\)
- 重要结论:若 A 是 \(m\times n\),那么满足事实:\(\text{rank}A+\dim\text{Nul}A=n\),\(\text{rank}A\le\min\{m,n\}\),蕴涵 \(\dim\text{Nul}A\ge \max\{n-m,0\}\)
- \(6\times 9\) 矩阵不可能有二维零空间(因为 \(2=\dim\text{Nul}A\ge \max\{n-m,0\}=3\) 矛盾)
- \(A=\begin{bmatrix}3&0&-1\\3&0&-1\\4&0&5\end{bmatrix}\),易于检验 \(\text{Nul}A,\text{Row}A,\text{Col}A,\text{Nul}A^T\) 分别对应 \(x_2\) 轴,\(x_1x_3\) 平面,\(x_1-x_2=0\) 平面,\((1,-1,0)\) 的倍数构成的集合;将它们的图像画出,可以得到两种正交关系 \(\text{Row}A\bot\text{Nul}A\) 和 \(\text{Col}A\bot\text{Nul}A^T\)
- 重要结论2:给定 m 个方程 n 个变量的齐次方程组,该方程组的通解能表示为 \(n-m\) 个线性无关的向量的线性组合,那么所有对应的非齐次方程组都有解(因为 \(\text{Nul}A=n-m\),于是 \(\dim\text{Col}A=n-\text{Nul}A=m\),即 \(\text{Col}A\) 是 m 维子空间,同时 \(\text{Col}A=\mathbb R^m\),于是 \(\forall \mathbf b\in\mathbb R^m,A\mathbf x=\mathbf b\) 有解)
- 验证:\(\text{rank}A=\dim\text{Row}A=\dim\text{Row}A^T=\dim\text{Col}A=\dim\text{Col}A^T\)(由于 \(\text{Col}A^T=\text{Row}A,\dim\text{Row}A=\dim\text{Col}A\))
上述[例4]我们为一直在研究的子空间直观化提供了一个更好的方法
第 6 章中,我们将介绍 \(\text{Row}A\bot\text{Nul}A\)(行空间与零空间正交,并且公共向量只有零向量),又由 \(\text{Col}A=\text{Row}A^T\),有 \(\text{Col}A\bot\text{Nul}A^T\)
可逆矩阵定理
\(A\in\mathbb R^{n\times n}可逆\) \(\iff\) \(\begin{cases}A的列构成\mathbb R^n的一个基\\\text{Col}A=\mathbb R^n\\\dim\text{Col}A=n\\\text{rank}A=n\\\text{Nul}A=\{\mathbf 0\}\\\dim\text{Nul}A=0\end{cases}\)
矩阵定理(猜想)
假设 \(\begin{cases}A\in\mathbb R^{m\times n}\end{cases}\)(\(m\le n\))
\(\begin{cases}\dim\text{Nul}A=n-m\\\text{rank}A=\dim\text{Col}A=\dim\text{Row}A=m\\\text{Col}A=\mathbb R^m\end{cases}\) \(\iff\) \(\begin{cases}A\mathbf x=\mathbf 0有n-m个自由变量\\\forall \mathbf b\in\mathbb R^m,A\mathbf x=\mathbf b有解\end{cases}\)
总结
- 行空间:矩阵 A 的行向量的线性组合的集合 \(\text{Row}A\);满足 \(\text{Row}A=\text{Col}A^T\)
- 定理1:若矩阵 A 和矩阵 B 行等价,那么它们的行空间相同(即 \(\text{Row}A=\text{Row}B\));若 B 是阶梯型矩阵,那么 B 的非零行构成 A 的行空间的一个基,同时也是 B 的行空间的一个基
- 秩,秩定理:矩阵 A 的秩定义为 A 的列空间的维数,记 \(\text{rank}A=\dim\text{Col}A\);秩定理指出 (1) 矩阵 \(A\in\mathbb R^{m\times n}\) 的列空间与行空间的维数相等(即 \(\dim\text{Col}A=\dim\text{Row}A\)),这个公共的秩数还等于 A 的主元位置的个数,(2) \(\text{rank}A+\dim\text{Nul}A=n\)
- 可逆矩阵定理:\(A\in\mathbb R^{n\times n}可逆\) \(\iff\) \(\begin{cases}A的列构成\mathbb R^n的一个基\\\text{Col}A=\mathbb R^n\\\dim\text{Col}A=n\\\text{rank}A=n\\\text{Nul}A=\{\mathbf 0\}\\\dim\text{Nul}A=0\end{cases}\)
- 矩阵 A 确定的基本子空间:\(\text{Row}A,\text{Col}A,\text{Nul}A,\text{Row}A^T,\text{Col}A^T,\text{Nul}A^T\)(\(\text{Col}A,\text{Row}A^T,\text{Nul}A^T\) 是 \(\mathbb R^m\) 的子空间,\(\text{Row}A,\text{Nul}A,\text{Col}A^T\) 是 \(\mathbb R^n\) 的子空间)
一级结论
- \(m\times n\) 矩阵 A 满足事实:\(\text{rank}A+\dim\text{Nul}A=n\),\(\text{rank}A\le\min\{m,n\}\),\(\dim\text{Nul}A\ge \max\{n-m,0\}\);两种正交关系:\(\text{Row}A\bot\text{Nul}A\),\(\text{Col}A\bot\text{Nul}A^T\)(该符号不严格?)
- \(\text{rank}A=\dim\text{Row}A=\dim\text{Col}A=\text{rank}A^T=\dim\text{Row}A^T=\dim\text{Col}A^T\)
- \(\text{rank}A+\dim\text{Nul}A=n,\text{rank}A+\text{Nul}A^T=m\)
练习
- \(A=\begin{bmatrix}2&-1&1&-6&8\\1&-2&-4&3&-2\\-7&8&10&3&-10\\4&-5&-7&0&4\end{bmatrix}\),\(B=\begin{bmatrix}1&-2&-4&3&-2\\0&3&9&-12&12\\0&0&0&0&0\\0&0&0&0&0\end{bmatrix}\),而且 \(A\sim B\)
- 求 \(\text{rank}A,\dim\text{Nul}A\)
- 求 \(\text{Col}A,\text{Row}A\) 的基
- 如果要求 \(\text{Nul}A\) 的基,那么下一步需要做什么?
- 求 \(A^T\) 的行阶梯形中的主元列个数
- 判断题:(A 是 \(m\times n\) 矩阵)
- A 的行空间与 \(A^T\) 的列空间相同(Y)
- 若 B 是 A 的一个阶梯型,B 有 3 个非零行,则 A 的前三行构成 \(\text{Row}A\) 的一个基(X)
- 矩阵 A 的行空间与列空间具有相同的维数,即便 \(m\ne n\)(Y)
- A 的行空间的维数与零空间的维数之和等于 A 的行数(X)
- 在计算机上,行变换可能会改变一个矩阵的表面上的秩(Y)
- 若 B 是 A 的任一阶梯型,则 B 的主元列构成 A 的列空间的一个基(X)
- 行变换保持 A 的行之间的线性相关关系(X)
- A 的零空间维数等于 A 的非主元列个数(Y)
- \(A^T\) 的行空间与 A 的列空间相同(Y)
- 若 A 与 B 行等价,则它们的行空间相同(Y)
- 求 (1) 中矩阵 A 的 \(\text{Nul}A,\text{Col}A,\text{Row}A\) 的基,维数;A 的秩
- \(4\times 7\) 矩阵 A 有 4 个主元列,那么 \(\text{Col}A=\mathbb R^4\) 和 \(\text{Nul}A=\mathbb R^3\) 是否成立?
- \(5\times 6\) 矩阵 A 有 4 个主元列,那么 \(\text{Col}A=\mathbb R^4\) 和 \(\text{Nul}A=\mathbb R^2\) 是否成立?
- \(A\in\mathbb R^{m\times n}\) 的秩数最大是多少?零空间的维数最小是多少?
- \(\text{Row}A,\text{Col}A,\text{Nul}A,\text{Row}A^T,\text{Col}A^T,\text{Nul}A^T\) 称为 \(A\in\mathbb R^{m\times n}\) 确定的基本子空间
- \(\text{Row}A,\text{Col}A,\text{Nul}A,\text{Row}A^T,\text{Col}A^T,\text{Nul}A^T\) 哪个是 \(\mathbb R^m\) 或 \(\mathbb R^n\) 的子空间?最多有多少不同的基本子空间?
- 证明:\(\dim\text{Row}A+\dim\text{Nul}A=n\),\(\dim\text{Col}A+\dim\text{Nul}A^T=m\)
- 证明:\(\forall\mathbf b\in\mathbb R^m,A\mathbf x=\mathbf b\) 有解,当且仅当 \(A^T\mathbf x=\mathbf 0\) 仅有平凡解
- \(\text{rank}[A~~\mathbf b]\) 和 \(\text{rank}A\) 满足什么条件,才能使得 \(A\mathbf x=\mathbf b\) 相容(\(\mathbf b\in\mathbb R^m\))
- 可以证明 \(A\in\mathbb R^{m\times n}\) 的秩为 1,当且仅当 \(\exists\mathbf u\in\mathbb R^m,\mathbf v\in\mathbb R^n,A=\mathbf u\mathbf v^T\)(秩为 1 的矩阵在某些计算机算术及本书几处上下文的理论处理中都是重要的,包括第 7 章的奇异值分解)
- 验证:如果 \(\mathbf u=\begin{bmatrix}2\\-3\\5\end{bmatrix},\mathbf v=\begin{bmatrix}a\\b\\c\end{bmatrix}\),则 \(\text{rank}\mathbf u\mathbf v^T\le 1\)
- \(\mathbf u=\begin{bmatrix}1\\2\end{bmatrix},\mathbf u\mathbf v^T=\begin{bmatrix}1&-3&4\\2&-6&8\end{bmatrix}\),计算 \(\mathbf v\in\mathbb R^3\)
- \(2\times 3\) 矩阵 A 满足 \(\text{rank}A=1\),\(\mathbf u\) 为 A 的第一列,且 \(\mathbf u\ne0\),解释为什么 \(\exists\mathbf u\in\mathbb R^3\) 使得 \(A=\mathbf u\mathbf v^T\);若 A 的第一列为零向量,这个结论该如何修改?
- \(m\times n\) 矩阵 A 满足 \(r=\text{rank}A>0\),令 U 为 A 的一个阶梯型,解释为何存在一个可逆矩阵 E 使得 \(A=EU\),利用这个因式分解将 A 写成 r 个秩为 1 的矩阵之和(参考[2.4定理10])
提示
(1)
- \(\text{rank}A=\text{rank}B=2\),\(\dim\text{Nul}A=n-\text{rank}A=3\)
- \(\text{Col}A=\left\{\begin{bmatrix}2\\1\\-7\\4\end{bmatrix},\begin{bmatrix}-1\\-2\\8\\-5\end{bmatrix}\right\}\),\(\text{Row}A=\{(1,-2,-4,3,-2),(0,3,9,-12,12)\}\)
- 将 B 继续进行[行化简算法],得到简化阶梯型 C
- 由 \(\text{Col}A^T=\text{Row}A\) 和 \(\dim\text{Row}A=\dim\text{Col}A\),有 \(\dim\text{Col}A^T=\dim\text{Col}A=2\)
(4) A 有 4 个主元列,等价于 \(\dim\text{Col}A=4\),于是 \(\text{Col}A\) 是 \(\mathbb R^4\) 的 4 维子空间
\(\dim\text{Nul}A=7-4=3\),于是 \(\text{Nul}A\) 是 \(\mathbb R^7\) 的 3 维子空间
最后 \(\text{Col}A=\mathbb R^4\),\(\text{Nul}A\ne\mathbb R^7\)
(5) 类似于 (4) 可知,两个命题为假
(6) \(\text{rank}A\le\min\{m,n\}\);\(\dim\text{Nul}A\ge \max\{n-m,0\}\)
(7)
- \(\text{Row}A^T,\text{Col}A,\text{Nul}A^T\subset\mathbb R^m\),\(\text{Row}A,\text{Col}A^T,\text{Nul}A\subset\mathbb R^n\);由 \(\text{Row}A^T=\text{Col}A\) 和 \(\text{Row}A=\text{Col}A^T\),最多有 4 个基本不同子空间
- 由[秩定理]和相关结论易得证
- \(\forall\mathbf b\in\mathbb R^m,A\mathbf x=\mathbf b\) 有解,当且仅当 \(\dim\text{Col}A=m\);\(A^T\mathbf x=\mathbf 0\) 仅有平凡解,当且仅当 \(\dim\text{Nul}A^T=0\);由 \(\dim\text{Col}A^T=\dim\text{Col}A\) 和 \(\dim\text{Col}A^T+\dim\text{Nul}A^T=m\),而 \(\dim\text{Col}A=m\),于是 \(\dim\text{Nul}A^T=\dim\text{Col}A-m=0\),得证
- \(\forall\mathbf b\in\mathbb R^m,A\mathbf x=\mathbf b\) 有解,当且仅当 \(\text{rank}[A~~\mathbf b]=\text{rank}A\),当且仅当 \(\mathbf b\) 不是 \([A~~\mathbf b]\) 的主元列(参见[1.2定理2])
7. 基的变换
对一个 n 维向量空间 V,当一个基 \(\cal B\) 取定后,与之相关的映上到 \(\mathbb R^n\) 的坐标映射对 V 提供了一个坐标系;V 中每个向量 \(\mathbf x\) 由它的 \(\cal B-坐标向量\) \([\bf x]_{\cal B}\) 唯一确定
在某些应用中,一个问题开始是用一个基 \(\cal B\) 描述,但问题的解可以通过将 \(\cal B\) 变换到新的基 \(\cal C\) 而得到简化(参见第 5 章和第 7 章)
例子
- 向量空间 V 有两个基 \(\cal B=\{\bf b_1,b_2\},\cal C=\{\bf c_1,c_2\}\),满足 \(\begin{cases}\mathbf b_1=4\mathbf c_1+\mathbf c_2\\\mathbf b_2=-6\mathbf c_1+\mathbf c_2\end{cases}\),若 \([\mathbf x]_{\cal B}=\begin{bmatrix}3\\1\end{bmatrix}\)(即 \(\mathbf x=3\mathbf b_1+\mathbf b_2\)),求 \([\mathbf x]_{\cal C}\)
- \([\mathbf x]_{\cal C}=[3\mathbf b_1+\mathbf b_2]_{\cal C}=3[\mathbf b_1]_{\cal C}+[\mathbf b_2]_{\cal C}=\begin{bmatrix}[\mathbf b_1]_{\cal C}&[\mathbf b_2]_{\cal C}\end{bmatrix}\begin{bmatrix}3\\1\end{bmatrix}=\begin{bmatrix}4&-6\\1&1\end{bmatrix}\begin{bmatrix}3\\1\end{bmatrix}=\begin{bmatrix}6\\4\end{bmatrix}\)
下述定理给出了上例的推广
基变换定理
假设 \(\mathcal B=\{\bf b_1,\cdots,b_n\},\mathcal C=\{\bf c_1,\cdots,c_n\}\) 是向量空间 V 的两个基,
则存在一个 \(n\times n\) 矩阵 \(\underset{\cal C\leftarrow B}P\),使得 \(\forall\mathbf x\in V\),\([\mathbf x]_{\cal C}=\underset{\cal C\leftarrow B}P[\mathbf x]_{\cal B}\)
其中 \(\underset{\cal C\leftarrow B}P\) 的列是基 \(\cal B\) 中的向量的 \(\cal C-坐标向量\),即 \(\underset{\cal C\leftarrow B}P=[[\mathbf b_1]_{\cal C}~~\cdots~~[\mathbf b_n]_{\cal C}]=P_{\cal C}^{-1}P_{\cal B}\)
(于是 \([\mathbf x]_{\cal C}=P_{\cal C}^{-1}P_{\cal B}[\mathbf x]_{\cal B}\))
注:\(\underset{\cal C\leftarrow B}P\) 称为由 \(\cal B\) 到 \(\cal C\) 的坐标变换矩阵
证明:\(\underset{\cal C\leftarrow B}P=P_{\cal C}^{-1}P_{\cal B}\)
假设 \(\cal B,C\) 是 V 的基,由于 \(\forall i=1..n,\mathbf b_i\in V\),有 \(\mathbf b_i=P_{\cal C}[\mathbf b_i]_{\cal C}\),
由于 \(P_{\cal C}\) 可逆,有 \([\mathbf b_i]_{\cal C}=P_{\cal C}^{-1}\mathbf b_i\)
那么 \(\underset{\cal C\leftarrow B}P=\begin{bmatrix}[\mathbf b_1]_{\cal C}&\cdots&[\mathbf b_n]_{\cal C}\end{bmatrix}=\begin{bmatrix}P_{\cal C}^{-1}\mathbf b_1&\cdots&P_{\cal C}^{-1}\mathbf b_n\end{bmatrix}=P_{\cal C}^{-1}P_{\cal B}\)
注意:由于 \([A~~B]\sim[I~~A^{-1}B]\),所以可以通过 \([P_{\cal C}~~P_{\cal B}]\sim[I~~P_{\cal C}^{-1}P_{\cal B}]\) 计算 \(P_{\cal C}^{-1}P_{\cal B}]\)
(弱化的结论有:\([P_{\cal C}~~[\mathbf b_i]_{\cal C}]\sim[I~~\mathbf b_i]\))
\(\blacksquare\)
定理
[定理1]中 \(\underset{\cal C\leftarrow B}P\) 可逆
推论:\([\mathbf x]_{\cal C}=(\underset{\cal B\leftarrow C}P)^{-1}[\mathbf x]_{\cal B}\);\((\underset{\cal B\leftarrow C}P)^{-1}=\underset{\cal C\leftarrow B}P\)
证明参考 [4.4节习题25],或参见[p254]
\(\blacksquare\)
例子
- 向量在 \(V,\mathbb R^n\) 之间的变换:\(\mathbf x\underset{P_{\cal B}}{\overset{[~]_{\cal B}}\rightleftharpoons}[\mathbf x]_{\cal B}\underset{(\underset{\cal C\leftarrow B}P)^{-1}}{\overset{\underset{\cal C\leftarrow B}P}\rightleftharpoons}[\mathbf x]_{\cal C}\)
设 \(\cal E=\{\mathbf e_1,\cdots,\mathbf e_n\}\) 是 \(\mathbb R^n\) 的标准基,\(\cal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是 \(\mathbb R^n\) 的任意一个基,[4.4]引入的坐标变换矩阵满足等式 \(P_{\cal B}=\begin{bmatrix}\mathbf b_1&\cdots&\mathbf b_n\end{bmatrix}=\underset{\cal E\leftarrow B}P\);\(\forall i=1..n,[\bf b_i]_{\cal E}=b_i\)
例子
- \(\mathcal B=\{\mathbf b_1,\mathbf b_2\}=\left\{\begin{bmatrix}-9\\1\end{bmatrix},\begin{bmatrix}-5\\-1\end{bmatrix}\right\},\mathcal C=\{\mathbf c_1,\mathbf c_2\}=\left\{\begin{bmatrix}1\\-4\end{bmatrix},\begin{bmatrix}3\\-5\end{bmatrix}\right\}\),求 \(\underset{\cal C\leftarrow B}P\)
- \(\begin{bmatrix}1&3&|&-9&-5\\-4&-5&|&1&-1\end{bmatrix}\sim\begin{bmatrix}1&0&|&6&4\\0&1&|&-5&-3\end{bmatrix}\),于是 \(\underset{\cal C\leftarrow B}P=\begin{bmatrix}6&4\\-5&-3\end{bmatrix}\)
- \(\mathcal B=\{\mathbf b_1,\mathbf b_2\}=\left\{\begin{bmatrix}1\\-3\end{bmatrix},\begin{bmatrix}-2\\4\end{bmatrix}\right\},\mathcal C=\{\mathbf c_1,\mathbf c_2\}=\left\{\begin{bmatrix}-7\\9\end{bmatrix},\begin{bmatrix}-5\\7\end{bmatrix}\right\}\),计算 \(\underset{\cal B\leftarrow C}P,\underset{\cal C\leftarrow B}P\)
- \(\begin{bmatrix}1&-2&|&-7&-5\\-3&4&|&9&4\end{bmatrix}\sim\begin{bmatrix}1&0&|&5&3\\0&1&|&6&4\end{bmatrix}\),于是 \(\underset{\cal B\leftarrow C}P=\begin{bmatrix}5&3\\6&4\end{bmatrix}\)
- \(\underset{\cal C\leftarrow B}P=\underset{\cal B\leftarrow C}P^{-1}=\frac12\begin{bmatrix}4&-3\\-6&5\end{bmatrix}\)
总结
- 基变换定理:假设 \(\mathcal B=\{\bf b_1,\cdots,b_n\},\mathcal C=\{\bf c_1,\cdots,c_n\}\) 是向量空间 V 的两个基,那么存在一个 \(n\times n\) 矩阵,使得 \(\forall\mathbf x\in V\),\([\mathbf x]_{\cal C}=\underset{\cal C\leftarrow B}P[\mathbf x]_{\cal B}\)
- 坐标变换矩阵:基变换定理中 \(\underset{\cal C\leftarrow B}P=[[\mathbf b_1]_{\cal C}~~\cdots~~[\mathbf b_n]_{\cal C}]\) 称为由 \(\cal B\) 到 \(\cal C\) 的坐标向量矩阵;并且 \(\underset{\cal C\leftarrow B}P=P_{\cal C}^{-1}P_{\cal B}\),\(\underset{\cal C\leftarrow B}P=(\underset{\cal B\leftarrow C}P)^{-1}\),该矩阵的各列线性无关(参见[4.4习题25])
- \(\mathbb R^n\) 中基的变换:假设 \(\cal E=\{\mathbf e_1,\cdots,\mathbf e_n\}\) 是 \(\mathbb R^n\) 的标准基,\(\cal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\) 是 \(\mathbb R^n\) 的任意一个基,那么 [4.4节] 引入的坐标变换矩阵满足 \(P_{\cal B}=\underset{\cal E\leftarrow B}P\)(即 \(\forall i=1..n,[\bf b_i]_{\cal E}=b_i\))
一级结论
- 假设 \(\cal B\) 和 \(\cal C\) 是向量空间 \(\mathbb R^n\) 的两个基,\(\cal E\) 是 \(\mathbb R^n\) 的标准基,那么 \(\forall i=1..n\),\([\mathbf b_i]_{\cal B}=\mathbf e_i\) 和 \([\mathbf b_i]_{\cal C}=P_{\cal C}^{-1}\mathbf b_i\)
练习
- \(\cal F=\{\bf f_1,f_2\},\cal G=\{\bf g_1,g_2\}\) 是向量空间 V 的两个基,矩阵 \(P=[[\mathbf f_1]_{\cal G}~~[\mathbf f_2]_{\cal G}]\);\(\forall\mathbf v\in V\),哪个方程成立?(1) \([\mathbf v]_{\cal F}=P[\mathbf v]_{\cal G}\),(2) \([\mathbf v]_{\cal G}=P[\mathbf v]_{\cal F}\)
- 已知 \(\underset{\cal B\leftarrow C}P\) 求 \(\underset{\cal C\leftarrow B}P\)
- 判断题
- 坐标变换矩阵 \(\underset{\cal C\leftarrow B}P\) 的列是 \(\cal C\) 中向量的 \(\cal B-坐标向量\)(X)
- 若 \(V=\mathbb R^n\),\(\cal C\) 为 V 的标准基,则 \(\underset{\cal C\leftarrow B}P\) 与[4.4]中引入的坐标变换矩阵 \(P_{\cal B}\) 相同(Y)
- \(\underset{\cal C\leftarrow B}P\) 的列是线性无关的(Y)
- 若 \(V=\mathbb R^2\),\(\cal B=\{\mathbf b_1,\mathbf b_2\},\cal C=\{\mathbf c_1,\mathbf c_2\}\),则将 \([\mathbf c_1~~\mathbf c_2~~\mathbf b_1~~\mathbf b_2]\) 行化简为 \([I~~P]\) 时产生的矩阵 P,满足 \(\forall\mathbf x\in V,[\mathbf x]_{\cal B}=P[\mathbf x]_{\cal C}\)(X)
- \(\mathcal B=\{\mathbf b_1,\mathbf b_2\},\mathcal C=\{\mathbf c_1,\mathbf c_2\}\) 是向量空间 V 的两个基,设 \(\begin{cases}\mathbf b_1=6\mathbf c_1-2\mathbf c_2\\\mathbf b_2=9\mathbf c_1-4\mathbf c_2\end{cases}\)
- 计算 \(\underset{\cal C\leftarrow B}P\)
- 计算 \(\mathbf x=-3\mathbf b_1+2\mathbf b_2\) 的 \(\cal C-坐标向量\)
- \(\mathcal B=\left\{\begin{bmatrix}7\\5\end{bmatrix},\begin{bmatrix}-3\\-1\end{bmatrix}\right\},\mathcal C=\left\{\begin{bmatrix}1\\-5\end{bmatrix},\begin{bmatrix}-2\\2\end{bmatrix}\right\}\),计算 \(\underset{\cal C\leftarrow B}P\),\(\underset{\cal B\leftarrow C}P\)
提示
(1) \(P=[P_{\cal G}^{-1}\mathbf f_1~~P_{\cal G}^{-1}\mathbf f_2]=P_{\cal G}^{-1}P_{\cal F}=\underset{\cal G\leftarrow F}P\)
于是 \([\mathbf v]_{\cal G}=P[\mathbf v]_{\cal F}\)
(2) \(\underset{\cal C\leftarrow B}P=(\underset{\cal B\leftarrow C}P)^{-1}\)
(4) \(\begin{cases}\mathbf b_1=6\mathbf c_1-2\mathbf c_2\\\mathbf b_2=9\mathbf c_1-4\mathbf c_2\end{cases}\implies\begin{cases}[\mathbf b_1]_{\cal C}=6[\mathbf c_1]_{\cal C}-2[\mathbf c_2]_{\cal C}=\begin{bmatrix}6\\-2\end{bmatrix}\\ [\mathbf b_2]_{\cal C}=9[\mathbf c_1]_{\cal C}-4[\mathbf c_2]_{\cal C}=\begin{bmatrix}9\\-4\end{bmatrix}\end{cases}\),于是 \(\underset{\cal C\leftarrow B}P=[[\mathbf b_1]_{\cal C}~~[\mathbf b_2]_{\cal C}]=\begin{bmatrix}6&9\\-2&-4\end{bmatrix}\)
\(\mathbf x=-3\mathbf b_1+2\mathbf b_2\implies[\mathbf x]_{\cal B}=-3[\mathbf b_1]_{\cal B}+2[\mathbf b_2]_{\cal B}=\begin{bmatrix}-3\\2\end{bmatrix}\),于是 \([\mathbf x]_{\cal C}=\underset{\cal C\leftarrow B}P[\mathbf x]_{\cal B}=\begin{bmatrix}0\\-2\end{bmatrix}\)
8. 差分方程中的应用
目前计算机被广泛应用到各个领域,很多科学和工程商的问题在某种意义上将用离散的或数字化的数据来处理胜过连续的数据来处理
拆分方程往往是分析这样的数据的合适工具,甚至使用微分方程对连续过程建模时,其数值解通常由一个相关的差分方程得到
离散时间信号
离散时间信号的向量空间记为 \(\mathbb S\),\(\mathbb S\) 中的信号是定义在整数上的函数,同时可以使用一个数列将其直观化,即 \(\{y_k\}\)
信号空间 \(\mathbb S\) 中的线性无关性,Casorati 矩阵
假设 \(\{u_k\},\{v_k\},\{w_k\}\in\mathbb S\),
若方程 \(\forall k,c_1u_k+c_2v_k+c_3w_k=0\) 蕴涵 \(c_1=c_2=c_3=0\),那么 \(\{u_k\},\{v_k\},\{w_k\}\) 恰好是线性无关的
上述方程等价于 \(\forall k,\begin{cases}c_1u_k+c_2v_k+c_3w_k=0\\c_1u_{k+1}+c_2v_{k+1}+c_3w_{k+1}=0\\c_1u_{k+2}+c_2v_{k+2}+c_3w_{k+2}=0\end{cases}\),即 \(\forall k,\begin{bmatrix}u_k&v_k&w_k\\u_{k+1}&v_{k+1}&w_{k+1}\\u_{k+2}&v_{k+2}&w_{k+2}\end{bmatrix}\begin{bmatrix}c_1\\c_2\\c_3\end{bmatrix}=\begin{bmatrix}0\\0\\0\end{bmatrix}\)
上述方程组的系数矩阵为信号的Casorati 矩阵,该矩阵的行列式称为 \(\{u_k\},\{v_k\},\{w_k\}\) 的Casorati 行列式
若 \(\exists k\),使得 Casorati 矩阵可逆,则上述矩阵方程蕴涵 \(c_1=c_2=c_3=0\),蕴涵这三个信号线性无关
例子
- 证明:\(1^k,(-2)^k,3^k\) 是线性无关的信号
- 这三个信号的 Casorati 矩阵为 \(\begin{bmatrix}1^k&(-2)^k&3^k\\1^{k+1}&(-2)^{k+1}&3^{k+1}\\1^{k+2}&(-2)^{k+2}&3^{k+2}\end{bmatrix}\);当 \(k=0\) 时,可以简单证明该矩阵可逆,所以这三个信号线性无关
线性差分方程
给定数 \(a_0,a_1,\cdots,a_n\)(其中 \(a_0,a_n\ne0\)),一个信号 \(\{z_k\}\),方程 \(\forall k,\sum\limits_{i=0}^na_iy_{k+n-i}=z_k\) 被称为 n 阶线性差分方程(或线性递归关系)
注:为了简化,通常 \(a_0=1\);若 \(\{z_k\}\) 是领序列,则方程是齐次的,否则是非齐次的
9. 马尔可夫链中的应用
补充练习
补充练习
- 判断题(假设 \(\mathbf v_1,\cdots,\mathbf v_p\) 是非零有限维向量空间 V 中的向量,而且 \(S=\{\mathbf v_1,\cdots,\mathbf v_p\}\))
- \(\mathbf v_1,\cdots,\mathbf v_p\) 的所有线性组合所成的集合是一个向量空间(Y)
- 若 \(\{\mathbf v_1,\cdots,\mathbf v_{p-1}\}\) 生成 V,则 S 生成 V(Y)
- 若 \(\{\mathbf v_1,\cdots,\mathbf v_{p-1}\}\) 是线性无关的,那么 S 也是线性无关的(X)
- 若 S 是线性无关的,那么 S 是 V 的一组基(X)
- 若 \(\text{Span }S=V\),则 S 的某一子集是 V 的一组基(Y)
- 若 \(\dim V=p,\text{Span }S=V\),则 S 是线性无关的(X)
- \(\mathbb R^3\) 中的一个平面是一二维子空间(X)
- 矩阵中的非主元列总是线性相关的(X!)
- 矩阵 A 中的行变换能够改变 A 的行之间的线性相关关系(Y)
- 矩阵中的行变换能够改变零空间(X)
- 矩阵的秩等于非零行的个数(X)
- \(m\times n\) 矩阵 A 行等价于阶梯型 U,U 有 k 个非零行,那么 \(A\bf x=0\) 的解决的维数是 \(m-k\) (X)
- 若 B 是由 A 经过几次行初等变换得到,则 \(\text{rank}B=\text{rank}A\) (Y!)
- 矩阵 A 的非零行构成 \(\text{Row}A\) 的一组基(X)
- 若矩阵 A 和 B 有相同的简化阶梯型,那么 \(\text{Row}A=\text{Row}B\) (Y!)
- 若 H 是 \(\mathbb R^3\) 的子空间,那么存在 \(3\times 3\) 矩阵 A 使得 \(H=\text{Col}A\) (Y)
- 若 \(m\times n\) 矩阵 A 满足 \(\text{rank}A=m\),则线性变换 \(\mathbf x\mapsto A\mathbf x\) 是一对一的 (X)
- 若 \(m\times n\) 矩阵 A 满足线性变换 \(\mathbf x\mapsto A\mathbf x\) 是映上的,则 \(\text{rank}A=m\) (Y)
- 坐标变换矩阵总是可逆的 (Y)
- 若 \(\cal B=\{\mathbf b_1,\cdots,\mathbf b_n\},\cal C=\{\mathbf c_1,\cdots,\mathbf c_n\}\) 是向量空间 V 的基,则坐标变换矩阵 \(\underset{\cal C\leftarrow B}P\) 的第 j 列是坐标向量 \([\mathbf c_j]_{\cal B}\) (X)
- 证明:\(\text{Col}AB\subset\text{Col}A\),并且 \(\text{Row}AB\subset\text{Row}B\)
- 秩的性质(假设 \(A\in M_{m\times n},B\in M_{n\times p}\))
- 证明:\(\text{rank}AB\le\min\{\text{rank}A,\text{rank}B\}\)
- 证明:若 \(P\in M_{m\times m}\) 可逆,那么 \(\text{rank}PA=\text{rank}A\)
- 证明:若 \(Q\in M_{n\times n}\) 可逆,那么 \(\text{rank}AQ=\text{rank}A\)
- 证明:假设 \(A\in M_{m\times n},B\in M_{n\times p}\),且 \(AB=0\),那么 (1) \(\text{Col}B\subset\text{Nul}A\),(2)\(\text{rank}A+\text{rank}B\le n\)
- 证明:若 \(A,B\in M_{m\times n}\),那么 \(\text{rank}(A+B)\le\text{rank}A+\text{rank}B\)
- 证明:\(A\in M_{m\times n}\) 的秩为 r,等价于 A 包含一个 \(r\times r\) 最大可逆子矩阵
- 假设 \(A\in M_n,B\in M_{n\times m}\),一个控制系统的状态空间模型是 \(\mathbf x_{i+1}=A\mathbf x_i+B\mathbf u_i\) 的差分方程,\(\{\mathbf x_k\}\) 是 \(\mathbb R^n\) 上的一个“状态向量”序列,用以描述在离散时间上控制系统的状态
- \((A,B)\) 称为可控制的,若 \(\text{rank}[B~~AB\cdots A^{n-1}B]=n\),其中 \([B~~AB\cdots A^{n-1}B]\) 称为可控制矩阵,于是对于给定的 \(\bf v\),有 \(\mathbf x_0=\mathbf 0,\mathbf x_k=\mathbf v\),其中 \(k\le n\)
- 可证:\(\mathbf x_k=[B~~AB\cdots A^{k-1}B]\begin{bmatrix}\mathbf u_{k-1}\\\mathbf u_{k-2}\\\vdots\\\mathbf u_0\end{bmatrix}\)
提示
(1.10) 行变换可能改变列空间,但不会改变零空间和行空间
(2)
- \(\forall\mathbf y\in\text{Col}AB\),\(\exists\mathbf x\) 使得 \(\mathbf y=(AB)\mathbf x=A(B\mathbf x)\),蕴涵 \(\mathbf y\in\text{Col}A\),于是 \(\text{Col}AB\subset\text{Col}A\)
- \(\forall\mathbf y\in\text{Row}AB\),\(\exists\mathbf x\) 使得 \(\mathbf y=(AB)^T\mathbf x=(B^TA^T)\mathbf x=B^T(A^T\mathbf x)\),蕴涵 \(\mathbf y\in\text{Row}B\),于是 \(\text{Row}AB\subset\text{Row}B\)
(3)
- 由 \(\text{Col}AB\subset\text{Col}A\) 和 \(\text{Row}AB\subset\text{Row}B\) 有 \(\dim\text{Col}AB\le\dim\text{Col}A\) 和 \(\dim\text{Row}AB\le\dim\text{Row}B\),于是 \(\text{rank}AB\le\text{rank}A,\text{rank}AB\le\text{rank}B\),即 \(\text{rank}AB\le\min\{\text{rank}A,\text{rank}B\}\)
- 由 (2.1) 有 \(\text{rank}A=\text{rank}(P^{-1}(PA))\le\text{rank}(PA)\le\text{rank}A\),于是 \(\text{rank}(PA)=\text{rank}A\)
- 令 \(P=Q^T\),于是 P 可逆,结合 (2.2) 的结论,有 \(\text{rank}(PA)=\text{rank}A=\text{rank}A^T=\text{rank}(PA^T)=\text{rank}(AP^T)=\text{rank} (AQ)\),于是 \(\text{rank}A=\text{rank} (AQ)\);或者用 (2.2) 类似的方式证明:\(\text{rank}A=\text{rank}((AQ)Q^{-1})\le\text{rank}(AQ)\le\text{rank}A\)
- \(AB=0\),即 \([A\mathbf b_1\cdots A\mathbf b_p]=0\),于是 \(\forall i=1..p,\mathbf b_i\in\text{Nul}A\),于是 \(\text{Col}B\subset\text{Nul}A\);蕴含 \(\text{rank}B\le\dim\text{Nul}A\),最后 \(\text{rank}A+\text{rank}B\le\dim\text{Nul}A+\text{rank}A=n\)
- 对 \(A,B\) 分别进行秩分解(CR 分解)有 \(A=C_1R_1,B=C_2R_2\),设 \(C=[C_1~~C_2],R=\begin{bmatrix}R_1\\R_2\end{bmatrix}\);\(A+B=C_1R_1+C_2R_2=[C_1~~C_2]\begin{bmatrix}R_1\\R_2\end{bmatrix}=CR\),又由 (3.1),有 \(\text{rank}(A+B)=\text{rank}(CR)\le\text{rank} C\le\text{rank}A+\text{rank}B\)