跳转至

5.特征值&特征向量

本章目的是剖析线性变换 \(\mathbf x\mapsto A\mathbf x\) 的作用,把它分解为容易理解的元素

除了 5.4,整章中出现的矩阵都是方阵

特征值的应用:离散动力学系统,微积分

1. 特征向量,特征值

特征值,特征向量,特征空间

假设 \(A\in\mathbb R^{n\times n}\)\(\mathbf x\ne\mathbf 0\)

若存在 \(\lambda\in\mathbb R\) 使得 \(A\mathbf x=\lambda\mathbf x\) (或 \((A-\lambda I)\mathbf x=\mathbf 0\))有非平凡解 \(\mathbf x\)

那么 \(\lambda\) 称为 A 的特征值,\(\mathbf x\) 称为 A 对应于 \(\lambda\) 的特征向量

注:根据定义和可逆矩阵定理可以方便地验证 A 的 特征值 或 特征向量

特征空间:A 的对应于 \(\lambda\) 的特征空间为 \(\text{Nul}(A-\lambda I)\)(即方程的解集)

注2:\(A\mathbf x=\lambda\mathbf x\) \(\implies\) \(A^n\mathbf x=\lambda^n\mathbf x\)(证明:数学归纳法)

注3:A 的对应于其第 i 个特征值 \(\lambda_i\) 的特征向量 \(\mathbf x_{ij}\in \text{Nul}(A-\lambda I)\),因而任意多个 \(\mathbf x_{ij}\)非零线性组合也是特征向量

注4:\(\{A对应于\lambda的特征空间\}=\{A对应于\lambda的特征向量集\}\cup\{\mathbf 0\}\)

假设有三角矩阵 \(A\in\mathbb R^{n\times n}\)

根据可逆矩阵定理,\((A-\lambda I)\mathbf x=\mathbf 0\) 有非平凡解,当且仅当 \(\det(A-\lambda I)=0\)

\((A-\lambda I)\mathbf x=\mathbf 0\) 有非平凡解,当且仅当 存在 \(\lambda\) 使得 \(\lambda = a_{ii}\)

例子

  1. \(A=\begin{bmatrix}1&6\\5&2\end{bmatrix},\mathbf u=\begin{bmatrix}6\\-5\end{bmatrix},\mathbf v=\begin{bmatrix}3\\-2\end{bmatrix}\),判断 \(\bf u,v\) 是否为 A 的特征向量:由于 \(A\mathbf u=\begin{bmatrix}-24\\20\end{bmatrix}=-4\begin{bmatrix}6\\-5\end{bmatrix}=\mathbf u\)\(\forall k,A\mathbf v=\begin{bmatrix}-9\\11\end{bmatrix}\ne k\mathbf v\),因此 \(\bf u\) 是 A 的特征向量,而 \(\bf v\) 不是
  2. 证明 7 是 \(A=\begin{bmatrix}1&6\\5&2\end{bmatrix}\) 的特征值:\(A-7I_n=\begin{bmatrix}-6&6\\5&-5\end{bmatrix}\sim\begin{bmatrix}-6&6\\0&0\end{bmatrix}\),于是 \((A-7I_n)\mathbf x=\mathbf 0\) 存在非平凡解,那么 7 是 A 的特征值
  3. 计算 \(A=\begin{bmatrix}4&-1&6\\2&1&6\\2&-1&8\end{bmatrix}\) 对应于 \(\lambda=2\) 的特征空间的基:\(A-2I_n=\begin{bmatrix}2&-1&6\\2&-1&6\\2&-1&6\end{bmatrix}\sim\begin{bmatrix}1&-0.5&3\\0&0&0\\0&0&0\end{bmatrix}\),对应的齐次方程的通解为 \(\mathbf x=x_2\begin{bmatrix}0.5\\1\\0\end{bmatrix}+x_3\begin{bmatrix}-3\\0\\1\end{bmatrix}\),那么该特征空间 \(\text{Nul}(A-2I_n)\) 的一个基为 \(\left\{\begin{bmatrix}0.5\\1\\0\end{bmatrix},\begin{bmatrix}-3\\0\\1\end{bmatrix}\right\}\)

定理

  1. 三角矩阵 \(A\in\mathbb R^{n\times n}\) 的对角线元素 \(\lambda = a_{ii}\) 是其特征值(特征值个数 \(\le n\)

  2. \(\lambda_1,\dots,\lambda_r\)\(n\times n\) 矩阵 A 的特征值(对于所有 \(i\ne j,\lambda_i\ne\lambda_j\)),\(\mathbf v_1,\dots,\mathbf v_r\) 是分别与 \(\lambda_1,\dots,\lambda_r\) 对应的特征向量;那么向量集合 \(\{\mathbf v_1,\dots,\mathbf v_r\}\) 线性无关

  3. 性质:由 A 对应于特征值 \(\lambda\) 的特征向量之间的非零线性组合也是特征向量(如 \(c_1\mathbf v_1+c_2\mathbf v_2\ne\mathbf 0\)

2)证明:\(\forall i=1..r, A\mathbf v_i=\lambda_i\mathbf v_i,\mathbf v_i\ne\mathbf0\)(其中 \(\forall i\ne j,\lambda_i\ne\lambda_j\)),那么 \(\{\mathbf v_1,\dots,\mathbf v_r\}线性无关\)

证明 \(\neg q\to p\) 矛盾:

\(\{\mathbf v_1,\dots,\mathbf v_r\}\) 线性相关,即根据[1.7] 蕴涵(有必要时对特征向量集进行重排) \(\exists c_i\ne0,\mathbf v_i=\sum\limits_{j=1}^{i-1}c_j\mathbf v_j\)(1)

(这里的 i 应满足 \(\{\mathbf v_1,\dots,\mathbf v_{i-1}\}\) 线性无关)

将(1)两边左乘 A 有 \(A\mathbf v_i=A\sum\limits_{j=1}^{i-1}c_j\mathbf v_j\)\(\lambda_i\mathbf v_i=\sum\limits_{j=1}^{i-1}c_j\lambda_j\mathbf v_j\)(2)

将(1)两边乘以 \(\lambda_i\)\(\lambda_i\mathbf v_i=\sum\limits_{j=1}^{i-1}c_j\lambda_i\mathbf v_j\)(3)

将(2)和(3)相减有:\(\sum\limits_{j=1}^{i-1}c_j(\lambda_i-\lambda_j)\mathbf v_j=\mathbf0\)

由于 \(\{\mathbf v_1,\dots,\mathbf v_{i-1}\}\) 线性无关,有 \(c_1(\lambda_i-\lambda_1)=\dots=c_{i-1}(\lambda_i-\lambda_{i-1})=0\);而 \(\lambda_i-\lambda_j\ne0\),于是 \(c_1=\dots=c_{i-1}=0\),这与(1)矛盾(因为特征向量 \(\mathbf v_i\) 是非零向量)

\(\blacksquare\)

例子

  1. \(A=\begin{bmatrix}3&6&-8\\0&0&6\\0&0&2\end{bmatrix},B=\begin{bmatrix}4&0&0\\-2&1&0\\5&3&4\end{bmatrix}\) 的特征值集合分别为 \(\{3,0,2\}\)\(\{4,1\}\)

特征向量与差分方程

一阶差分方程 \(\mathbf x_i=A\mathbf x_{i-1}\) 的解为 \(\mathbf x_i=\lambda^i\mathbf x_0\) (其中 \(A\mathbf x_0=\lambda\mathbf x_0\)

另:形如 \(\lambda^i\mathbf x_0\) 的线性组合也是解?

3 次多项式判别(盛金公式)

假设 \(ax^3+bx^2+cx+d=0\)

\(A=b^2-3ac,B=bc-9ad,C=c^2-3bd\)\(\Delta=B^2-4AC\)

  1. \(\Delta=0\) 时,有 3 个实根,有 1 个二重根;\(A=B=0\) 时,有三重根
  2. \(\Delta<0\) 时,有 3 个不等实根
  3. \(\Delta>0\) 时,有一个实根,一对共轭复根

自证结论

  1. \(\sum\limits_{i=0}^nc_iA^i=\mathbf0\),等价于 \(\sum\limits_{i=0}^nc_i\lambda^i=\mathbf0\)
  2. \(A\in\mathbb R^{n\times n}\),那么 \(\det A=\prod\limits_{i=1}^n\lambda_i\)

(1) 由于 \(\sum\limits_{i=0}^nc_iA^i=\mathbf0\),有:

\(\blacksquare\)

结论

  1. 特征值,特征向量,特征空间:假设 \(A\in M_{n\times n}\),若 \(\exists\lambda\in\mathbb R\) 使得 \(A\bf x=\lambda x\)\((A-\lambda I_n)\bf x=0\)(而 \(\mathbf x\ne\mathbf 0\)),那么 \(\lambda\) 称为 A 的特征值\(\bf x\) 称为 A 的对应于 \(\lambda\)特征向量;A 的对应于 \(\lambda\)特征空间\(A\bf x=\lambda x\) 的解集 \(\text{Nul}(A-\lambda I_n)\)
  2. 特征判定定理:(1) \(\lambda是A的特征值\iff方程A\mathbf x=\lambda\mathbf x存在非平凡解\iff A-\lambda I_n不可逆\iff\det(A-\lambda I_n)=0\);(2) \(\mathbf x是A的特征向量\iff\exists\lambda\in\mathbb R,A\mathbf x=\lambda\mathbf x\)
  3. 定理:\(\lambda_1,\dots,\lambda_r\) 是方阵 A 的不同特征值,\(\mathbf v_1,\dots,\mathbf v_r\) 分别与 \(\lambda_1,\dots,\lambda_r\),那么 \(\{\mathbf v_1,\dots,\mathbf v_r\}\) 线性无关

一级结论

  1. 方阵 A 不可逆 \(\iff\) A 有零特征值
  2. \(A\in M_{n\times n}\) 是三角矩阵,那么 \(\forall i=1..n\),第 i 个特征值为 \(\lambda_i=a_{ii}\)
  3. 方阵 A 对应于某个特征值 \(\lambda\) 的多个特征向量的非零线性组合仍是特征向量
  4. 方阵 A 的各列之和(或各行之和)为 s,那么 A 有一个特征值 s;特别地,\(A=\begin{bmatrix}a&b\\c&d\end{bmatrix}\),则 A 的特征值为 \(\lambda_1=s,\lambda_2=a+d-s=(\det A)/s\)

练习

  1. \(A=\begin{bmatrix}6&-3&1\\3&0&5\\2&2&6\end{bmatrix}\),5 是 A 的特征值吗?
  2. \(\bf x\) 是 A 对应于 \(\lambda\) 的特征向量,计算 \(A^n\bf x\)
  3. 假设 \(\bf b_1,b_2\) 分别是对应于不同特征值 \(\lambda_1,\lambda_2\) 的特征向量,\(\bf b_3,b_4\) 是对应于第三个不同的特征值 \(\lambda_3\) 的线性无关的特征向量,\(\{\bf b_1,b_2,b_3,b_4\}\) 是否为线性无关集?
  4. \(\lambda\) 是方阵 A 的特征值,证明:\(2\lambda\)\(2A\) 的特征值
  5. 判断题
    1. 若对某个向量 \(\bf x\)\(A\bf x=\lambda x\),则 \(\lambda\) 是 A 的特征值(X
    2. 矩阵 A 不可逆,当且仅当 0 是 A 的特征值(Y)
    3. 数 c 是 A 的特征值,当且仅当 \((A-cI_n)\bf x=0\) 有非平凡解(Y)
    4. 求 A 的特征向量可能是困难的,但验证一个给定的向量是否为特征向量是容易的(Y)
    5. 为求 A 的特征值,可将 A 化简为阶梯型(X)
    6. 若存在 \(\lambda\) 使 \(A\bf x=\lambda x\) 成立,那么 \(\bf x\) 是 A 的特征向量(X
    7. \(\bf v_1,v_2\) 是线性无关的特征向量,则它们是对应于不同特征值的特征向量(X
    8. 随机矩阵的稳态向量就是其特征向量(Y)
    9. 矩阵的特征值是在其主对角线上的元素(X)
    10. 矩阵 A 的特征空间是某矩阵的零空间(Y)
  6. \(\lambda\) 是矩阵 A 的特征值,证明:\(\lambda^-1\) 也是 \(A^{-1}\) 的特征值
  7. 证明:若 \(A^2\) 是零矩阵,那么 A 只有零特征值
  8. 证明:\(\lambda\) 是矩阵 A 的特征值,当且仅当 \(\lambda\)\(A^T\) 的特征值
  9. 证明:若方阵 A 的每行元素之和都等于 s,那么 s 是 A 的特征值
  10. 证明:若方阵 A 的每列元素之和都等于 s,那么 s 是 A 的特征值
  11. 设 T 是 \(\mathbb R^2\) 的相对过原点的某条直线的反射变换,求变换矩阵 A 的特征值和特征空间
  12. 设 T 是 \(\mathbb R^3\) 的相对过原点的某条直线的旋转变换,求变换矩阵 A 的特征值和特征空间
  13. \(\bf u,v\) 是矩阵 A 的特征值 \(\lambda,\mu\) 对应的特征向量,定义 \(\mathbf x_k=c_1\lambda^k\mathbf u+c_2\mu^k\mathbf v\),证明:\(\mathbf x_k=A\mathbf x_{k-1}\)

提示

(1) \(A-5I_n=\begin{bmatrix}1&-3&1\\3&-5&5\\2&2&1\end{bmatrix}\sim\begin{bmatrix}1&-3&1\\0&4&2\\0&0&1\end{bmatrix}\),于是 \(A-5I_n=\begin{bmatrix}1&-3&1\\3&-5&5\\2&2&1\end{bmatrix}\sim\begin{bmatrix}1&-3&1\\0&4&2\\0&0&-5\end{bmatrix}\),即 \(A-5I_n\) 不可逆,所以 5 不是 A 的特征值

(2) \(A^n\mathbf x=\lambda^n\mathbf x\)

(5.7) 若矩阵 A 的同一特征值对应的特征空间的基元素个数不小于 2,那么存在两个特征空间中的向量线性无关(如:特征空间的基为 \(\{\bf v_1,v_2\}\),那么 \(c\bf v_1\)\(d\bf v_2\) 线性无关)

(6) \(A\mathbf x=\lambda\mathbf x\) 和 A 可逆,蕴涵 \(\mathbf x=A^{-1}(\lambda\mathbf x)=\lambda(A^{-1}\mathbf x)\)

\(A^{-1}\) 可逆,蕴涵 \(A^{-1}\ne\mathbf 0\),又因 \(\mathbf x\ne0\),于是 \(\lambda\ne0\),于是 \(\lambda\) 有乘法逆元

最后 \(A^{-1}\mathbf x=\lambda^{-1}\mathbf x\)

(7) 设 \(\lambda\) 是 A 的特征值,蕴涵 \(A\mathbf x=\lambda\mathbf x,A^2\mathbf x=\lambda^2\mathbf x\)

\(A^2=\mathbf 0\),蕴涵 \(A^2\mathbf x=\mathbf 0\mathbf x=\mathbf 0\),于是 \(\lambda^2\mathbf x=\mathbf 0\)

由于 \(\mathbf x\ne\mathbf 0\),于是 \(\lambda=0\)

(8) 两个方程 \(A\mathbf x=\lambda\mathbf x\)\(A^T\mathbf x=\lambda\mathbf x\)\(\mathbf x\ne\mathbf 0\))有相同的 \(\lambda\) 解集,当且仅当 \(\det(A-\lambda I_n)=\det(A^T-\lambda I_n)\)

\(\det(A-\lambda I_n)=\det[(A-\lambda I_n)^T]=\det(A^T-\lambda I_n^T)=\det(A^T-\lambda I_n)\)

于是 A 与 \(A^T\) 具有相同的特征值解集

(9) 若 \(\mathbf v\) 是 A 的特征向量(其中 \(\mathbf v\) 的各个元素为 1),有 \(A\mathbf v=s\mathbf v\)

(10) 由 (8) 和 (9) 有 A 与 \(A^T\) 有相同的特征值解集,而 s 是 \(A^T\) 的特征值,于是 s 也是 \(A\) 的特征值

2. 特征方程

可逆矩阵定理(续)

\(A\in\mathbb R^{n\times n}\) 可逆,当且仅当:

  1. 0 不是 A 的特征值
  2. \(\det A\ne 0\)

特征方程

\(A\in\mathbb R^{n\times n}\) 的特征多项式:\(\det(A-\lambda I)\)(n 次多项式)

A 的特征方程:\(\det(A-\lambda I)=0\)

性质:\(\lambda\in\mathbb R\) 是 A 的特征值,当且仅当 \(\lambda\)\(\det(A-\lambda I)=0\) 的根

根的重数:特征方程的不重解集中第 i 个特征值 \(\lambda_i\) 作为特征方程根的重数称为 (代数)重数

复根(复特征值):特征方程的复数根

例子

  1. 一个 \(6\times 6\) 矩阵的特征多项式是 \(\lambda^6-4\lambda^5-12\lambda^4=\lambda^4(\lambda-6)(\lambda+2)\),其特征值是 0(重数为 4),6(重数为 1),-2(重数为 1)

相似性

\(A,B\in\mathbb R^{n\times n}\)

相似:A 和 B 相似,当且仅当 \(P^{-1}AP=B\)(或 \(AP=PB\)\(PAP^{-1}=B\)\(PA=BP\)

相似变换:\(T~:~A\to P^{-1}AP\)

定理:A 和 B 相似,那么它们具有相同的特征多项式

证:

\(\det(P^{-1}AP-\lambda I_n)=\det[P^{-1}AP-\lambda(P^{-1}I_nP)]=\det[P^{-1}(A-\lambda I_n)P]\)

\(=(\det P^{-1})\det(A-\lambda I_n)(\det P)=\det(A-\lambda I_n)\)

于是 A 与 \(B=P^{-1}AP\) 有相同的特征多项式

\(\blacksquare\)

特征空间的基

假设 \(A\in\mathbb R^{n\times n}\)

A 的特征方程为 \(\det(A-\lambda I)=0\);解得特征值集合 \(S_\lambda=\{\lambda_i~|~\det(A-\lambda_i I)=0\}\) (涉及到多项式求根)

对于所有 \(\lambda_i\in S_{\lambda}\),使用初等行变换求得 \((A-\lambda_i I)\mathbf x=\mathbf 0\) 的特解 \(\mathbf x_i^*\)

最后得到特征空间 \(\text{Nul}(A-\lambda I)\) 的一组基 \(\text B = \{\mathbf x_i^*\}\)(其中 \(A\mathbf x_i^*=\lambda_i\mathbf x_i^*\)

动力学应用(差分方程)

有差分方程 \(\mathbf x_i=A\mathbf x_{i-1}\)\(\mathbf x_0=\begin{bmatrix}c_1\\\vdots\\c_n\end{bmatrix}\)

A 的特征空间 \(\text{Nul}(A-\lambda I)\) 的一组基为 \(\text B = \{\mathbf x_i^*\}\)(其中 \(A\mathbf x_i^*=\lambda_i\mathbf x_i^*\)\(\mathbf b_i=\mathbf x_i^*\)

由于 \(\mathbf x_0=\text B[\mathbf x_0]_\text B\),有 \([\mathbf x_0]_\text B = \text B^{-1}\mathbf x_0\)\(\mathbf x_0\) 分解为 基矩阵 与 基的坐标向量 乘积的形式)

(注:这里 B 既表示基也表示基构成的方阵;由于基 B 是线性无关的,所以矩阵 B 可逆)

\([\mathbf x_0]_\text B\) 的第 i 个元素为 \(c_i=([\mathbf x_0]_\text B)_i\);那么 \(\mathbf x_0=\text B[\mathbf x_0]_\text B = \sum\limits_{i=1}^nc_i\mathbf b_i\)

由于 B 的各列 \(\mathbf b_i\) 满足 \(A\mathbf b_i = \lambda_i\mathbf b_i\)

那么 \(\mathbf x_k = A^k\mathbf x_0 = A^k\sum\limits_{i=1}^nc_i\mathbf b_i = \sum\limits_{i=1}^nc_iA^k\mathbf b_i=\sum\limits_{i=1}^nc_i\lambda_i^k\mathbf b_i\)

于是 \(\mathbf x_k = \sum\limits_{i=1}^nc_i\lambda_i^k\mathbf b_i\)

例子

  1. \(A=\begin{bmatrix}0.95&0.03\\0.05&0.97\end{bmatrix}\)\(\mathbf x_0=\begin{bmatrix}0.6\\0.4\end{bmatrix}\)\(\mathbf x_k=A\mathbf x_{k-1}\)\(k\ge1\)),化简 \(\mathbf x_k\)
    1. \(\mathbf x_k=A^k\mathbf x_0\)
    2. \(\mathbf x_0\) 表示为 A 的特征向量的线性组合:(1) 由 \(\det(A-\lambda I_n)=0\) 得到特征值 \(\lambda_1=1,\lambda_2=0.92\),(2) 经过计算得到每个特征空间 \(\text{Nul}(A-\lambda_1I_n)=\text{Span}\left\{\begin{bmatrix}0.6\\1\end{bmatrix}\right\},\text{Nul}(A-\lambda_2I_n)=\text{Span}\left\{\begin{bmatrix}-1\\1\end{bmatrix}\right\}\),(3) 求解 \(\begin{bmatrix}0.6&-1\\1&1\end{bmatrix}\begin{bmatrix}c_1\\c_2\end{bmatrix}=\mathbf x_0=\begin{bmatrix}0.6\\0.4\end{bmatrix}\) 得到 \(c_1=\frac58,c_2=-\frac9{40}\),于是 \(\mathbf x_0=c_1\mathbf v_1+c_2\mathbf v_2=\frac58\begin{bmatrix}0.6\\1\end{bmatrix}-\frac9{40}\begin{bmatrix}-1\\1\end{bmatrix}\)
    3. 于是 \(\mathbf x_k=A^k\mathbf x_0=A^k(c_1\mathbf v_1+c_2\mathbf v_2)=c_1A^k\mathbf v_1+c_2A^k\mathbf v_2=c_1\lambda_1^k\mathbf v_1+c_2\lambda_2^k\mathbf v_2=\frac58(1^k)\begin{bmatrix}0.6\\1\end{bmatrix}-\frac9{40}(0.92)^k\begin{bmatrix}-1\\1\end{bmatrix}\)

总结

  1. 特征多项式,特征方程,根的重数:假设 \(A\in M_{n\times n}\)\(\lambda\) 是 A 的特征值,\(\det(A-\lambda I_n)\) 称为特征多项式\(\det(A-\lambda I_n)=0\) 称为特征方程;特征方程根的重数称为 \(\lambda\)(代数)重数
  2. 特征向量基:若 A 存在 n 个线性无关的特征向量,那么这些向量张成 \(\mathbb R^n\),称这个向量集称为特征向量基
  3. 相似,相似变换:\(n\times n\) 矩阵 A 与 B 相似,若存在矩阵 P 使得 \(P^{-1}AP=B\)\(P^{-1}BP=A\)\(A\mapsto P^{-1}AP\) 称为相似变换
  4. 相似定理:若 A 与 B 相似,那么它们具有相同的特征多项式(即特征值解集相同),即 \(\det(A-\lambda I_n)=\det(B-\lambda I_n)\)

一级结论

  1. 矩阵的特征值 \(\lambda\) 的代数重数不小于其特征空间的维数
  2. \(\det A=\prod\limits_{i=1}^n\lambda_i\)
  3. 若 A 与 B 有相同的特征多项式(\(\det(A-\lambda I_n)=\det(B-\lambda I_n)\)),那么 \(\det A=\det B\);推论:A 与 B 相似,那么 \(\det A=\det B\)

二级结论

  1. 特征值算法:假设 A 是方阵:(0) 常规算法是解方程 \(\det(A-\lambda I_n)=0\),(1) \(\text{tr}A=\sum\limits_{i=1}^n\lambda_i\),(2) \(\det A=\prod\limits_{i=1}^n\lambda_i\),(3) 若 A 的各列之和或各行之和为 s,那么一个特征值为 s,(4) 若已知 \(\bf v\) 是特征向量,使用[特征向量的检验算法]可以间接求出一个特征值,(5) 对 A 执行 n 次 QR 分解
  2. \(\begin{bmatrix}a&b\\c&d\end{bmatrix}\) 的特征值为 \(\frac{(a+d)\pm\sqrt{(a-d)^2+4bc}}2\)
  3. 假设 \(3\times 3\) 的矩阵 A 有一个特征值 \(\lambda_1\),那么其余特征值是方程 \(\lambda^2-(\det A/\lambda_1)\lambda+(\det A-\lambda_1)=0\) 的根
  4. 若已知方阵 A 的一些特征值或特征向量,那么 A 的特征值的计算将大大简化
  5. 若矩阵 A 与 B 相似,那么 (1) \(\det(A-\lambda I_n)=\det(A-\lambda I_n)\),(2) \(\text{tr}A=\text{tr}=B\),(3) \(\det A=\det B\),(4) \(\text{rank}A=\text{rank}B\) (5) 存在 \(P=P_1P_2^{-1}\) 使得 \(P^{-1}AP=B\)\(A,B\) 分别对角化为 \(A=P_1DP_1^{-1},B=P_2DP_2^{-1}\)

例子

  1. 计算 \(A=\begin{bmatrix}1&-4\\4&2\end{bmatrix}\) 的特征方程,特征值
  2. 判断题
    1. A 的行列式值等于其对角线上元素的乘积(X)
    2. 对 A 作初等行变换不会改变 A 的行列式值(X)
    3. \((\det A)(\det B)=\det AB\)(Y)
    4. \(\lambda+5\) 是 A 的特征值多项式的因子,那么 5 是 A 的特征值(X)
    5. A 为 \(3\times 3\) 矩阵,那么 \(\det A\) 等于 A 的各列生成的平行六面体的体积(X)
    6. \(\det A^T=(-1)\det A\)(X)
    7. A 的特征方程的根 r 的重数称为特征值 r 的代数重数(Y)
    8. 对 A 作行变换不会改变其特征值(X)
  3. 计算特征值及其重数:(1) \(\begin{bmatrix}1&0&-1\\2&3&-1\\0&6&0\end{bmatrix}\),(2) \(\begin{bmatrix}4&-7&0&2\\0&3&-4&6\\0&0&3&-8\\0&0&0&1\end{bmatrix}\)
  4. \(A=\begin{bmatrix}5&-2&6&-1\\0&3&h&0\\0&0&5&4\\0&0&0&1\end{bmatrix}\),A 的特征值 5 对应的特征空间是 2 维的,计算 h
  5. 证明:\(\det A=\prod\limits_{i=1}^n\lambda_i\)\(\forall\lambda_i\) 是 A 的特征值)
  6. QR 分解:对 A 进行多次迭代分解,其路径上的矩阵 \(A_i\) 与 A 相似,步骤如下:\(\forall i\),将 \(A_i\) 分解为 \(A_i=Q_iR_i\)(其中 \(Q_i^{-1}=Q_i^T\)\(R_i\) 是上三角),得到下一个相似矩阵 \(A_{i+1}=R_iQ_i\),如此反复
  7. 证明:假设 Q 可逆,\(QR\)\(RQ\) 相似
  8. \(A=\begin{bmatrix}0.6&0.3\\0.4&0.7\end{bmatrix},\mathbf x_0=\begin{bmatrix}0.5\\0.5\end{bmatrix}\)
    1. 计算由 A 的特征向量构成的 \(\mathbb R^2\) 的一个基
    2. \(\mathbf x_k=A^k\mathbf x_0\),计算 \(\lim\limits_{k\to+∞}\mathbf x_k\)
  9. \(A=\begin{bmatrix}0.5&0.2&0.3\\0.3&0.8&0.3\\0.2&0&0.4\end{bmatrix},\mathbf v_1=\begin{bmatrix}0.3\\0.6\\0.3\end{bmatrix},\mathbf v_2=\begin{bmatrix}1\\-3\\2\end{bmatrix},\mathbf v_3=\begin{bmatrix}-1\\0\\1\end{bmatrix}\)
    1. 证明:\(\bf v_1,v_2,v_3\) 是 A 的特征值
    2. 构造一个 \(\mathbf x_0\) 使得 \(\mathbf 0\) 的各项非负,并且各项之和为 1;\(\mathbf x_k=A\mathbf x_0\),计算 \(\lim\limits_{k\to+∞}\mathbf x_k\)

提示

(1) \(0=\det(A-\lambda I_n)=\begin{bmatrix}1-\lambda&-4\\4&2-\lambda\end{bmatrix}=\lambda^2-3\lambda+18\)

解得特征值 \(\lambda=\frac{3\pm\sqrt{-63}}2\)

(3)

  1. \(\det\begin{bmatrix}1-\lambda&0&-1\\2&3-\lambda&-1\\0&6&0-\lambda\end{bmatrix}=[-1,1][1,-3,6]-12=[-1,4,-9,6]\)(其中方括号 \([~]\) 表示关于 \(\lambda\) 的多项式向量),枚举 6 的正负整数因子 k,发现不存在 \(\lambda+k\) 能整除特征多项式,于是特征方程没有整数解(无法简单的用手计算特征值)
  2. 上三角矩阵 A 的特征值分别为 4(重数为 1),3(重数为 2),1(重数为 1)

(4) \(A-5I_n=\begin{bmatrix}0&-2&6&-1\\0&-2&h&0\\0&0&0&4\\0&0&0&-4\end{bmatrix}\sim\begin{bmatrix}0&1&-3&0\\0&0&6-h&0\\0&0&0&1\\0&0&0&0\end{bmatrix}\),仅当 \(h=5\) 时,A 的特征值 5 对应的特征空间是 2 维的

(5) 由于 \(\forall\lambda_i\) 是 A 的特征值,蕴涵 \(\det(A-\lambda I_n)=\prod\limits_{i=1}^n(\lambda_i-\lambda)\)

\(\lambda=0\),有 \(\det A=\prod\limits_{i=1}^n\lambda_i\)

(7) 证明 \(\exists P,QR=P^{-1}RQP\):令 \(P=Q^{-1}\),有 \(P^{-1}RQP=(Q^{-1})^{-1}RQQ^{-1}=QR\)

(8)

  1. \(\det(A-\lambda I_n)=(\lambda-1)(\lambda-0.3)\)(注:A 的各列之和为 1,根据[5.1练习10]有 \(\lambda=1\)),于是 \(\lambda_1=1,\lambda_2=0.3\);分别计算 1 和 \(0.3\) 对应的特征方程的基有 \(\left\{\begin{bmatrix}3/4\\1\end{bmatrix}\right\},\left\{\begin{bmatrix}-1\\1\end{bmatrix}\right\}\);由于 A 的所有特征空间的基的向量(共有 2 个)之间线性无关,于是这些向量构成\(\mathbb R^2\) 的一个基,即 \(\left\{\begin{bmatrix}3/4\\1\end{bmatrix},\begin{bmatrix}-1\\1\end{bmatrix}\right\}\)
  2. 解方程 \(\begin{bmatrix}3/4&-1\\1&1\end{bmatrix}\begin{bmatrix}c_1\\c_2\end{bmatrix}=\begin{bmatrix}0.5\\0.5\end{bmatrix}\)\(\begin{bmatrix}3/4&-1&0.5\\1&1&0.5\end{bmatrix}\sim\begin{bmatrix}1&0&4/7\\0&1&-1/14\end{bmatrix}\),于是 \(\mathbf x_0=c_1\mathbf v_1+c_2\mathbf v_2=(4/7)\begin{bmatrix}3/4\\1\end{bmatrix}+(-1/14)\begin{bmatrix}-1\\1\end{bmatrix}\)\(\mathbf x_k=A^k\mathbf x_0=A^k(c_1\mathbf v_1+c_2\mathbf v_2)=c_1\lambda_1^k\mathbf v_1+c_2\lambda_2^k\mathbf v_2=(4/7)(1)^k\begin{bmatrix}3/4\\1\end{bmatrix}+(-1/14)(0.3)^k\begin{bmatrix}-1\\1\end{bmatrix}\),于是 \(\lim\limits_{k\to+∞}\mathbf x_k=(4/7)\begin{bmatrix}3/4\\1\end{bmatrix}=\begin{bmatrix}3/7\\4/7\end{bmatrix}\)

(9)

  1. \(A\mathbf v_1=\mathbf v_1,A\mathbf v_2=0.5\mathbf v_2,A\mathbf v_3=0.2\mathbf v_3\);于是 \(\lambda_1=1,\lambda_2=0.5,\lambda_3=0.2\)
  2. \(\mathbf x_0=c_1\mathbf v_1+c_2\mathbf v_2+c_3\mathbf v_3\),于是 \(1=[1~1~1]\mathbf x_0=[1~1~1](c_1\mathbf v_1+c_2\mathbf v_2+c_3\mathbf v_3)=c_1\),即 \(\mathbf x_0=\mathbf v_1+c_2\mathbf v_2+c_3\mathbf v_3\),蕴涵 \(\mathbf x_k=A^k\mathbf x_0=\lambda_1^k\mathbf v_1+c_2\lambda_2^k\mathbf v_2+c_3\lambda_3^k\mathbf v_3=\mathbf v_1+c_2(0.5)^k\mathbf v_2+c_3(0.2)^k\mathbf v_3\),于是 \(\lim\limits_{k\to+∞}\mathbf x_k=\mathbf v_1\)

3. 对角化

对角矩阵

对角矩阵 \(D\in\mathbb R^{n\times n}\) 除了对角线上的元素外均为 0

性质1:\((D^k)_{ii}=d_{ii}^k\)

性质2:\(D=I\mathbf d\)

对角化求幂算法

\(A,D\in\mathbb R^{n\times n}\)(其中 D 为对角矩阵)相似,即 \(A=PDP^{-1}\)

那么 \(A^k = \prod\limits_{i=1}^k(PDP^{-1})=PD^kP^{-1}\)

例子

  1. \(\begin{bmatrix}5&0\\0&3\end{bmatrix}^k=\begin{bmatrix}5^k&0\\0&3^k\end{bmatrix}\)
  2. \(A=\begin{bmatrix}7&2\\-4&1\end{bmatrix},D=\begin{bmatrix}5&0\\0&3\end{bmatrix},P=\begin{bmatrix}1&1\\-1&-2\end{bmatrix}\),其中 \(A=PDP^{-1}\),计算 \(A^k\)\(A^k=\prod\limits_{i=1}^k(PDP^{-1})=PD^kP^{-1}=\begin{bmatrix}1&1\\-1&-2\end{bmatrix}\begin{bmatrix}5^k&0\\0&3^k\end{bmatrix}\begin{bmatrix}1&1\\-1&-2\end{bmatrix}^{-1}=\begin{bmatrix}2\cdot5^k-3^k&5^k-3^k\\2\cdot3^k-2\cdot5^k&2\cdot3^k-5^k\end{bmatrix}\)

对角化定理

\(A\in\mathbb R^{n\times n}\) 可对角化,当且仅当 A 有 n 个线性无关的特征向量(当且仅当 A 的特征向量的集合(基)张成 \(\mathbb R^n\);该集合称为 特征向量基

可对角化:存在对角矩阵 \(D\in\mathbb R^{n\times n}\) 使得 \(A=PDP^{-1}\)

证明:详见p296

对角化算法:

  1. 通过特征多项式 \(\det(A-\lambda I_n)=0\) 计算特征值集合 \(\mathbf u=(\lambda_1,\cdots,\lambda_n)\),此时 \(D=I_n\mathbf u\)
  2. \(\forall i=1..n\),计算特征空间 \(\text{Nul}(A-\lambda_i I_n)\);得到线性无关的特征向量构成的矩阵 \(P=\begin{bmatrix}\mathbf v_1\cdots\mathbf v_n\end{bmatrix}\)(即 D 以特征向量基作为各列)
  3. 得到 A 的对角化形式 \(A=PDP^{-1}\)

假设 \(\lambda_1,\cdots,\lambda_n\) 是 A 的特征值,\(\mathbf v_1,\cdots,\mathbf v_n\) 是 A 的特征向量(\(\forall i\)\(\lambda_i\)\(\mathbf v_i\) 相对应)

\(AP=A[\mathbf v_1\cdots\mathbf v_n]=[A\mathbf v_1\cdots A\mathbf v_n]=[\lambda_1\mathbf v_1\cdots\lambda_n\mathbf v_n]\)

\(PD=[\mathbf v_1\cdots\mathbf v_n]I_n\begin{bmatrix}\lambda_1\\\vdots\\\lambda_n\end{bmatrix}=[\lambda_1\mathbf v_1\cdots\lambda_n\mathbf v_n]\)

于是 \(AP=PD\)

若 P 可逆,那么 \(\mathbf v_1,\cdots,\mathbf v_n\) 线性无关,于是 \(A=PDP^{-1}\)

\(\blacksquare\)

Tip

  • 方阵 \(A\in\mathbb R^{n\times n}\) 拥有 \(m\le n\) 个本质不同的特征值,不同的特征值可能对应多个特征向量
  • 若 A 的特征向量个数 \(<n\),则这些特征向量不能张成 \(\mathbb R^n\),进而 A 不能对角化

例子

  1. 对角化 \(A=\begin{bmatrix}1&3&3\\-3&-5&-3\\3&3&1\end{bmatrix}\)
    1. \(\det(A-\lambda I_n)=\det\begin{bmatrix}[-1,1]&3&3\\-3&[-1,-5]&-3\\3&3&[-1,1]\end{bmatrix}=[-1,1][1,4,4]+(-3)[3,6]+(-3)[-3,-6]=[-1,1][1,4,4]=[-1,1][1,2]^2\),得到特征值:\(\lambda_1=1,\lambda_2=-2\)(重数分别为 1,2),得到 \(D=\begin{bmatrix}1&0&0\\0&-2&0\\0&0&-2\end{bmatrix}\)
    2. 计算特征空间:\(\text{Nul}(A-\lambda_1 I_n)=\text{Span}\left\{\begin{bmatrix}1\\-1\\1\end{bmatrix}\right\},\text{Nul}(A-\lambda_2 I_n)=\text{Span}\left\{\begin{bmatrix}-1\\1\\0\end{bmatrix},\begin{bmatrix}-1\\0\\1\end{bmatrix}\right\}\),得到 \(P=\begin{bmatrix}1&-1&-1\\-1&1&0\\1&0&1\end{bmatrix}\)
    3. 于是 \(A=PDP^{-1}\)(可以预先验证必要性:\(AP=PD\)
  2. 对角化 \(\begin{bmatrix}5&0&0&0\\0&5&0&0\\1&4&-3&0\\-1&-2&0&-3\end{bmatrix}\)

定理

有 n 个本质不同的特征值的方阵 A 可以对角化

推论:若 A 是对角线元素互不相同的三角矩阵,那么 A 可以对角化

定理

\(A\in\mathbb R^{n\times n}\),其本质不同(相异)的特征值是 \(\lambda_1,\dots,\lambda_p\),那么:

  1. 多于所有 \(1\le i\le p\)\(\lambda_i\) 的特征空间的维数不大于 \(\lambda_i\) 的代数重数
  2. 矩阵 A 可对角化,当且仅当 所有不同特征空间的维数之和为 n(即 特征多项式可完全分解为线性因子;每个 \(\lambda_i\) 的特征空间的维数等于 \(\lambda_i\) 的代数重数)
  3. 若 A 可对角化,那么 \(\cal B_i\) 是对应于 \(\lambda_i\) 的特征空间的基,则集合 \(\{\cal B_1,\dots,\cal B_p\}\) 中所有向量的集合是 \(\mathbb R^n\) 的特征向量基

注:证明参考 p298 下的脚注

Tip

  1. 对角化不唯一

总结

  1. 对角矩阵:\(n\times n\) 矩阵 D 除了对角线上的元素外均为零,称 D 为对角矩阵
  2. 对角化定理:\(n\times n\) 矩阵 A 可对角化,当且仅当具有特征向量基(即 \(A=PDP^{-1}\) 中,D 是对角矩阵,当且仅当 P 的各列是 A 的特征向量基;蕴涵 D 的主对角线元素是对应于 P 中特征向量的特征值)
  3. 可对角化的充分性:(1) A 具有 n 个相异的特征值,(2) A 是对角线元素互不相同的三角矩阵
  4. 定理:假设 \(n\times n\) 矩阵 A 有 p 个相异的特征值,那么:(1) \(\forall i=1..p,\dim\text{Nul}(A-\lambda_i I_n)\le\lambda_i的重数\),(2) A 可对角化,当且仅当特征空间维数之和为 n,即 \(\sum\limits_{i=1}^p\dim\text{Nul}(A-\lambda_i I_n)=n\),(3) 假设 A 可对角化,\(\cal B_i\) 是特征空间 \(\text{Nul}(A-\lambda I_n)\) 的基,那么 \(\bigcap\limits_{i=1}^p\mathcal B_i\)\(\mathbb R^n\) 的特征向量基

一级结论

  1. 若 D 为对角矩阵,那么 \(\forall i=1..n,(D^n)_{ii}=d_{ii}^n\)
  2. 矩阵 A 做对角化变换有 \(P^{-1}AP=D\),那么 \(A^k=\prod\limits_{i=1}^k(PDP^{-1})=PD^kP^{-1}\)
  3. 可逆矩阵 A 可对角化,那么 \(A^{-1}\) 也可逆并且可对角化,\(A^{-1}\) 的特征值分别为 \(1/\lambda_1,\cdots,1/\lambda_n\)\(A^{-1}\) 的特征空间与 A 的特征空间相同
  4. 若矩阵 A 对角化为 \(A=PDP^{-1}\),那么 \(A^T\) 也可对角化,有 \(A^T=QD^TQ^{-1}\)\(Q=(P^T)^{-1}\)
  5. 若方阵 A 对角化为 \(A=PDP^{-1}\),那么 \(\forall\mathbf x\in\mathbb R^n,A^k\mathbf x=A^kP[\mathbf x]_{\cal P}=A^k\sum\limits_{i=1}^nc_i\mathbf p_i=\sum\limits_{i=1}^nc_i(A^k\mathbf p_i)=\sum\limits_{i=1}^nc_i(\lambda_i^k\mathbf p_i)\)(其中 \([\mathbf x]_{\cal P}\)\(\mathbf x\) 在特征向量基下的坐标);或者 \(A^k\mathbf x=(PDP^{-1})^k\mathbf x=PD^kP^{-1}\mathbf x\)

练习

  1. \(A=\begin{bmatrix}4&-3\\2&-1\end{bmatrix}\),计算 \(A^8\)
  2. \(A=\begin{bmatrix}4&-3\\2&-1\end{bmatrix},\mathbf v_1=\begin{bmatrix}3\\1\end{bmatrix},\mathbf v_2=\begin{bmatrix}2\\1\end{bmatrix}\),其中 \(\mathbf v_1,\mathbf v_2\) 是 A 的特征向量
  3. \(4\times 4\) 矩阵 A 的特征值是 \(5,3,-2\),其中 \(\lambda=3\) 的特征空间是二维的,那么 A 能否对角化?
  4. 判断题(假设 \(A,B,P,D\)\(n\times n\) 矩阵)
    1. 若存在矩阵 D 和可逆矩阵 P,使得 \(A=PDP^{-1}\),则 A 可对角化(X)
    2. \(\mathbb R^n\) 有 A 的特征向量基,则 A 可对角化(Y)
    3. A 可对角化,当且仅当 A 的特征值重数之和为 n(X)
    4. 若 A 可对角化,则 A 可逆(X
    5. 若 A 有 n 个特征向量,则 A 可对角化(X)
    6. 若 A 可对角化,则 A 有 n 个相异的特征值(X
    7. \(AP=PD\),D 为对角矩阵,那么 P 的非零列是 A 的特征向量(Y?)
    8. 若 A 可逆,则 A 可对角化(X)
  5. \(A=\begin{bmatrix}-2&12\\-1&5\end{bmatrix}=\begin{bmatrix}3&4\\1&1\end{bmatrix}\begin{bmatrix}2&0\\0&1\end{bmatrix}\begin{bmatrix}-1&4\\1&-3\end{bmatrix}\),计算 \(A^k\)
  6. \(A=\begin{bmatrix}4&0&-2\\2&5&4\\0&0&5\end{bmatrix}=\begin{bmatrix}-2&0&-1\\0&1&2\\1&0&0\end{bmatrix}\begin{bmatrix}5&0&0\\0&5&0\\0&0&4\end{bmatrix}\begin{bmatrix}0&0&1\\2&1&4\\-1&0&-2\end{bmatrix}\),计算 A 的特征值,每个特征空间的基
  7. 证明:若 A 可逆,并且可对角化,则 \(A^{-1}\) 也可对角化
  8. 证明:若 A 可对角化,那么 \(A^T\) 也可对角化

提示

(1) \(\det(A-\lambda I_n)=(\lambda-1)(\lambda-2)\),有 \(\lambda_1=1,\lambda_2=2\),记 $$;进而 \(\text{Nul}(A-\lambda_1 I_n)=\text{Span}\left\{\begin{bmatrix}1\\1\end{bmatrix}\right\},\text{Nul}(A-\lambda_2 I_n)=\text{Span}\left\{\begin{bmatrix}1.5\\1\end{bmatrix}\right\}\),记 \(P=\begin{bmatrix}1&1.5\\1&1\end{bmatrix}\);于是 \(A=PDP^{-1}=\begin{bmatrix}1&1.5\\1&1\end{bmatrix}\begin{bmatrix}1&0\\0&2\end{bmatrix}^8\begin{bmatrix}1&1.5\\1&1\end{bmatrix}^{-1}=\begin{bmatrix}3\cdot2^8-2&3-3\cdot2^8\\2^9-2&3-2^9\end{bmatrix}=\begin{bmatrix}766&-765\\510&-509\end{bmatrix}\)

(2) \(A\mathbf v_1=\begin{bmatrix}3\\1\end{bmatrix}=\mathbf v_1,A\mathbf v_2=\begin{bmatrix}6\\3\end{bmatrix}=3\mathbf v_2\),记 \(D=\begin{bmatrix}1&0\\0&3\end{bmatrix}\)

\(P=\begin{bmatrix}3&2\\1&1\end{bmatrix}\)

\(A=PDP^{-1}\)

(3) \(\dim\text{Nul}(A-3I_n)=2,\dim\text{Nul}(A-5I_n)\ge1,\dim\text{Nul}(A-(-2)I_n)\ge1\),所以各特征空间之和不小于 4,而各特征空间之和个数不大于 4,于是各特征空间之和为 4,于是 A 可对角化

(4.4) 一个反例:A 具有 0 特征值,蕴涵 D 不可逆,于是 A 不可逆;(4.6) 相异特征值个数小于 n,A 也可能可以对角化;(4.8) 一个反例:\(\begin{bmatrix}1&2\\0&1\end{bmatrix}\)

(5) \(A=\begin{bmatrix}3&4\\1&1\end{bmatrix}\begin{bmatrix}2&0\\0&1\end{bmatrix}\begin{bmatrix}-1&4\\1&-3\end{bmatrix}=-\begin{bmatrix}3&4\\1&1\end{bmatrix}\begin{bmatrix}2&0\\0&1\end{bmatrix}\begin{bmatrix}3&4\\1&1\end{bmatrix}^{-1}\),于是 \(A^k=(-1)^k\begin{bmatrix}3&4\\1&1\end{bmatrix}\begin{bmatrix}2&0\\0&1\end{bmatrix}^k\begin{bmatrix}3&4\\1&1\end{bmatrix}^{-1}=\begin{bmatrix}4-3\cdot2^k&12(2^k-1)\\1-2^k&2^{k+2}-3\end{bmatrix}\)

(6) 特征值为 \(\lambda_1=5\)(重数为 2),\(\lambda_2=4\)(重数为 1);两个特征值对应的特征空间的基分别为 \(\left\{\begin{bmatrix}-2\\0\\1\end{bmatrix},\begin{bmatrix}0\\1\\0\end{bmatrix}\right\},\left\{\begin{bmatrix}-1\\2\\0\end{bmatrix}\right\}\)

(7) 假设 A 的对角化为 \(A=PDP^{-1}\),由于 A 可逆,那么 \(A^{-1}=PD^{-1}P^{-1}\)

(8) 假设 A 的对角化为 \(A=PDP^{-1}\),于是 \(A^T=(PDP^{-1})^T=(P^T)^{-1}D^TP^T\);令 \(Q=(P^T)^{-1}\),有 \(A^T=QD^TQ^{-1}\),即 \(A^T\) 可对角化

4. 特征向量,线性变换

在本节,我们将矩阵分解 \(A=PDP^{-1}\) 理解为线性变换;我们还将看到变换 \(\mathbf x\mapsto A\mathbf x\) 的是指是简单的映射 \(\mathbf u\mapsto D\mathbf u\)


V 到 W 的线性变换

\(V, W\) 分别 \(n,m\) 维向量空间,\(\cal B,C\) 分别为 \(V,W\) 的基;有线性变换 \(T~:~V\to W\)

\(\mathbf x\in V, [\mathbf x]_{\cal B}\in\mathbb R^n\)\(T(\mathbf x)\in W,[T(\mathbf x)]_{\cal C}\in\mathbb R^m\)

那么 \(T(\mathbf x)\) 在 W 中以 \({\cal C}\) 为基的坐标为 \([T(\mathbf x)]_{\cal C} = M[\mathbf x]_{\cal B}\) (其中 \(M=\begin{bmatrix}[T(\mathbf b_1)]_{\cal C}\dots [T(\mathbf b_n)]_{\cal C}\end{bmatrix}\),称为T相对于基 \(\cal B\)\(\cal C\) 的矩阵

另外,\(\forall\mathbf v\in\mathbb R^n\)\(\mathbf v\mapsto M\mathbf v\)(或 \([\mathbf x]_{\cal B}\to M[\mathbf x]_{\cal B}\)) 将 V 的坐标映射到 W 中的坐标

\(V, W\) 分别 \(n,m\) 维向量空间,\(\cal B,C\) 分别为 \(V,W\) 的基;线性变换 \(T~:~V\to W\)

即给定了几种映射关系:\(V\underset{P_{\cal B}}{\overset{[~]_{\cal B}}\rightleftharpoons}\mathbb R^n,W\underset{P_{\cal C}}{\overset{[~]_{\cal C}}\rightleftharpoons}\mathbb R^m,V\overset{T}\longrightarrow W\)

\(\forall\mathbf x\in V\),计算映射 \(S:~\mathbf x\mapsto[T(\mathbf x)]_{\cal C}\)

根据[4.4唯一表示定理]有 \(\mathbf x=P_{\cal B}[\mathbf x]_{\cal B}=[\mathbf b_1\cdots\mathbf b_n][\mathbf x]_{\cal B}\)

由于 T 是线性变换,于是 \(T(\mathbf x)=T([\mathbf b_1\cdots\mathbf b_n][\mathbf x]_{\cal B})=[T(\mathbf b_1)\cdots T(\mathbf b_n)][\mathbf x]_{\cal B}\)

由于坐标映射 \([]_{\cal C}\) 也是线性变换,于是 \([T(\mathbf x)]_{\cal C}=[[T(\mathbf b_1)]_{\cal C}\cdots[T(\mathbf b_n)]_{\cal C}][\mathbf x]_{\cal B}\)

\([T(\mathbf x)]_{\cal C} = M[\mathbf x]_{\cal C}\) (其中 \(M=\begin{bmatrix}[T(\mathbf b_1)]_{\cal C}\dots [T(\mathbf b_n)]_{\cal C}\end{bmatrix}\)

\(\blacksquare\)

例子

  1. \(\cal B=\{\bf b_1,b_2\},\cal C=\{\bf c_1,c_2,c_3\}\) 分别是 \(V,W\) 的基,\(T:V\to W\) 是线性变换,满足:\(T(\mathbf b_1)=3\mathbf c_1-2\mathbf c_2+5\mathbf c_3,T(\mathbf b_2)=4\mathbf c_1+7\mathbf c_2-\mathbf c_3\),那么 T 相对于基 \(\cal B\)\(\cal C\) 的矩阵为 \(M=[[T(\mathbf b_1)]_{\cal C}~~[T(\mathbf b_2)]_{\cal C}]=\begin{bmatrix}3&4\\-2&7\\5&-1\end{bmatrix}\)

V 到 V 的线性变换

设 V 为 n 维向量空间,\({\cal B}\) 为 V 的基;有线性变换 \(T~:~V\to V\)

\(\mathbf x,T(\mathbf x)\in V\)\([\mathbf x]_{\cal B}, [T(\mathbf x)]_{\cal B}\in\mathbb R^n\)

那么 \(T(\mathbf x)\) 在 V 中以 \({\cal B}\) 为基的坐标为 \([T(\mathbf x)]_{\cal B}=[T]_{\cal B}[\mathbf x]_{\cal B}\)(其中 \([T]_{\cal B}=\begin{bmatrix}[T(\mathbf b_1)]_{\cal B}\dots [T(\mathbf b_n)]_{\cal B}\end{bmatrix}\)

注:\(M=[T]_{\cal B}\) 称为 T 相对于 \({\cal B}\) 的矩阵,简称为 T 的 \({\cal B}-\)矩阵

例子

  1. \(T:\mathbb P_2\to\mathbb P_2\)\(T(a_0+a_1t+a_2t^2)=a_1+2a_2t\) 是线性变换
    1. 当基 \(\mathcal B=\{1,t,t^2\}\) 时,T 的 \(\cal B-矩阵\)\(M=[[T(\mathbf b_1)]_{\cal B}~~[T(\mathbf b_2)]_{\cal B}~~[T(\mathbf b_3)]_{\cal B}]=[[T(1)]_{\cal B}~~[T(t)]_{\cal B}~~[T(t^2)]_{\cal B}]=\begin{bmatrix}0&1&0\\0&0&2\\0&0&0\end{bmatrix}\)
    2. \(\forall\mathbf p\in\mathbb P_2\)\([T(\mathbf p)]_{\cal B}=[T]_{\cal B}[\mathbf p]_{B}\)

\(\mathbb R^n\)上的线性变换

设 A 可对角化,即其特征空间的基 \({\cal B}\) 张成 \(\mathbb R^n\),而且 \(A=PDP^{-1}\)\({\cal B}=\{\mathbf b_1\dots\mathbf b_n\}, P=[\mathbf b_1\dots\mathbf b_n], D=I\mathbf\lambda\)

\(T~:~\mathbf x\mapsto A\mathbf x\),那么 D 是变换 T 的 \({\cal B}-\) 矩阵(换句话说 \([T(\mathbf x)]_{\cal B} = D[\mathbf x]_{\cal B}\)

注:\(\mathbf x\mapsto A\mathbf x\)\(\mathbf u\mapsto D\mathbf u\) 描述的是相对于不同基的同一个线性变换

证:

假设矩阵 A 可对角化为 \(A=PDP^{-1}\),其中 \(P=[\mathbf b_1\cdots\mathbf b_n]\)\(\mathbb R^n\) 的特征向量基为 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\)

假设有线性变换 \(T:\mathbf x\mapsto A\mathbf x\),那么 \(T的\cal B-矩阵\)\([T]_{\cal B}=[[T(\mathbf b_1)]_{\cal B}\cdots[T(\mathbf b_n)]_{\cal B}]=[[A\mathbf b_1]\cdots[A\mathbf b_n]]\)

\(=[P^{-1}A\mathbf b_1\cdots P^{-1}A\mathbf b_n]=P^{-1}A[\mathbf b_1\cdots\mathbf b_n]=P^{-1}AP=D\)

\([T]_{\cal B}=D\)

\(\blacksquare\)

例子

  1. 假设 \(A=\begin{bmatrix}7&2\\-4&1\end{bmatrix}\)\(\mathbb R^2\to\mathbb R^2\) 的变换 \(T:T(\mathbf x)=A\mathbf x\),计算 \(\mathbb R^2\) 的一个基,使得 \(T的\cal B-矩阵\) 是对角矩阵:将 A 对角化有 \(A=PDP^{-1}\),其中 \(D=\begin{bmatrix}3&0\\0&5\end{bmatrix},P=\begin{bmatrix}-1&-1\\2&1\end{bmatrix}\);若 \(\cal B\) 由 P 的各列构成,那么 \(T的\cal B-矩阵\)\([T]_{\cal B}=D\)

有关向量线性变换的矩阵:

\((V,\mathcal B;V,\mathcal C)\) \(\underset{\cal C\leftarrow B}P\) \(\mathcal B\)\(\mathcal C\) 的坐标变换矩阵
\((\mathbb R^n,\mathcal B;\mathbb R^n,\mathcal E)\) \(P_{\cal B}\) \(\mathcal B\)\(\mathcal E\) 的坐标变换矩阵
\((T;V,\mathcal B)\) \([T]_{\cal B}\) T的 \(\mathcal B\) 矩阵
\((T;V,\mathcal B;W,\mathcal C)\) \(M\) T 相对于基 \(\mathcal B\)\(\mathcal C\) 的矩阵

矩阵表示的相似性

\(A\in\mathbb R^{n\times n}\) 在基 \({\cal B}\) 的列向量构成的矩阵 P 之下,与 C 相似,即 \(A=PCP^{-1}\)(其中 \(P=[\mathbf b_1\dots\mathbf b_n]\)

那么 C 是 \(T~:~\mathbf x\mapsto A\mathbf x\)\({\cal B}-\) 矩阵(即 \([T(\mathbf x)]_{\cal B} = C[\mathbf x]_{\cal B}\)

反之,若 \(T~:~\mathbf x\mapsto A\mathbf x\)\({\cal B}\)\(\mathbb R^n\) 的一个基,那么 T 的 \({\cal B}-\) 矩阵相似于 A

注:若 P 是以 \({\cal B}\) 的向量作为列构成的矩阵,那么 \([T(\mathbf x)]_{\cal B}=P^{-1}AP\)

诺尔当型

总结

  1. \(V\to W\) 的线性变换,线性变换相当于基 \(\cal B,C\) 的矩阵:假设 \(V,W\) 分别为 \(n,m\) 维向量空间,\(\cal B,C\) 分别为 \(V,W\) 的基,有线性变换 \(T:V\to W\),那么 \(\forall\mathbf x\in V\),有 \([T(\mathbf x)]_{\cal C}=M[\mathbf x]_{\cal C}=[[T(\mathbf b_1)]_{\cal C}\cdots[T(\mathbf b_n)]_{\cal C}][\mathbf x]_{\cal B}\);M 称为T 相对于基 \(\cal B\)\(\cal C\) 的矩阵
  2. \(V\to V\) 的线性变换,线性变换的 \(\cal B-矩阵\):假设 V 是 n维向量空间,\(\cal B\) 为 V 的基,有线性变换 \(T:V\to V\),那么 \(T(\mathbf x)\) 在 V 中以 \(\cal B\) 为基的坐标为 \([T(\mathbf x)]_{\cal B}=[T]_{\cal B}[\mathbf x]_{\cal B}=\begin{bmatrix}[T(\mathbf b_1)]_{\cal B}\dots [T(\mathbf b_n)]_{\cal B}\end{bmatrix}[\mathbf x]_{\cal B}\)\([T]_{\cal B}\) 称为T 相当于基 \(\cal B\) 的矩阵T 的 \(\cal B\) 矩阵
  3. \(\mathbb R^n\to\mathbb R^n\) 的线性变换:假设矩阵 A 可对角化为 \(A=PDP^{-1}\),其中 \(P=[\mathbf b_1\cdots\mathbf b_n]\)\(\mathbb R^n\) 对应于 A 的特征向量基为 \(\mathcal B=\{\mathbf b_1,\cdots,\mathbf b_n\}\),有线性变换 \(T:\mathbf x\mapsto A\mathbf x\),那么 \(T的\cal B-矩阵\)\([T]_{\cal B}=D\)

练习

  1. 假设 \(T:\mathbb P_2\to\mathbb P_2\),T 相对于基 \(\mathcal B=\{1,t,t^2\}\) 的矩阵是 \([T]_{\cal B}\),计算 \(T(a_0+a_1t+a_2t^2)\)
  2. 假设 \(A,B,C\)\(n\times n\) 矩阵,证明:
    1. A 相似于 A
    2. 若 A 相似于 B,B 相似于 C,那么 A 相似于 C
  3. \(\mathcal B=\{\mathbf b_1,\mathbf b_2,\mathbf b_3\},\mathcal D=\{\mathbf d_1,\mathbf d_2\}\) 分别是向量空间 \(V,W\) 的基,\(T:V\to W\) 是线性变换,且 \(T(\mathbf{b}_1)=3\mathbf{d}_1-5\mathbf{d}_2,T(\mathbf{b}_2)=-\mathbf{d}_1+6\mathbf{d}_2,T(\mathbf{b}_3)=4\mathbf{d}_2\)
  4. \(\mathcal E=\{\mathbf e_1,\mathbf e_2,\mathbf e_3\},\mathcal B=\{\mathbf b_1,\mathbf b_2,\mathbf b_3\}\) 分别是向量空间 \(\mathbb R^3,V\) 的基,\(T:\mathbb R^3\to V\) 是线性变换,且 \(T(x_1,x_2,x_3)=(x_3-x_2)\mathbf b_1-(x_1+x_3)\mathbf b_2+(x_1-x_2)\mathbf b_3\)
    1. 计算 \(T(\mathbf e_1),T(\mathbf e_2),T(\mathbf e_3)\)
    2. 计算 \([T(\mathbf e_1)]_{\cal B},[T(\mathbf e_2)]_{\cal B},[T(\mathbf e_3)]_{\cal B}\)
    3. 计算 T 相当于 \(\cal E\)\(\cal B\) 的矩阵 M
  5. \(\mathcal B=\{\mathbf b_1,\mathbf b_2,\mathbf b_3\},\mathcal E=\{\mathbf e_1,\mathbf e_2\}\) 分别是向量空间 \(V,\mathbb R^2\) 的基,\(T:V\to\mathbb R^2\) 是线性变换,且 \(T(x_1\mathbf b_1+x_2\mathbf b_2+x_3\mathbf b_3)=\begin{bmatrix}2x_1-4x_2+5x_3\\-x_2+3x_3\end{bmatrix}\),计算 T 相当于 \(\cal B\)\(\cal E\) 的矩阵 M
  6. 证明:A 相似于 B,那么 \(A^k\) 相似于 \(B^k\)
  7. 证明:B 相似于 A,C 相似于 A,那么 B 相似于 C
  8. 证明:若 A 可对角化,B 相似于 A,那么 B 也可对角化(于是某个 \(n\times n\) 的相似矩阵集合中的矩阵同时可对角化或都不可对角化)
  9. 方阵 A 的主对角元素之和称为 A 的轨迹,记为 \(\text{tr}A\);满足 \(\text{tr}(AB)=\text{tr}(BA)\)
    1. 证明:若 A 与 B 相似,那么 \(\text{rank}A=\text{rank}B\)
    2. 证明:若 A 与 B 相似,那么 \(\text{tr}A=\text{tr}B\)
    3. 证明:\(\text{tr}A=\sum\limits_{i=1}^n\lambda_i\)\(\forall\lambda_i\)\(n\times n\) 矩阵 A 的特征值)
  10. -
    1. \(\cal B\)\(V=\mathbb R^n\) 的基,\(\cal E\)\(W=\mathbb R^n\) 的标准基,\(I:~I(\mathbf x)=\mathbf x\)\(V\to W\) 的恒等变换,求 I 相对于 \(\cal B,E\) 的矩阵 M,该矩阵在 [4.4] 中称为什么矩阵?
    2. \(\cal B,C\) 分别是向量空间 \(V,W\) 的基,且 \(V=W\)\(I:~I(\mathbf x)=\mathbf x\)\(V\to W\) 的恒等变换,求 I 相对于 \(\cal B,C\) 的矩阵 M,该矩阵在 [4.7] 中称为什么矩阵?
    3. \(\cal B\) 是向量空间 V 的基,求 \(V\to V\) 的恒等变换 \(I的\cal B-矩阵\)

提示

(1) \([T(a_0+a_1t+a_2t^2)]_{\cal B}=[T]_{\cal B}[a_0+a_1t+a_2t^2]_{\cal B}=\begin{bmatrix}3&4&0\\0&5&-1\\1&-2&7\end{bmatrix}\begin{bmatrix}a_0\\a_1\\a_2\end{bmatrix}=\begin{bmatrix}3a_0+4a_1\\5a_1-a_2\\a_0-2a_1+7a_2\end{bmatrix}\),于是 \(T(a_0+a_1t+a_2t^2)=P_{\cal B}[T(a_0+a_1t+a_2t^2)]_{\cal B}=[1~~t~~t^2]\begin{bmatrix}3a_0+4a_1\\5a_1-a_2\\a_0-2a_1+7a_2\end{bmatrix}=(3a_0+4a_1)+(5a_1-a_2)t+(a_0-2a_1+7a_2)t^2\)

(2)

  1. \(A=I_n^{-1}AI_n\),所以 A 相似于 A
  2. 由假设,存在可逆矩阵 \(P,Q\) 使得 \(B=P^{-1}AP,C=Q^{-1}BQ\),蕴涵 \(C=Q^{-1}P^{-1}APQ=(PQ)^{-1}A(PQ)\),于是 A 相似于 C

(3) \(M=\begin{bmatrix}3&-1&0\\-5&6&4\end{bmatrix}\)

(4)

  1. \(T(\mathbf e_1)=-\mathbf b_2+\mathbf b_3,T(\mathbf e_2)=-\mathbf b_1-\mathbf b_3,T(\mathbf e_3)=\mathbf b_1-\mathbf b_2\)
  2. \([T(\mathbf e_1)]_{\cal B}=\begin{bmatrix}0\\-1\\1\end{bmatrix},[T(\mathbf e_2)]_{\cal B}=\begin{bmatrix}-1\\0\\-1\end{bmatrix},[T(\mathbf e_1)]_{\cal B}=\begin{bmatrix}1\\-1\\0\end{bmatrix}\)
  3. \(M=\begin{bmatrix}0&-1&1\\-1&0&-1\\1&-1&0\end{bmatrix}\)

(5) \(\begin{bmatrix}2&-4&5\\0&-1&3\end{bmatrix}\)

(6) A 相似于 B,蕴涵存在矩阵 P 使得 \(B=P^{-1}AP\),那么 \(B^k=P^{-1}A^kP\),于是 \(A^k\) 相似于 \(B^k\)

(7) 由假设存在矩阵 \(P,Q\) 使得 \(A=P^{-1}BP,A=Q^{-1}CQ\),蕴涵 \(P^{-1}BP=Q^{-1}CQ\),蕴涵 \(C=(PQ^{-1})^{-1}BPQ^{-1}\),即 B 相似于 C

(8) A 可对角化,蕴涵存在 \(P,D\) 使得 \(A=PDP^{-1}\);B 相似于 A,蕴涵存在 Q 使得 \(A=Q^{-1}BQ\);于是 \(B=(QP)D(QP)^{-1}\),即 B 可对角化

(9)

  1. A 与 B 相似,蕴涵 \(B=P^{-1}AP\);由 [4补充习题13,14] 和 P 的可逆性有 \(\text{rank}B=\text{rank}(P^{-1}AP)=\text{rank}(AP)=\text{rank}A\)
  2. A 与 B 相似,蕴涵 \(B=P^{-1}AP\)\(\text{tr}B=\text{tr}(P^{-1}AP)=\text{tr}((P^{-1}A)P)=\text{tr}(P(P^{-1}A))=\text{tr}((P^{-1}P)A)=\text{tr}A\)
  3. 若 A 可对角化,蕴涵存在 \(D,P\) 使得 \(A=PDP^{-1}\)(A 与 D 相似),根据 (9.2) 有 \(\text{tr}A=\text{tr}D=\sum\limits_{i=1}^n\lambda_i\);若 A 不可对角化,

(10)

  1. \(\forall i=1..n,[I(\mathbf b_i)]_{\cal E}=[\mathbf b_i]_{\cal E}=\mathbf b_i\),于是 \(M=[\mathbf b_1\cdots\mathbf b_n]=P_{\cal B}\),于是 M 为从 \(\cal B\)\(\cal E\) 的坐标变换矩阵(\((\mathbb R^n,\mathcal B;\mathbb R^n,\mathcal E)\)
  2. \(\forall i=1..n,[I(\mathbf b_i)]_{\cal C}=[\mathbf b_i]_{\cal C}\),于是 \(M=[[\mathbf b_1]_{\cal C}\cdots[\mathbf b_n]_{\cal C}]=\underset{\cal C\leftarrow B}P\),于是 M 为由 \(\cal B\)\(\cal C\) 的坐标变换矩阵(\((V,\mathcal B;V,\mathcal C)\)
  3. \([I]_{\cal B}=[[I(\mathbf b_1)]_{\cal B}\cdots [I(\mathbf b_n)]_{\cal B}]=[[\mathbf b_1]_{\cal B}\cdots [\mathbf b_n]_{\cal B}]=[\mathbf e_1\cdots\mathbf e_n]=I_n\)

5. 复特征值

\(n\times n\) 矩阵的特征方程是 n 次多项式,若考虑复根,则方程恰好有 n 个根

将实空间情况推广到复空间,目的是 (1) 方便讨论有关方阵 A 的关键信息,(2) 开辟线性代数的新领域

例子

  1. \(A=\begin{bmatrix}0&-1\\1&0\end{bmatrix}\),那么 \(\mathbb R^2\) 上的线性变换 \(\mathbf x\mapsto A\mathbf x\) 将向量逆时针旋转 \(1/4\) 圈,并且具有周期性;复特征值为 \(\lambda_1=i,\lambda_2=-i\),对应的线性无关的复特征向量为 \(\begin{bmatrix}i\\1\end{bmatrix},\begin{bmatrix}-i\\1\end{bmatrix}\)
  2. \(A=\begin{bmatrix}0.5&-0.6\\0.75&1.1\end{bmatrix}\) 的复特征值为 \(\lambda_1=0.8+0.6i,\lambda_2=0.8-0.6i\),对应的线性无关的付特征向量为 \(\begin{bmatrix}-0.4+0.8i\\1\end{bmatrix},\begin{bmatrix}-0.4-0.8i\\1\end{bmatrix}\)\(\mathbf x\mapsto A\mathbf x\) 实质上也是旋转变换

复特征值

假设 \(A\in\mathbb R^{n\times n}\)\(\mathbf x\ne\mathbf 0\)\(\mathbf x\in\mathbb C\)

若存在 \(\mathbf \lambda\in\mathbb C\) 使得 \(A\mathbf x=\lambda\mathbf x\) 有非平凡解 \(\mathbf x\)(当且仅当 \(\det(A-\lambda I)=0\)

那么 \(\lambda\) 称为 A 的(复)特征值,\(\mathbf x\) 称为 A 对应于 \(\lambda\) 的(复)特征向量

复向量

假设 \(\mathbf x\in\mathbb C^n\)\(B\in\mathbb C^{n\times n}\)

(复向量的)实部,虚部:\(\text{Re}~\mathbf x,\text{Im}~\mathbf x\) 分别称为 \(\mathbf x\) 的实部和虚部

共轭向量:\(\overline{\mathbf x}\in\mathbb C^n\) 的各分量分别是 \(\mathbf x\) 中对应分量的共轭复数

共轭矩阵:\(\overline B\) 的各元素分别是 B 中对应分量的共轭复数

共轭运算性质:\(\overline{r\mathbf x}=\overline{r}~\overline{\mathbf x}, \overline{B\mathbf x}=\overline{B}~\overline{\mathbf x}, \overline{BC}=\overline{B}~\overline{C}, \overline{rB}=\overline{r}~\overline{B}\)

作用于 \(\mathbb C^n\) 上的实矩阵的特征值,特征向量

假设 \(A\in\mathbb R^{n\times n}\)\(\lambda\) 是 A 的特征值,\(\mathbf x\) 是对应的特征向量

那么 \(\bar\lambda\) 也是 A 的特征值,\(\bar{\bf x}\) 是对应的特征向量

于是 \(\overline{\lambda},\overline{\mathbf x}\) 也分别是 A 的特征值和特征向量

换句话说复特征值和复特征向量成对出现

注:此处的复数指的是 \(a+ib\)\(b\ne0\)

由于 \(\overline{A\mathbf x}=\overline{A}~\overline{\mathbf x}=A\overline{\mathbf x}\)\(A\overline{\mathbf x}=\overline{A\mathbf x}=\overline{\lambda\mathbf x}=\overline{\lambda}~\overline{\mathbf x}\)

\(\blacksquare\)

例子

  1. \(\begin{bmatrix}0.5&-0.6\\0.75&1.1\end{bmatrix}\) 有成对出现的共轭特征值 \(\lambda_1=0.8+0.6i,\lambda_2=0.8-0.6i\),以及对应的共轭特征向量 \(\begin{bmatrix}-0.4+0.8i\\1\end{bmatrix},\begin{bmatrix}-0.4-0.8i\\1\end{bmatrix}\)

具有复特征值的实矩阵隐含旋转性质

Note

\(A\in\mathbb R^{2\times2}\),有复特征值 \(\lambda=a-bi\)\(b\ne0\))及对应的特征向量 \(\mathbf v\in\mathbb C^2\)

那么 \(A=PCP^{-1}\) (其中 \(P=[\text{Re}~\mathbf v~~\text{Im}~\mathbf v]\)\(C=\begin{bmatrix}a&-b\\b&a\end{bmatrix}\)

注:\(C=\begin{bmatrix}a&-b\\b&a\end{bmatrix}=\begin{bmatrix}\sqrt{a^2+b^2}&0\\0&\sqrt{a^2+b^2}\end{bmatrix}\begin{bmatrix}a/(\sqrt{a^2+b^2})&-b/(\sqrt{a^2+b^2})\\b/(\sqrt{a^2+b^2})&a/(\sqrt{a^2+b^2})\end{bmatrix}=\begin{bmatrix}\sqrt{a^2+b^2}&0\\0&\sqrt{a^2+b^2}\end{bmatrix}\begin{bmatrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{bmatrix}\)(即先旋转一个角度 \(\theta\),然后伸长 \(\sqrt{a^2+b^2}\) 倍)

6. 离散动力系统

根据第 2 节的讨论,对于动力系统 \(\mathbf x_i=A\mathbf x_{i-1}\),有 \(\mathbf x_k = \sum\limits_{i=1}^nc_i\lambda_i^k\mathbf b_i\)\(\mathbf x_0=\begin{bmatrix}c_1\\\vdots\\c_n\end{bmatrix}\)

假设以 \(|\lambda_i|\ge|\lambda_{i+1}|\)\(\lambda\) 的值进行排序,

\(k\to∞\) 时,\(\lambda_1\) 确定了系统的最终变化趋势

例子:捕食者-食饵系统,解的几何意义(\(A\in\mathbb R^{2\times2}\)


另一种推导(?):A 可对角化 \(A=PDP^{-1}\)

由于 \(\mathbf x_k=A\mathbf x_{k-1}=PDP^{-1}\mathbf x_{k-1}\),有 \(P^{-1}\mathbf x_k=DP^{-1}\mathbf x_{i-1}\)

\(\mathbf y_k=P^{-1}\mathbf x_k\)\(\mathbf y_k=D\mathbf y_{k-1}\),因而 \(\mathbf y_k=D^n\mathbf y_0=\mathbf x_0=\begin{bmatrix}\lambda_1^kc_1\\\vdots\\\lambda_n^k c_n\end{bmatrix}\)

于是 \(\mathbf x_k=P\mathbf y_k=[\mathbf b_1\dots\mathbf b_n]\begin{bmatrix}\lambda_1^kc_1\\\vdots\\\lambda_n^k c_n\end{bmatrix}=\sum\limits_{i=1}^nc_i\lambda_i^k\mathbf b_i\)

7. 微分方程中的应用

8. 特征值的迭代估计