文章目录
- 可对角化
- 定义
- 可对角化的刻画
本篇文章适合个人复习翻阅,不建议新手入门使用
可对角化
定义
定义:可对角化的线性映射
若 n n n 维线性空间 V V V 上的线性变换 φ \varphi φ 在某组基 { e 1 , e 2 , … , e n } \{e_1,e_2,\dots,e_n\} {e1,e2,…,en} 下的表示矩阵为对角阵
( λ 1 λ 2 ⋱ λ n ) \begin{pmatrix} \lambda_1&&&\\ &\lambda_2&&\\ &&\ddots&\\ &&&\lambda_n\\ \end{pmatrix} λ1λ2⋱λn
则称 φ \varphi φ 为可对角化线性变换
定义:可对角化的矩阵
设 A A A 是 n n n 阶矩阵,若 A A A 相似于对角阵,即存在可逆阵 P P P,使得 P − 1 A P P^{-1}AP P−1AP 是对角阵,则称 A A A 为可对角化矩阵
定义:几何重数和代数重数
特征子空间的维数称为该特征值的几何重数,特征值作为特征多项式根的重数称为该特征值的代数重数
性质
几何重数不大于代数重数,取等时称 φ \varphi φ 有完全的特征向量系
证明
设特征值 λ 0 \lambda_0 λ0 的代数重数为 m m m,几何重数为 t t t, V 0 V_0 V0 是 λ 0 \lambda_0 λ0 的特征子空间
设 { e 1 , e 2 , … , e t } \{e_1,e_2,\dots,e_t\} {e1,e2,…,et} 是 V 0 V_0 V0 的一组基,则
φ ( e i ) = λ 0 e i \varphi(e_i)=\lambda_0e_i φ(ei)=λ0ei
扩充为 V V V 的一组基 { e 1 , … , e t , e t + 1 , … , e n } \{e_1,\dots,e_t,e_{t+1},\dots,e_n\} {e1,…,et,et+1,…,en}, φ \varphi φ 在这组基下的表示矩阵形如
( λ 0 I t ∗ O B ) \begin{pmatrix} \lambda_0I_t&*\\ O&B\\ \end{pmatrix} (λ0ItO∗B)
故 φ \varphi φ 的特征多项式形如
∣ λ I − A ∣ = ( λ − λ 0 ) t ∣ λ I n − t − B ∣ |\lambda I-A|=(\lambda-\lambda_0)^t|\lambda I_{n-t}-B| ∣λI−A∣=(λ−λ0)t∣λIn−t−B∣
这表明 λ 0 \lambda_0 λ0 的代数重数至少为 t t t,即 t ≤ m t\leq m t≤m
可对角化的刻画
命题:可对角化的刻画
设 φ \varphi φ 是 n n n 维线性空间 V V V 上的线性变换,则下列等价
- φ \varphi φ 可对角化
- φ \varphi φ 有 n n n 个线性无关的特征向量
- V = V 1 ⊕ V 2 ⊕ ⋯ ⊕ V k V=V_1\oplus V_2\oplus \cdots\oplus V_k V=V1⊕V2⊕⋯⊕Vk
- φ \varphi φ 的任意特征值的代数重数等于几何重数
其中 λ 1 , … , λ k \lambda_1,\dots,\lambda_k λ1,…,λk 是 φ \varphi φ 的全部不同的特征值, V 1 , … , V k V_1,\dots,V_k V1,…,Vk 是相应的特征子空间
证明思路
(1)推(2):容易验证 e 1 , e 2 , … , e n e_1,e_2,\dots,e_n e1,e2,…,en 是 n n n 个线性无关的特征向量
(2)推(1): φ \varphi φ 在这 n n n 个特征向量组成的基下的表示矩阵显然为对角阵
(3)推(2):只需取 V i V_i Vi 的基,拼成 V V V 的一组基
(2)推(3):设 φ \varphi φ 的 n n n 个线性无关的特征向量 { e 1 , e 2 , … , e n } \{e_1,e_2,\dots,e_n\} {e1,e2,…,en}
不失一般性,设这组基中前 t 1 t_1 t1 个是特征值 λ 1 \lambda_1 λ1 的特征向量,接下来 t 2 t_2 t2 个是特征值 λ 2 \lambda_2 λ2 的特征向量,……
对任意 α ∈ V \alpha\in V α∈V,设 α = a 1 e 1 + a 2 e 2 + ⋯ + a n e n \alpha=a_1e_1+a_2e_2+\cdots+a_ne_n α=a1e1+a2e2+⋯+anen,故 V = V 1 + V 2 + ⋯ + V k V=V_1+V_2+\cdots+V_k V=V1+V2+⋯+Vk,由引理可得 V = V 1 ⊕ V 2 ⊕ ⋯ ⊕ V k V=V_1\oplus V_2\oplus \cdots\oplus V_k V=V1⊕V2⊕⋯⊕Vk
引理
设 λ 1 , λ 2 , … , λ k \lambda_1,\lambda_2,\dots,\lambda_k λ1,λ2,…,λk 为 n n n 维线性空间 V V V 上的线性变换 φ \varphi φ 的不同的特征值,则
V 1 + V 2 + ⋯ + V k = V 1 ⊕ V 2 ⊕ ⋯ ⊕ V k V_1+V_2+\cdots+V_k=V_1\oplus V_2\oplus\cdots\oplus V_k V1+V2+⋯+Vk=V1⊕V2⊕⋯⊕Vk
证明思路
用归纳法证明 V k ∩ ( V 1 + V 2 + ⋯ + V k − 1 ) = 0 V_k\cap (V_1+V_2+\cdots+V_{k-1})=0 Vk∩(V1+V2+⋯+Vk−1)=0 即可
(3)等价于(4):设 m i m_i mi 为代数重数, t i t_i ti 为几何重数,注意到
∑ i = 1 n dim V i = ∑ i = 1 n t i ≤ ∑ i = 1 n m i = dim V \sum\limits_{i=1}^n\dim V_i=\sum\limits_{i=1}^nt_i\leq \sum\limits_{i=1}^nm_i= \dim V i=1∑ndimVi=i=1∑nti≤i=1∑nmi=dimV
(3)推(4)即是说 ∑ i = 1 n dim V i = dim V \sum\limits_{i=1}^n\dim V_i=\dim V i=1∑ndimVi=dimV
(4)推(3)即是说 ∑ i = 1 n t i = ∑ i = 1 n m i \sum\limits_{i=1}^nt_i=\sum\limits_{i=1}^nm_i i=1∑nti=i=1∑nmi
命题:可对角化的判定
若 n n n 维线性空间 V V V 上的线性变换 φ \varphi φ 有 n n n 个不同的特征值,则 φ \varphi φ 必可对角化
证明思路
首先易证线性变换 φ \varphi φ 属于不同特征值的特征向量必线性无关,则可取到 n n n 个线性无关的特征向量
参考书:《高等代数学》谢启鸿 姚慕生 吴泉水 编著