矩阵的秩
1. 基础
初等变换不改变矩阵的秩。
阶梯形矩阵非零行的个数即为该矩阵的秩。
r ( A ) = r ( A T ) = r ( A T A ) = r ( A A T ) r(\boldsymbol{A})=r(\boldsymbol{A}^{\mathrm{T}})=r(\boldsymbol{A}^{\mathrm{T}}\boldsymbol{A})=r(\boldsymbol{A}\boldsymbol{A}^{\mathrm{T}}) r(A)=r(AT)=r(ATA)=r(AAT)(因为齐次线性方程组 A x = 0 \boldsymbol{A}\boldsymbol{x}=\boldsymbol{0} Ax=0与 A T A x = 0 \boldsymbol{A}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0} ATAx=0同解)。
r ( A + B ) ≤ r ( A ) + r ( B ) r(\boldsymbol{A}+\boldsymbol{B})\le r(\boldsymbol{A})+r(\boldsymbol{B}) r(A+B)≤r(A)+r(B)(因为 A + B \boldsymbol{A}+\boldsymbol{B} A+B的列向量组可以由 A \boldsymbol{A} A的列向量组加上 B \boldsymbol{B} B的列向量组线性表示)。
r ( A B ) ≤ min { r ( A ) , r ( B ) } r(\boldsymbol{A}\boldsymbol{B})\le\min\{r(\boldsymbol{A}),r(\boldsymbol{B})\} r(AB)≤min{r(A),r(B)}( A B \boldsymbol{A}\boldsymbol{B} AB的每个列向量组可由 A \boldsymbol{A} A的列向量线性表示;再转置一下以考虑 B \boldsymbol{B} B)。
2. 秩与行列式的关系
矩阵 A \boldsymbol{A} A的秩 r ( A ) r(\boldsymbol{A}) r(A)是 A \boldsymbol{A} A中非零子式的最高阶数。
r ( A ) = 0 ⟺ A = O r(\boldsymbol{A})=0\iff \boldsymbol{A}=\boldsymbol{O} r(A)=0⟺A=O。
r ( A ) = r ⟺ A r(\boldsymbol{A})=r\iff \boldsymbol{A} r(A)=r⟺A中存在 r r r阶非 0 0 0子式,且所有 r + 1 r+1 r+1阶子式为 0 0 0。
∣ A ∣ ≠ 0 ⟺ r ( A ) = n ⟺ A |\boldsymbol{A}|\ne 0\iff r(\boldsymbol{A})=n\iff \boldsymbol{A} ∣A∣=0⟺r(A)=n⟺A为满秩方阵;否则为降秩方阵。
3. 秩与伴随矩阵的关系
- 若 r ( A ) = n r(\boldsymbol{A})=n r(A)=n,则 r ( A ∗ ) = n r(\boldsymbol{A}^*)=n r(A∗)=n;
- 若 r ( A ) = n − 1 r(\boldsymbol{A})=n-1 r(A)=n−1,则 r ( A ∗ ) = 1 r(\boldsymbol{A}^*)=1 r(A∗)=1;
- 若 r ( A ) < n − 1 r(\boldsymbol{A})<n-1 r(A)<n−1,则 r ( A ∗ ) = 0 r(\boldsymbol{A}^*)=0 r(A∗)=0。
证明提要:第一种情况是显然的,第三种情况只需考虑子式即可。
对于第二种情况,由于 A \boldsymbol{A} A有 n − 1 n-1 n−1阶非零子式,而该子式一定是某个元素的余子式,故 A ∗ \boldsymbol{A}^* A∗中有非零元,因此 r ( A ∗ ) ≥ 1 r(\boldsymbol{A}^*)\ge 1 r(A∗)≥1。
又 A A ∗ = ∣ A ∣ I = 0 I = O \boldsymbol{A}\boldsymbol{A}^*=|\boldsymbol{A}|\boldsymbol{I}=0\boldsymbol{I}=\boldsymbol{O} AA∗=∣A∣I=0I=O,则 A ∗ \boldsymbol{A}^* A∗的列向量都是线性方程组 A x = 0 \boldsymbol{A}\boldsymbol{x}=\boldsymbol{0} Ax=0的解,而这个线性方程组的基础解系的秩为 n − r ( A ) = 1 n-r(\boldsymbol{A})=1 n−r(A)=1,故 r ( A ∗ ) ≤ 1 r(\boldsymbol{A}^*)\le 1 r(A∗)≤1。
综上, r ( A ∗ ) = 1 r(\boldsymbol{A}^*)=1 r(A∗)=1。
4. 秩标准型
设 r ( A m × n ) = r > 0 r(\boldsymbol{A}_{m\times n})=r>0 r(Am×n)=r>0,则必存在 m m m阶可逆方阵 P \boldsymbol{P} P和 n n n阶可逆方阵 Q \boldsymbol{Q} Q,使得 A = P [ I r O O O ] m × n Q \boldsymbol{A}=\boldsymbol{P}{\begin{bmatrix}\boldsymbol{I}_r&\boldsymbol{O}\\\boldsymbol{O}&\boldsymbol{O}\end{bmatrix}}_{m\times n}\boldsymbol{Q} A=P[IrOOO]m×nQ。
A m × n \boldsymbol{A}_{m\times n} Am×n的秩为 m ⟺ A m\iff\boldsymbol{A} m⟺A为行满秩矩阵(秩=行数)。
A m × n \boldsymbol{A}_{m\times n} Am×n的秩为 n ⟺ A n\iff\boldsymbol{A} n⟺A为列满秩矩阵(秩=列数)。
满秩分解: A = G H \boldsymbol{A}=\boldsymbol{G}\boldsymbol{H} A=GH, G \boldsymbol{G} G列满秩, H \boldsymbol{H} H行满秩,其中 G = P [ I r O ] \boldsymbol{G}=\boldsymbol{P}\begin{bmatrix}\boldsymbol{I}_r\\\boldsymbol{O}\end{bmatrix} G=P[IrO], H = [ I r O ] Q \boldsymbol{H}=\begin{bmatrix}\boldsymbol{I}_r&\boldsymbol{O}\end{bmatrix}\boldsymbol{Q} H=[IrO]Q。
5. 秩与分块矩阵的关系
r ( [ A O O B ] ) = r ( A ) + r ( B ) r\left(\begin{bmatrix}\boldsymbol{A}&\boldsymbol{O}\\\boldsymbol{O}&\boldsymbol{B}\end{bmatrix}\right)=r(\boldsymbol{A})+r(\boldsymbol{B}) r([AOOB])=r(A)+r(B)。
证明提要: A \boldsymbol{A} A和 B \boldsymbol{B} B分别化为秩标准型,然后用初等变换把 I r ( B ) \boldsymbol{I}_{r(\boldsymbol{B})} Ir(B)挪到 I r ( A ) \boldsymbol{I}_{r(\boldsymbol{A})} Ir(A)的右下角,形成 I r ( A ) + r ( B ) \boldsymbol{I}_{r(\boldsymbol{A})+r(\boldsymbol{B})} Ir(A)+r(B)。
r ( [ A C O B ] ) ≥ r ( A ) + r ( B ) r\left(\begin{bmatrix}\boldsymbol{A}&\boldsymbol{C}\\\boldsymbol{O}&\boldsymbol{B}\end{bmatrix}\right)\ge r(\boldsymbol{A})+r(\boldsymbol{B}) r([AOCB])≥r(A)+r(B)。
证明: A \boldsymbol{A} A有 r ( A ) r(\boldsymbol{A}) r(A)阶非零子式, B \boldsymbol{B} B有 r ( B ) r(\boldsymbol{B}) r(B)阶非零子式,故 [ A C O B ] \begin{bmatrix}\boldsymbol{A}&\boldsymbol{C}\\\boldsymbol{O}&\boldsymbol{B}\end{bmatrix} [AOCB]有 r ( A ) + r ( B ) r(\boldsymbol{A})+r(\boldsymbol{B}) r(A)+r(B)阶非零子式,因此其秩不小于 r ( A ) + r ( B ) r(\boldsymbol{A})+r(\boldsymbol{B}) r(A)+r(B)。
6. 秩与向量组的关系
向量组的秩定义为其极大无关组中所含向量的个数。
矩阵行向量组的秩称为行秩,列向量组的秩称为列秩。矩阵三秩相等:矩阵的秩=矩阵的列秩=矩阵的行秩。
若向量组 U U U可由向量组 V V V线性表示,则 r ( U ) ≤ r ( V ) r(U)\le r(V) r(U)≤r(V)。
两个向量组等价,即一个向量组的所有向量都可以由另一个向量线性表示。若向量组 U U U和 V V V等价,则 r ( U ) = r ( V ) r(U)=r(V) r(U)=r(V)。
7. 秩与线性方程组的关系
方程组有解当且仅当增广矩阵与系数矩阵的秩相等。
基础解系的秩为 n − r ( A ) n-r(\boldsymbol{A}) n−r(A)。
8. 秩与特征值的关系
矩阵 A \boldsymbol{A} A的零特征值的代数重数至少为 n − r ( A ) n-r(\boldsymbol{A}) n−r(A)。这是因为代数重数大于等于几何重数,而齐次线性方程组 A x = 0 \boldsymbol{A}\boldsymbol{x}=\boldsymbol{0} Ax=0基础解系的秩就是 A \boldsymbol{A} A的零特征值的几何重数,其中基础解系的秩为 n − r ( A ) n-r(\boldsymbol{A}) n−r(A)。
9. 秩与相似对角化的关系
相似对角化不改变矩阵的秩;对于可相似对角化的矩阵,其秩等于非零特征值个数。
10. 秩与线性空间的关系
线性空间的维数为其基所含向量的个数。
若线性空间 W = span { α 1 , α 2 , ⋯ , α m } W=\operatorname{span}\{\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m\} W=span{α1,α2,⋯,αm},则 W W W的维数为向量组 α 1 , α 2 , ⋯ , α m \boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_m α1,α2,⋯,αm的秩。
11. 秩与二次型的关系
二次型的秩定义为其矩阵的秩。
12. 秩与合同矩阵的性质
若 A \boldsymbol{A} A与 B \boldsymbol{B} B合同( A ≃ B \boldsymbol{A}\simeq \boldsymbol{B} A≃B),则 r ( A ) = r ( B ) r(\boldsymbol{A})=r(\boldsymbol{B}) r(A)=r(B)(因为合同变换乘的矩阵是可逆矩阵)。
行列式
1. 基础
余子式: n n n阶行列式中删除 a i j a_{ij} aij所在的行和列剩下的 n − 1 n-1 n−1阶行列式称为 a i j a_{ij} aij的余子式,记作 M i j M_{ij} Mij。
代数余子式: a i j a_{ij} aij的代数余子式 A i j = ( − 1 ) i + j M i j A_{ij}={(-1)}^{i+j} M_{ij} Aij=(−1)i+jMij。
性质:
(1) ∣ A ∣ = ∣ A T ∣ |\boldsymbol{A}|=|\boldsymbol{A}^{\mathrm{T}}| ∣A∣=∣AT∣。
(2) 互换行列式两列位置,行列式的值反号。
(3) 行列式 D D D等于它任一行/列各元素与其对应的代数余子式的乘积之和,即 D = ∑ j = 1 n a i j A i j = ∑ i = 1 n a i j A i j D=\sum\limits_{j=1}^n a_{ij}A_{ij}=\sum\limits_{i=1}^n a_{ij}A_{ij} D=j=1∑naijAij=i=1∑naijAij。
(4) 行列式某一行元素全为 0 0 0,则该行列式为 0 0 0。
(5) 用一个数乘行列式,就等于用数乘行列式某行/列的每个元素。
(6) 若行列式某行的每个元素都是两个数的和,则可将此行列式写成两个行列式的和。
(7) 若行列式中有两行对应的元素成比例,则该行列式为 0 0 0。
(8) 把行列式某行的 k k k倍加到另一行上去,行列式的值不变。
(9) 行列式任一行各元素分别与另一行对应元素的代数余子式的乘积之和为零。即 ∑ j = 1 n a i j A k j = { D , k = i 0 , k ≠ i \sum\limits_{j=1}^{n} a_{ij}A_{kj}=\begin{cases}D,&k=i\\0,&k\ne i\end{cases} j=1∑naijAkj={D,0,k=ik=i三角形行列式等于其对角线元素之积。
2. 行列式与矩阵的关系
∣ k A ∣ = k n ∣ A ∣ |k\boldsymbol{A}|=k^n|\boldsymbol{A}| ∣kA∣=kn∣A∣。
∣ A B ∣ = ∣ A ∣ ∣ B ∣ |\boldsymbol{A}\boldsymbol{B}|=|\boldsymbol{A}||\boldsymbol{B}| ∣AB∣=∣A∣∣B∣。
3. 行列式与分块矩阵的关系
∣ A O O B ∣ = ∣ A ∣ ∣ B ∣ \begin{vmatrix}\boldsymbol{A}&\boldsymbol{O}\\\boldsymbol{O}&\boldsymbol{B}\end{vmatrix}=|\boldsymbol{A}||\boldsymbol{B}| AOOB =∣A∣∣B∣
4. 行列式与逆矩阵的关系
伴随矩阵 A ∗ \boldsymbol{A}^* A∗:在 A \boldsymbol{A} A中,把 a i j a_{ij} aij换成 A i j A_{ij} Aij然后再转置。
A ∗ A = A A ∗ = ∣ A ∣ I \boldsymbol{A}^*\boldsymbol{A}=\boldsymbol{A}\boldsymbol{A}^*=|\boldsymbol{A}|\boldsymbol{I} A∗A=AA∗=∣A∣I; ∣ A ∗ ∣ = ∣ A ∣ n − 1 |\boldsymbol{A}^*|={|\boldsymbol{A}|}^{n-1} ∣A∗∣=∣A∣n−1; A − 1 = A ∗ ∣ A ∣ \boldsymbol{A}^{-1}=\frac{\boldsymbol{A}^*}{|\boldsymbol{A}|} A−1=∣A∣A∗。
∣ A − 1 ∣ = 1 ∣ A ∣ |\boldsymbol{A}^{-1}|=\frac{1}{|\boldsymbol{A}|} ∣A−1∣=∣A∣1。
5. 行列式与初等变换的关系
三种初等变换/初等矩阵:
- 交换两行——行列式为 − 1 -1 −1
- 把一行乘 k k k——行列式为 k k k
- 把一行的 k k k倍加到另一行——行列式为 1 1 1
6. 行列式与向量组的关系
n n n个 n n n维向量 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n α1,α2,⋯,αn线性无关,当且仅当 ∣ α 1 α 2 ⋯ α m ∣ ≠ 0 \begin{vmatrix}\boldsymbol{\alpha}_1&\boldsymbol{\alpha}_2&\cdots&\boldsymbol{\alpha}_m\end{vmatrix}\ne 0 α1α2⋯αm =0。
7. 行列式与线性方程组的关系
对 n n n个方程、 n n n个位置数组成的线性方程组 A x = b \boldsymbol{A}\boldsymbol{x}=\boldsymbol{b} Ax=b,若 ∣ A ∣ ≠ 0 |\boldsymbol{A}|\ne 0 ∣A∣=0,则方程有唯一解。
若 b = 0 \boldsymbol{b}=0 b=0,则称 A x = 0 \boldsymbol{A}\boldsymbol{x}=0 Ax=0为齐次线性方程组,它有非零解当且仅当 ∣ A ∣ = 0 |\boldsymbol{A}|=0 ∣A∣=0。
8. 行列式与特征值的关系
特征值的定义是满足 ∣ A − λ I ∣ = 0 |\boldsymbol{A}-\lambda\boldsymbol{I}|=0 ∣A−λI∣=0的 λ \lambda λ。
∣ A ∣ = λ 1 λ 2 ⋯ λ n |\boldsymbol{A}|=\lambda_1\lambda_2\cdots\lambda_n ∣A∣=λ1λ2⋯λn; tr ( A ) = λ 1 + λ 2 + ⋯ + λ n \operatorname{tr}(A)=\lambda_1+\lambda_2+\cdots+\lambda_n tr(A)=λ1+λ2+⋯+λn。
注意,矩阵的多项式的特征值就是特征值的多项式,所以矩阵多项式的行列式可以用特征值算出来。
9. 行列式与相似矩阵的关系
若 A ∼ B \boldsymbol{A}\sim \boldsymbol{B} A∼B,则 ∣ A ∣ = ∣ B ∣ |\boldsymbol{A}|=|\boldsymbol{B}| ∣A∣=∣B∣。
10. 行列式与正定矩阵的关系
若 A \boldsymbol{A} A正定,则 ∣ A ∣ > 0 |\boldsymbol{A}|>0 ∣A∣>0, ∣ I + A ∣ > 1 |\boldsymbol{I}+\boldsymbol{A}|>1 ∣I+A∣>1。
11. 其他
箭形行列式 ∣ a 11 a 12 a 13 ⋯ a 1 n a 21 a 22 a 31 a 33 ⋱ a n 1 a n n ∣ \begin{vmatrix}a_{11}&a_{12}&a_{13}&\cdots&a_{1n}\\a_{21}&a_{22}&\\a_{31}&&a_{33}\\&&&\ddots\\a_{n1}&&&&a_{nn}\end{vmatrix} a11a21a31an1a12a22a13a33⋯⋱a1nann :从第二行开始,用对角元把每一行的第一个元素消掉即可(即 c 1 − c i c_1-\frac{}{}c_i c1−ci, i = 2 , 3 , ⋯ , n i=2,3,\cdots,n i=2,3,⋯,n)。
范德蒙德行列式 ∣ 1 1 ⋯ 1 a 1 a 2 ⋯ a n a 1 2 a 2 2 ⋯ a n 2 ⋮ ⋮ ⋮ a 1 n − 1 a 2 n − 1 ⋯ a n n − 1 ∣ \begin{vmatrix}1&1&\cdots&1\\a_1&a_2&\cdots&a_n\\a_1^2&a_2^2&\cdots&a_n^2\\\vdots&\vdots&&\vdots\\a_1^{n-1}&a_2^{n-1}&\cdots&a_n^{n-1}\end{vmatrix} 1a1a12⋮a1n−11a2a22⋮a2n−1⋯⋯⋯⋯1anan2⋮ann−1 :其值为 ∏ 1 ≤ i < j ≤ n ( a j − a i ) \prod\limits_{1\le i<j\le n}(a_j-a_i) 1≤i<j≤n∏(aj−ai)。由此还可以得出给定 n n n个互异点的 n − 1 n-1 n−1次插值多项式是唯一的。
几何
1. 一些概念
方向余弦: a = ∥ a ∥ ( cos α , cos β , cos γ ) \boldsymbol{a}=\|\boldsymbol{a}\|(\cos\alpha,\cos\beta,\cos\gamma) a=∥a∥(cosα,cosβ,cosγ),这些角度是与各坐标轴正向的夹角。
叉积: ∥ a × b ∥ = ∥ a ∥ ∥ b ∥ sin ( a , b ) \|\boldsymbol{a}\times\boldsymbol{b}\|=\|\boldsymbol{a}\|\|\boldsymbol{b}\|\sin(\boldsymbol{a},\boldsymbol{b}) ∥a×b∥=∥a∥∥b∥sin(a,b)。 a × b = ∣ i j k x a y a z a x b y b z b ∣ \boldsymbol{a}\times \boldsymbol{b}=\begin{vmatrix}\boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\x_a&y_a&z_a\\x_b&y_b&z_b\end{vmatrix} a×b= ixaxbjyaybkzazb 。
2. 平面
设平面的法向量为 n \boldsymbol{n} n,平面过点 P 0 \boldsymbol{P}_0 P0,则平面的点法式方程为 n ⋅ P 0 P → = 0 \boldsymbol{n}\cdot\overrightarrow{\boldsymbol{P}_0\boldsymbol{P}}=0 n⋅P0P=0。
若平面一般式方程为 A x + b y + C z + D = 0 Ax+by+Cz+D=0 Ax+by+Cz+D=0,则法向量为 ( A , B , C ) (A,B,C) (A,B,C)。
平面与哪个坐标轴平行,平面方程就缺哪一项(因为改变那一项的值不会让平面上的点离开平面)。
截距式方程: x a + y b + z c = 1 \frac{x}{a}+\frac{y}{b}+\frac{z}{c}=1 ax+by+cz=1。
参数式方程:设平面是由向量 a \boldsymbol{a} a和 b \boldsymbol{b} b张成的,则平面上任一点 r \boldsymbol{r} r满足 r = r 0 + s a + t b \boldsymbol{r}=\boldsymbol{r}_0+s\boldsymbol{a}+t\boldsymbol{b} r=r0+sa+tb,其中 s , t s,t s,t是参数, r 0 \boldsymbol{r}_0 r0是平面上一点。
3. 直线
参数式方程: r = r 0 + t a \boldsymbol{r}=\boldsymbol{r}_0+t\boldsymbol{a} r=r0+ta,其中 t t t是参数, a \boldsymbol{a} a是方向向量。
对称式方程: x − x 0 l = y − y 0 m = z − z 0 n \frac{x-x_0}{l}=\frac{y-y_0}{m}=\frac{z-z_0}{n} lx−x0=my−y0=nz−z0,其中 a = ( l , m , n ) \boldsymbol{a}=(l,m,n) a=(l,m,n), r 0 = ( x 0 , y 0 , z 0 ) \boldsymbol{r}_0=(x_0,y_0,z_0) r0=(x0,y0,z0)。
一般式方程:两个平面一般式方程联立。
欧氏空间
内积:
- 对称性: ⟨ a , b ⟩ = ⟨ b , a ⟩ \lang\boldsymbol{a},\boldsymbol{b}\rang=\lang\boldsymbol{b},\boldsymbol{a}\rang ⟨a,b⟩=⟨b,a⟩
- 加性: ⟨ a + b , c ⟩ = ⟨ a , c ⟩ + ⟨ b , c ⟩ \lang\boldsymbol{a}+\boldsymbol{b},\boldsymbol{c}\rang=\lang\boldsymbol{a},\boldsymbol{c}\rang+\lang\boldsymbol{b},\boldsymbol{c}\rang ⟨a+b,c⟩=⟨a,c⟩+⟨b,c⟩
- 齐次性: ⟨ k a , b ⟩ = k ⟨ a , b ⟩ \lang k\boldsymbol{a},\boldsymbol{b}\rang=k\lang\boldsymbol{a},\boldsymbol{b}\rang ⟨ka,b⟩=k⟨a,b⟩
- 非负性: ⟨ a , a ⟩ ≥ 0 \lang\boldsymbol{a},\boldsymbol{a}\rang\ge 0 ⟨a,a⟩≥0,且等号成立当且仅当 a = 0 \boldsymbol{a}=\boldsymbol{0} a=0
范数: ∥ a ∥ = ⟨ a , a ⟩ \|\boldsymbol{a}\|=\sqrt{\lang\boldsymbol{a},\boldsymbol{a}\rang} ∥a∥=⟨a,a⟩
- 非负性: ∥ a ∥ ≥ 0 \|\boldsymbol{a}\|\ge 0 ∥a∥≥0,且 ∥ a ∥ = 0 \|\boldsymbol{a}\|=0 ∥a∥=0当且仅当 a = 0 \boldsymbol{a}=\boldsymbol{0} a=0
- 齐次性: ∥ k a ∥ = ∣ k ∣ ∥ a ∥ \|k\boldsymbol{a}\|=|k|\|\boldsymbol{a}\| ∥ka∥=∣k∣∥a∥
- 三角不等式: ∥ a + b ∥ ≤ ∥ a ∥ + ∥ b ∥ \|\boldsymbol{a}+\boldsymbol{b}\|\le \|\boldsymbol{a}\|+\|\boldsymbol{b}\| ∥a+b∥≤∥a∥+∥b∥
Cauchy-Schwarz不等式: ⟨ a , b ⟩ 2 ≤ ∥ a ∥ 2 ∥ b ∥ 2 {\lang\boldsymbol{a},\boldsymbol{b}\rang}^2\le{\|\boldsymbol{a}\|}^2{\|\boldsymbol{b}\|}^2 ⟨a,b⟩2≤∥a∥2∥b∥2
非零向量的夹角: φ = arccos ⟨ a , b ⟩ ∥ a ∥ ∥ b ∥ \varphi=\arccos\frac{\lang\boldsymbol{a},\boldsymbol{b}\rang}{\|\boldsymbol{a}\|\|\boldsymbol{b}\|} φ=arccos∥a∥∥b∥⟨a,b⟩
正交/垂直: a ⊥ b ⟺ ⟨ a , b ⟩ = 0 \boldsymbol{a}\perp\boldsymbol{b}\iff\lang\boldsymbol{a},\boldsymbol{b}\rang=0 a⊥b⟺⟨a,b⟩=0
正交向量组:不含零向量、其中向量两两正交
正交单位向量组/标准正交向量组:正交向量组中每个向量都是单位向量(构成欧氏空间的标准正交基)
正交向量组必是线性无关向量组。
n n n维欧氏空间 V V V和 R n \mathbb{R}^n Rn是同构的,在一个标准正交基上的坐标和在另一个标准正交基上的坐标有一一对应关系,可以用这个坐标直接计算内积、范数、距离等;一个向量由标准正交基线性表示,则每个基向量前面的系数是该向量与基向量的内积。
Gram-Schmidt正交化方法:从每个向量中减掉它在前面向量上的投影。 a \boldsymbol{a} a在 b \boldsymbol{b} b上的投影 Proj a b = ⟨ a , e ⟩ e = ⟨ a , b ∥ b ∥ ⟩ b ∥ b ∥ = ⟨ a , b ⟩ ⟨ b , b ⟩ b \operatorname{Proj}_{\boldsymbol{a}}\boldsymbol{b}=\lang\boldsymbol{a},\boldsymbol{e}\rang\boldsymbol{e}=\lang\boldsymbol{a},\frac{\boldsymbol{b}}{\|\boldsymbol{b}\|}\rang\frac{\boldsymbol{b}}{\|\boldsymbol{b}\|}=\frac{\lang\boldsymbol{a},\boldsymbol{b}\rang}{\lang\boldsymbol{b},\boldsymbol{b}\rang}\boldsymbol{b} Projab=⟨a,e⟩e=⟨a,∥b∥b⟩∥b∥b=⟨b,b⟩⟨a,b⟩b,其中 e \boldsymbol{e} e是 b \boldsymbol{b} b方向的单位向量, e = b ∥ b ∥ \boldsymbol{e}=\frac{\boldsymbol{b}}{\|\boldsymbol{b}\|} e=∥b∥b。
正交矩阵: A T A = A A T = I \boldsymbol{A}^{\mathrm{T}}\boldsymbol{A}=\boldsymbol{A}\boldsymbol{A}^{\mathrm{T}}=\boldsymbol{I} ATA=AAT=I,或 A − 1 = A T \boldsymbol{A}^{-1}=\boldsymbol{A}^{\mathrm{T}} A−1=AT。处理方法:按列分块、考虑特征值、用于进行实对称矩阵的对角化。可以看【线性代数笔记】正交矩阵的性质。
矩阵的 Q R \boldsymbol{Q}\boldsymbol{R} QR分解:若 A m × n \boldsymbol{A}_{m\times n} Am×n矩阵 A \boldsymbol{A} A的列向量组线性无关,则 A \boldsymbol{A} A能被分解成两个矩阵的乘积 A = Q R \boldsymbol{A}=\boldsymbol{Q}\boldsymbol{R} A=QR,其中 m × n m\times n m×n矩阵 Q \boldsymbol{Q} Q的列向量组是标准正交向量组(可以理解为 A \boldsymbol{A} A的列向量组正交化后的结果), R \boldsymbol{R} R是可逆的 n n n阶上三角矩阵(即 A \boldsymbol{A} A的列向量在 Q \boldsymbol{Q} Q上的线性表示)。如果 A \boldsymbol{A} A是 n n n阶可逆方阵,则 Q \boldsymbol{Q} Q是 n n n阶正交矩阵(标准正交向量组)。
特征值与特征向量
1. 特征值与特征向量的定义和性质
A x = λ x ⟹ λ \boldsymbol{A}\boldsymbol{x}=\lambda\boldsymbol{x}\implies \lambda Ax=λx⟹λ是特征值, x ≠ 0 \boldsymbol{x}\ne\boldsymbol{0} x=0是特征向量。
关于 λ \lambda λ的一元 n n n次多项式: f ( λ ) = ∣ A − λ I ∣ f(\lambda)=|\boldsymbol{A}-\lambda\boldsymbol{I}| f(λ)=∣A−λI∣称为特征多项式; f ( λ ) = 0 f(\lambda)=0 f(λ)=0称为特征方程;特征值是特征方程的根;特征空间是线性方程组 ( A − λ I ) x = 0 (\boldsymbol{A}-\lambda\boldsymbol{I})\boldsymbol{x}=\boldsymbol{0} (A−λI)x=0的解空间。
若 λ i \lambda_i λi是特征方程的 k k k重根,则 k k k是 λ i \lambda_i λi的代数重数; ( A − λ i I ) x = 0 (\boldsymbol{A}-\lambda_i\boldsymbol{I})\boldsymbol{x}=\boldsymbol{0} (A−λiI)x=0的解空间的维数是 λ i \lambda_i λi的几何重数。几何重数不大于代数重数。
特征值、特征向量的性质:特征值之积为行列式,之和为迹;矩阵的多项式的特征值就是特征值的多项式,逆矩阵的特征值是特征值的倒数,特征向量不变;属于不同特征值的特征向量线性无关。
Hamilton-Cayley定理:若 f ( λ ) f(\lambda) f(λ)是特征多项式,则 f ( A ) = O f(\boldsymbol{A})=\boldsymbol{O} f(A)=O。(当矩阵可相似对角化时很好理解。)
2. 相似矩阵
A ∼ B ⟺ ∃ \boldsymbol{A}\sim \boldsymbol{B}\iff\exists A∼B⟺∃可逆矩阵 P \boldsymbol{P} P使得 P − 1 A P = B \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} P−1AP=B。若 A \boldsymbol{A} A与对角矩阵相似,就称 A \boldsymbol{A} A可相似对角化。
相似关系具有传递性。
相似关系不改变行列式、秩和特征多项式,进而不改变特征值。
A \boldsymbol{A} A的特征向量 x \boldsymbol{x} x对应 B \boldsymbol{B} B的特征向量 P − 1 x \boldsymbol{P}^{-1}\boldsymbol{x} P−1x。
矩阵可相似对角化当且仅当代数重数等于几何重数。可对角化的一个充分条件:特征值互不相同。
要求矩阵 P \boldsymbol{P} P使得 P − 1 A P = Λ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\varLambda} P−1AP=Λ,其中 Λ \boldsymbol{\varLambda} Λ是含有 A \boldsymbol{A} A的特征值的对角矩阵,可以令 P = [ a 1 a 2 ⋯ a n ] \boldsymbol{P}=\begin{bmatrix}\boldsymbol{a}_1&\boldsymbol{a}_2&\cdots&\boldsymbol{a}_n\end{bmatrix} P=[a1a2⋯an],其中 a 1 , a 2 , ⋯ , a n \boldsymbol{a}_1,\boldsymbol{a}_2,\cdots,\boldsymbol{a}_n a1,a2,⋯,an是 A \boldsymbol{A} A的 n n n个线性无关的特征向量。此时, A P = [ A a 1 A a 2 ⋯ A a n ] = [ λ 1 a 1 λ 2 a 2 ⋯ λ n a n ] = [ a 1 a 2 ⋯ a n ] [ λ 1 λ 2 ⋱ λ n ] = P Λ \boldsymbol{A}\boldsymbol{P}=\begin{bmatrix}\boldsymbol{A}\boldsymbol{a}_1&\boldsymbol{A}\boldsymbol{a}_2&\cdots&\boldsymbol{A}\boldsymbol{a}_n\end{bmatrix}=\begin{bmatrix}\lambda_1\boldsymbol{a}_1&\lambda_2\boldsymbol{a}_2&\cdots&\lambda_n\boldsymbol{a}_n\end{bmatrix}=\begin{bmatrix}\boldsymbol{a}_1&\boldsymbol{a}_2&\cdots&\boldsymbol{a}_n\end{bmatrix}\begin{bmatrix}\lambda_1&&&\\&\lambda_2&&\\&&\ddots\\&&&\lambda_n\end{bmatrix}=\boldsymbol{P}\boldsymbol{\varLambda} AP=[Aa1Aa2⋯Aan]=[λ1a1λ2a2⋯λnan]=[a1a2⋯an] λ1λ2⋱λn =PΛ,即 P − 1 A P = Λ \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{\varLambda} P−1AP=Λ。
3. 实对称矩阵
性质:
- 特征值都是实数。
- 对应于不同特征值的特征向量正交。
- 实对称矩阵一定可以由正交矩阵相似对角化。
二次型
1. 二次型的定义
二次型就是二次齐次多项式 f ( x 1 , x 2 , ⋯ , x n ) = a 11 x 1 2 + 2 a 12 x 1 x 2 + 2 a 13 x 1 x 3 + ⋯ + 2 a 1 n x 1 x n + a 22 x 2 2 + 2 a 23 x 2 x 3 + ⋯ + 2 a 2 n x 2 x n + ⋮ + a n n x n 2 \begin{aligned} f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+&2a_{12}x_1x_2&+&2a_{13}x_1x_3+&\cdots+&2a_{1n}x_1x_n+\\ &a_{22}x_2^2&+&2a_{23}x_2x_3+&\cdots+&2a_{2n}x_2x_n+\\ &&&&&\vdots\\ &&&&+&a_{nn}x_n^2 \end{aligned} f(x1,x2,⋯,xn)=a11x12+2a12x1x2a22x22++2a13x1x3+2a23x2x3+⋯+⋯++2a1nx1xn+2a2nx2xn+⋮annxn2其中 x i x j x_ix_j xixj和 x j x i x_jx_i xjxi的系数是一样的( i < j i<j i<j)因此合并为 2 a i j x i x j 2a_{ij}x_ix_j 2aijxixj。
可表示成 f ( x ) = x T A x f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x} f(x)=xTAx,其中 A \boldsymbol{A} A称为二次型的矩阵,是实对称矩阵;二次型的秩定义为其矩阵的秩。
2. 二次型的标准型
标准型就是只含平方项、不含交叉项的二次型,即 f = d 1 y 1 2 + d 2 y 2 2 + ⋯ + d n y n 2 f=d_1y_1^2+d_2y_2^2+\cdots+d_ny_n^2 f=d1y12+d2y22+⋯+dnyn2,其矩阵为对角矩阵 D = diag ( d 1 , d 2 , ⋯ , d n ) \boldsymbol{D}=\operatorname{diag}(d_1,d_2,\cdots,d_n) D=diag(d1,d2,⋯,dn)。
想把二次型 f ( x ) = x T A x f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x} f(x)=xTAx化为标准型 y T D y \boldsymbol{y}^{\mathrm{T}}\boldsymbol{D}\boldsymbol{y} yTDy,需要引入可逆线性变换 x = C y \boldsymbol{x}=\boldsymbol{C}\boldsymbol{y} x=Cy,其中 C \boldsymbol{C} C为可逆矩阵,则 f = x T A x = y T C T A C y = y T D y f=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{C}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{C}\boldsymbol{y}=\boldsymbol{y}^{\mathrm{T}}\boldsymbol{D}\boldsymbol{y} f=xTAx=yTCTACy=yTDy,故 C T A C = D \boldsymbol{C}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{C}=\boldsymbol{D} CTAC=D。
因为 A \boldsymbol{A} A是实对称矩阵,这样的 C \boldsymbol{C} C总是存在,且为正交矩阵。
合同关系:若 ∃ \exists ∃可逆矩阵 C \boldsymbol{C} C使得 C T A C = B \boldsymbol{C}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{C}=\boldsymbol{B} CTAC=B,则称矩阵 A , B \boldsymbol{A},\boldsymbol{B} A,B合同,记作 A ≃ B \boldsymbol{A}\simeq \boldsymbol{B} A≃B,并称由 A \boldsymbol{A} A到 B = C T A C \boldsymbol{B}=\boldsymbol{C}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{C} B=CTAC的变换称为合同变换。这里不要求 A \boldsymbol{A} A和 B \boldsymbol{B} B是实对称矩阵。
定义正惯性指数 p p p为标准型中正项的个数,负惯性指数 r − p r-p r−p( r r r为矩阵的秩)为标准型中负项的个数,则惯性定理是说:合同变换不改变正负惯性指数。
规范型是每一项系数都为 ± 1 \pm 1 ±1或的标准型,形如 f = z 1 2 + z 2 2 + ⋯ + z p 2 − z p + 1 2 − ⋯ − z r 2 f=z_1^2+z_2^2+\cdots+z_p^2-z_{p+1}^2-\cdots-z_r^2 f=z12+z22+⋯+zp2−zp+12−⋯−zr2。二次型的规范型是唯一的。
3. 正定二次型
设 f ( x ) = x T A x f(\boldsymbol{x})=\boldsymbol{x}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{x} f(x)=xTAx是一个 n n n元二次型,若 ∀ x ∈ R n \forall\boldsymbol{x}\in\mathbb{R^n} ∀x∈Rn,都有 f ( x ) > 0 f(\boldsymbol{x})>0 f(x)>0,则称 f f f为正定二次型,并称实对称矩阵 A \boldsymbol{A} A为正定矩阵。
二次型经可逆线性变换,正定性不变。
几个充要条件:
-
n n n阶实对称矩阵 A \boldsymbol{A} A是正定矩阵的充要条件是 A \boldsymbol{A} A的所有特征值都大于 0 0 0,或者说 A \boldsymbol{A} A的惯性指数为 n n n。
-
实对称矩阵 A \boldsymbol{A} A是正定矩阵的充要条件是 ∃ \exists ∃可逆矩阵 M \boldsymbol{M} M,使得 A = M T M \boldsymbol{A}=\boldsymbol{M}^{\mathrm{T}}\boldsymbol{M} A=MTM,即 A \boldsymbol{A} A与单位矩阵 I \boldsymbol{I} I合同。因此,正定矩阵的行列式大于 0 0 0。
-
实对称矩阵 A \boldsymbol{A} A正定的充要条件是其各阶顺序主子式(左上角各阶子方阵的行列式)都大于 0 0 0。
参见【线性代数笔记】正定矩阵及其性质。
矩阵的关系总结
等价:若 A \boldsymbol{A} A经过有限次初等变换得到 B \boldsymbol{B} B,即存在可逆矩阵 P , Q \boldsymbol{P},\boldsymbol{Q} P,Q使得 P A Q = B \boldsymbol{P}\boldsymbol{A}\boldsymbol{Q}=\boldsymbol{B} PAQ=B,则称 A , B \boldsymbol{A},\boldsymbol{B} A,B等价,记作 A ≅ B \boldsymbol{A}\cong \boldsymbol{B} A≅B。如果只进行初等行/列变换,则称为行等价/列等价。不变量:矩阵的秩。
相似:若存在可逆矩阵 P \boldsymbol{P} P使得 P − 1 A P = B \boldsymbol{P}^{-1}\boldsymbol{A}\boldsymbol{P}=\boldsymbol{B} P−1AP=B,则称 A \boldsymbol{A} A与 B \boldsymbol{B} B相似,记作 A ∼ B \boldsymbol{A}\sim \boldsymbol{B} A∼B。不变量:矩阵的秩、特征值。
合同:若存在可逆矩阵 C \boldsymbol{C} C使得 C T A C = B \boldsymbol{C}^{\mathrm{T}}\boldsymbol{A}\boldsymbol{C}=\boldsymbol{B} CTAC=B,则称矩阵 A , B \boldsymbol{A},\boldsymbol{B} A,B合同,记作 A ≃ B \boldsymbol{A}\simeq \boldsymbol{B} A≃B。不变量:矩阵的秩、惯性指数。
一些技巧
-
证明关于矩阵的幂的命题时,可以考虑进行相似对角化,然后考察对角矩阵的幂。因为 diag ( λ 1 , λ 2 , ⋯ , λ n ) α = diag ( λ 1 α , λ 2 α , ⋯ , λ n α ) \operatorname{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)^\alpha=\operatorname{diag}(\lambda_1^\alpha,\lambda_2^\alpha,\cdots,\lambda_n^\alpha) diag(λ1,λ2,⋯,λn)α=diag(λ1α,λ2α,⋯,λnα)。
-
交换求和符号、求和和积分交换次序、积分和求导交换次序有时可以得到非平凡结论。
-
三个三维向量共面,就是这个向量组的秩小于等于 2 2 2,或者它们的行列式等于 0 0 0。