特征向量与特征值
在平面中,任意向量 $\vec{v}$ 在进行线性变换后,往往发生了方向的偏移。
但是有一些向量,在进行线性变换后方向没有发生偏移。
如变换矩阵 A:
\[A=\begin{bmatrix} 3&1\\ 0&2 \end{bmatrix}\]在 A 的作用下,x 轴的向量方向不会发生偏移。
这些特殊向量就被称为变换的特征向量
。
每个特征向量都会对应一个特征值
,表示特征向量的伸缩因子。
若特征值为 -2,表明特征向量被反向拉伸了 2 倍。
旋转
设想一下,如果你知道了旋转变换的特征向量,你就知道物体是绕着哪个轴旋转了。
旋转的特征值肯定为 1,因为旋转并不缩放任何一个向量。
线性变换可用矩阵来描述,矩阵由变换后的基向量组成。但特征向量比矩阵更容易理解线性变换。
因此求出特征向量和特征值是理解变换的关键。
求特征向量
特征向量满足如下关系:
\[A\vec{v} = \lambda\vec{v} \to (A-\lambda I)\vec{v}=\vec{0}\]上式本质是线性方程组存在非零解,$A-\lambda I$ 必须零,因此可先求出特征值。
将特征值代回方程中,即可求出特征向量。
特征值的个数
我们以二维平面举例:
绕原点 $90^{\circ}$ 旋转的变换是没有特征值的,因为所有向量方向都发生了偏移。
剪切变换只有一个特征值,因为只有一个方向的向量没有发生偏移
但也有很多线性变换有两个特征值,如:
\[\begin{bmatrix} 3&0\\ 0&2 \end{bmatrix}\]不过特征值的个数不会超过 2,因为二维平面的特征方程是个二次方程。
对角矩阵
对角矩阵在矩阵乘法中的计算特别简单,如
\[\begin{bmatrix} 3&0\\ 0&2 \end{bmatrix} \begin{bmatrix} 3&0\\ 0&2 \end{bmatrix} =\begin{bmatrix} 3^2&0\\ 0&2^2 \end{bmatrix}\]在这方面,特征基起了作用。
特征基
设线性变换 A 对应的特征向量是 $\vec{v_1}$ 和 $\vec{v_2}$。
\[A(\vec{v_1},\vec{v_2})=(\lambda_1\vec{v_1}, \lambda_2\vec{v_2}) =(\vec{v_1},\vec{v_2})\begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}\]设 $(\vec{v_1},\vec{v_2})$ 为矩阵 P,则有:
\[A=P\begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}P^{-1}\]$P^{-1}$ 表示将任意一个向量以 $(\vec{v_1},\vec{v_2})$ 为基表示,然后进行线性变换,最后再将线性变换后的向量用原来的基表示:
基变换 --> 线性变换 --> 基变换
我们将对角矩阵用 $\Lambda$ 表示,因此 $A^2$ 可表示为:
\[A^2=(P\Lambda P^{-1})(P\Lambda P^{-1})=P\Lambda^2P^{-1}\]这极大简化了矩阵运算,将 A 拆解为 $P{\Lambda}P^{-1}$ 的过程称为相似对角化。