回到首页 / 上级目录

特征向量与特征值

在平面中,任意向量 $\vec{v}$ 在进行线性变换后,往往发生了方向的偏移。

但是有一些向量,在进行线性变换后方向没有发生偏移。

如变换矩阵 A:

\[A=\begin{bmatrix} 3&1\\ 0&2 \end{bmatrix}\]

在 A 的作用下,x 轴的向量方向不会发生偏移。

这些特殊向量就被称为变换的特征向量

每个特征向量都会对应一个特征值,表示特征向量的伸缩因子。

若特征值为 -2,表明特征向量被反向拉伸了 2 倍。

旋转

设想一下,如果你知道了旋转变换的特征向量,你就知道物体是绕着哪个轴旋转了。

旋转的特征值肯定为 1,因为旋转并不缩放任何一个向量。

线性变换可用矩阵来描述,矩阵由变换后的基向量组成。但特征向量比矩阵更容易理解线性变换。

因此求出特征向量和特征值是理解变换的关键。

求特征向量

特征向量满足如下关系:

\[A\vec{v} = \lambda\vec{v} \to (A-\lambda I)\vec{v}=\vec{0}\]

上式本质是线性方程组存在非零解,$A-\lambda I$ 必须零,因此可先求出特征值。

将特征值代回方程中,即可求出特征向量。

特征值的个数

我们以二维平面举例:

绕原点 $90^{\circ}$ 旋转的变换是没有特征值的,因为所有向量方向都发生了偏移。

剪切变换只有一个特征值,因为只有一个方向的向量没有发生偏移

但也有很多线性变换有两个特征值,如:

\[\begin{bmatrix} 3&0\\ 0&2 \end{bmatrix}\]

不过特征值的个数不会超过 2,因为二维平面的特征方程是个二次方程。

对角矩阵

对角矩阵在矩阵乘法中的计算特别简单,如

\[\begin{bmatrix} 3&0\\ 0&2 \end{bmatrix} \begin{bmatrix} 3&0\\ 0&2 \end{bmatrix} =\begin{bmatrix} 3^2&0\\ 0&2^2 \end{bmatrix}\]

在这方面,特征基起了作用。

特征基

设线性变换 A 对应的特征向量是 $\vec{v_1}$ 和 $\vec{v_2}$。

\[A(\vec{v_1},\vec{v_2})=(\lambda_1\vec{v_1}, \lambda_2\vec{v_2}) =(\vec{v_1},\vec{v_2})\begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}\]

设 $(\vec{v_1},\vec{v_2})$ 为矩阵 P,则有:

\[A=P\begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}P^{-1}\]

$P^{-1}$ 表示将任意一个向量以 $(\vec{v_1},\vec{v_2})$ 为基表示,然后进行线性变换,最后再将线性变换后的向量用原来的基表示:

基变换 --> 线性变换 --> 基变换

我们将对角矩阵用 $\Lambda$ 表示,因此 $A^2$ 可表示为:

\[A^2=(P\Lambda P^{-1})(P\Lambda P^{-1})=P\Lambda^2P^{-1}\]

这极大简化了矩阵运算,将 A 拆解为 $P{\Lambda}P^{-1}$ 的过程称为相似对角化。