◎ 特征值:寻找变换中的不变轴引言
如果说矩阵是线性空间的“运动描述”,那么特征值与特征向量就是这个运动的“骨架”与“灵魂”。
1. 寻找“不变”的轴
一个矩阵 $\mathbf{A}$ 作用于向量 $\boldsymbol{x}$,通常会同时改变向量的方向和长度。 但在茫茫向量海中,总有那么几个“天选之子”,它们被矩阵变换后,方向竟然保持不变(只伸缩,不旋转,特指实特征值情况)。 这些“天选之子”就是特征向量,而伸缩的倍数就是特征值。
$$ \mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x} $$
2. 物理意义:稳定性
- 稳定性:在离散迭代系统($x_{k+1} = Ax_k$)中,$|\lambda| < 1$ 意味着多次变换后向量趋于消失(稳定);$|\lambda| > 1$ 意味着发散(不稳定)。
- 旋转与投影:
- 旋转矩阵(实数域内)通常没有实特征值(因为所有向量方向都变了)。
- 投影矩阵的特征值只能是 1 或 0(因为投影后向量要么不变,要么消失)。
灵魂拷问:投影仪的特征值是多少?
引子例题 设 $\mathbf{A}$ 是 $n$ 阶方阵,且满足 $\mathbf{A}^2 = \mathbf{A}$(这意味着 $\mathbf{A}$ 是一个投影矩阵)。 问题:
- 不通过计算特征多项式,你能直接说出 $\mathbf{A}$ 的特征值只能是哪些数吗?
- 证明 $\mathbf{A}$ 一定可以对角化。
【直觉破局】
代数直觉: 特征值方程是 $\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x}$。 两边同时左乘 $\mathbf{A}$:$\mathbf{A}^2\boldsymbol{x} = \lambda \mathbf{A}\boldsymbol{x} = \lambda^2 \boldsymbol{x}$。 因为 $\mathbf{A}^2 = \mathbf{A}$,所以 $\lambda^2 \boldsymbol{x} = \lambda \boldsymbol{x}$。 既然 $\boldsymbol{x} \neq \mathbf{0}$,那只能是 $\lambda^2 = \lambda$,解得 $\lambda = 0$ 或 $1$。
几何直觉(更本质): $\mathbf{A}$ 是投影变换。想象一下把三维空间的向量投影到桌面上。
- 如果你本来就在桌面上($\boldsymbol{x} \in \mathbf{C}(\mathbf{A})$),投影后还是你自己。长度不变,倍数 $\lambda = 1$。
- 如果你垂直于桌面($\boldsymbol{x} \in \mathbf{N}(\mathbf{A})$),投影后就没了。长度变为 0,倍数 $\lambda = 0$。
- 除了这两个方向,其他向量都会改变方向,所以没有其他特征值。
核心重构:多项式的降维打击与对角化
1. Hamilton-Cayley 定理:矩阵的“宿命”
$$ f(\lambda) = |\lambda \mathbf{E} - \mathbf{A}| \implies f(\mathbf{A}) = \mathbf{O} $$ 这不仅是巧合,更是宿命。矩阵 $\mathbf{A}$ 即使千变万化,最终也逃不出由它特征多项式划定的“牢笼”。矩阵自己竟然是自己特征多项式的根!这意味着:$\mathbf{A}^n$ 可以被 $c_{n-1}\mathbf{A}^{n-1} + \dots + c_0 \mathbf{E}$ 线性表示。
核心用途:
- 求逆矩阵:将 $\mathbf{A}^{-1}$ 表示为 $\mathbf{A}$ 的多项式。
- 求高次幂:利用多项式除法计算 $\mathbf{A}^k$ 的余式,把 $\mathbf{A}^{100}$ 降次为低次多项式。
- 零化多项式:它是寻找最小多项式和判断能否对角化的基础。
2. 韦达定理矩阵版:谱的信息压缩
不要傻乎乎地去解行列式求 $\lambda$。记住两个恒等式,它们是检验计算正确性的快速工具:
- 迹 (Trace):$\sum \lambda_i = \text{Tr}(\mathbf{A}) = \sum a_{ii}$(对角线之和)。
- 行列式 (Determinant):$\prod \lambda_i = |\mathbf{A}|$。
3. 对角化的终极目标:解耦 (Decoupling)
如果 $\mathbf{A}$ 有 $n$ 个线性无关的特征向量,我们可以将 $\mathbf{A}$ 分解为 $\mathbf{A} = \mathbf{P} \mathbf{\Lambda} \mathbf{P}^{-1}$。 这种分解让矩阵的幂运算变得极简:$\mathbf{A}^k = \mathbf{P} \mathbf{\Lambda}^k \mathbf{P}^{-1}$。
4. 高阶技巧:交换性与公共特征向量
定理: 如果 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$,且 $\mathbf{A}$ 有 $n$ 个互异特征值,那么 $\mathbf{B}$ 可以被对角化,且 $\mathbf{A}$ 和 $\mathbf{B}$ 拥有公共的特征向量。 推论: 这种情况下,$\mathbf{B}$ 甚至可以写成 $\mathbf{A}$ 的多项式 $\mathbf{B} = p(\mathbf{A})$。
✍️ 课后实战:谱映射与秩 1 矩阵
(基础计算) 设 $\mathbf{A}$ 为 3 阶矩阵,特征值为 $1, -1, 0$。 求行列式 $|\mathbf{A}^3 + 2\mathbf{A} - \mathbf{E}|$ 的值。
点击查看解析 / Click to Reveal
【直觉】 如果 $\mathbf{A}$ 的特征值是 $\lambda$,那么多项式 $g(\mathbf{A})$ 的特征值就是 $g(\lambda)$。这就像 $\mathbf{A}$ 变身了,它的灵魂 $\lambda$ 也跟着变身。
【解】 令 $g(x) = x^3 + 2x - 1$。 $\mathbf{A}$ 的特征值为 $\lambda_1=1, \lambda_2=-1, \lambda_3=0$。 则矩阵 $\mathbf{B} = \mathbf{A}^3 + 2\mathbf{A} - \mathbf{E}$ 的特征值为:
- $\mu_1 = 1^3 + 2(1) - 1 = 2$
- $\mu_2 = (-1)^3 + 2(-1) - 1 = -4$
- $\mu_3 = 0^3 + 2(0) - 1 = -1$
$\mathbf{B}$ 的行列式等于其特征之积: $$ |\mathbf{B}| = \mu_1 \mu_2 \mu_3 = 2 \times (-4) \times (-1) = 8 $$
(经典结论) 已知 $n$ 阶矩阵 $\mathbf{A}$ 的秩为 1($r(\mathbf{A})=1$)。 证明特征多项式为:$|\lambda \mathbf{E} - \mathbf{A}| = \lambda^{n-1}(\lambda - \text{Tr}(\mathbf{A}))$,并由此计算 $|\mathbf{A} - \mathbf{E}|$。
点击查看解析 / Click to Reveal
【证】
- 特征值分布: 因为 $r(\mathbf{A})=1$,说明 $\mathbf{A}\boldsymbol{x}=\mathbf{0}$ 的解空间(零空间)维数为 $n-1$。 这意味着 $\lambda = 0$ 是 $n-1$ 重特征值。
- 利用迹定最后一个特征值: 设第 $n$ 个特征值为 $\lambda_n$。由 $\sum \lambda_i = \text{Tr}(\mathbf{A})$,得: $$ 0 + \dots + 0 + \lambda_n = \text{Tr}(\mathbf{A}) \implies \lambda_n = \text{Tr}(\mathbf{A}) $$ 所以,$\mathbf{A}$ 的特征值为 $\text{Tr}(\mathbf{A}), 0, \dots, 0$。
- 写出特征多项式: $$ |\lambda \mathbf{E} - \mathbf{A}| = \prod (\lambda - \lambda_i) = (\lambda - \text{Tr}(\mathbf{A})) \cdot (\lambda - 0)^{n-1} = \lambda^{n-1}(\lambda - \text{Tr}(\mathbf{A})) $$
- 计算 $|\mathbf{A} - \mathbf{E}|$: 利用特征值性质,$\mathbf{A}-\mathbf{E}$ 的特征值为 $\lambda_i - 1$。 即:$\text{Tr}(\mathbf{A})-1, -1, \dots, -1$(共 $n-1$ 个 -1)。 $$ |\mathbf{A} - \mathbf{E}| = (\text{Tr}(\mathbf{A}) - 1) \cdot (-1)^{n-1} $$
(概念挑战) 设 $\mathbf{A}$ 有 $n$ 个互不相同的特征值,且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$,证明 $\mathbf{B}$ 是 $\mathbf{A}$ 的多项式。
点击查看解析 / Click to Reveal
【思路】 这是“双中心化子定理”的一个特例。核心逻辑在于 $\mathbf{A}$ 的特征子空间都是一维的,且 $\mathbf{B}$ 必须保持这些子空间不变。
【证】
- 设 $\mathbf{A}\boldsymbol{p}_i = \lambda_i \boldsymbol{p}_i$,其中 $\lambda_i$ 互异,$\boldsymbol{p}_i$ 为对应的特征向量。
- 由 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,考察 $\mathbf{B}\boldsymbol{p}_i$: $$ \mathbf{A}(\mathbf{B}\boldsymbol{p}_i) = \mathbf{B}(\mathbf{A}\boldsymbol{p}_i) = \mathbf{B}(\lambda_i \boldsymbol{p}_i) = \lambda_i (\mathbf{B}\boldsymbol{p}_i) $$ 这说明 $\mathbf{B}\boldsymbol{p}_i$ 也是 $\mathbf{A}$ 关于特征值 $\lambda_i$ 的特征向量。
- 因为 $\lambda_i$ 互异,对应的特征子空间是一维的,所以 $\mathbf{B}\boldsymbol{p}_i$ 必须与 $\boldsymbol{p}_i$ 共线。 即存在标量 $\mu_i$,使得 $\mathbf{B}\boldsymbol{p}_i = \mu_i \boldsymbol{p}_i$。这意味着 $\mathbf{A}$ 的特征向量也是 $\mathbf{B}$ 的特征向量。
- 利用 Lagrange 插值多项式,构造一个多项式 $g(x)$,使得 $g(\lambda_i) = \mu_i$(对所有 $i=1,\dots,n$)。 于是对于所有特征向量 $\boldsymbol{p}_i$,都有: $$ g(\mathbf{A})\boldsymbol{p}_i = g(\lambda_i)\boldsymbol{p}_i = \mu_i \boldsymbol{p}_i = \mathbf{B}\boldsymbol{p}_i $$ 由于 $\boldsymbol{p}_i$ 构成基,所以 $g(\mathbf{A}) = \mathbf{B}$。
总结
掌握特征值与特征向量,关键在于建立**“算子作用于空间”**的动态图像。
- 初级阶段:会解 $|\lambda \mathbf{E} - \mathbf{A}|=0$。
- 中级阶段:熟练运用 Trace、Rank 和 Hamilton-Cayley 定理简化计算。
- 高级阶段:理解矩阵的空间分解(如直和分解、Jordan 块),并能处理 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$ 这类涉及算子结构的抽象问题。