Day 4: 算子的灵魂 —— 特征值、特征多项式与Hamilton-Cayley

特征值:寻找变换中的不变轴 ◎ 特征值:寻找变换中的不变轴

引言

如果说矩阵是线性空间的“运动描述”,那么特征值与特征向量就是这个运动的“骨架”与“灵魂”

1. 寻找“不变”的轴

一个矩阵 $\mathbf{A}$ 作用于向量 $\boldsymbol{x}$,通常会同时改变向量的方向长度。 但在茫茫向量海中,总有那么几个“天选之子”,它们被矩阵变换后,方向竟然保持不变(只伸缩,不旋转,特指实特征值情况)。 这些“天选之子”就是特征向量,而伸缩的倍数就是特征值

$$ \mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x} $$

2. 物理意义:稳定性

  • 稳定性:在离散迭代系统($x_{k+1} = Ax_k$)中,$|\lambda| < 1$ 意味着多次变换后向量趋于消失(稳定);$|\lambda| > 1$ 意味着发散(不稳定)。
  • 旋转与投影
    • 旋转矩阵(实数域内)通常没有实特征值(因为所有向量方向都变了)。
    • 投影矩阵的特征值只能是 1 或 0(因为投影后向量要么不变,要么消失)。

灵魂拷问:投影仪的特征值是多少?

引子例题 设 $\mathbf{A}$ 是 $n$ 阶方阵,且满足 $\mathbf{A}^2 = \mathbf{A}$(这意味着 $\mathbf{A}$ 是一个投影矩阵)。 问题:

  1. 不通过计算特征多项式,你能直接说出 $\mathbf{A}$ 的特征值只能是哪些数吗?
  2. 证明 $\mathbf{A}$ 一定可以对角化。

【直觉破局】

  1. 代数直觉: 特征值方程是 $\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x}$。 两边同时左乘 $\mathbf{A}$:$\mathbf{A}^2\boldsymbol{x} = \lambda \mathbf{A}\boldsymbol{x} = \lambda^2 \boldsymbol{x}$。 因为 $\mathbf{A}^2 = \mathbf{A}$,所以 $\lambda^2 \boldsymbol{x} = \lambda \boldsymbol{x}$。 既然 $\boldsymbol{x} \neq \mathbf{0}$,那只能是 $\lambda^2 = \lambda$,解得 $\lambda = 0$ 或 $1$。

  2. 几何直觉(更本质): $\mathbf{A}$ 是投影变换。想象一下把三维空间的向量投影到桌面上。

    • 如果你本来就在桌面上($\boldsymbol{x} \in \mathbf{C}(\mathbf{A})$),投影后还是你自己。长度不变,倍数 $\lambda = 1$。
    • 如果你垂直于桌面($\boldsymbol{x} \in \mathbf{N}(\mathbf{A})$),投影后就没了。长度变为 0,倍数 $\lambda = 0$。
    • 除了这两个方向,其他向量都会改变方向,所以没有其他特征值。

核心重构:多项式的降维打击与对角化

1. Hamilton-Cayley 定理:矩阵的“宿命”

$$ f(\lambda) = |\lambda \mathbf{E} - \mathbf{A}| \implies f(\mathbf{A}) = \mathbf{O} $$ 这不仅是巧合,更是宿命。矩阵 $\mathbf{A}$ 即使千变万化,最终也逃不出由它特征多项式划定的“牢笼”。矩阵自己竟然是自己特征多项式的根!这意味着:$\mathbf{A}^n$ 可以被 $c_{n-1}\mathbf{A}^{n-1} + \dots + c_0 \mathbf{E}$ 线性表示。

核心用途:

  • 求逆矩阵:将 $\mathbf{A}^{-1}$ 表示为 $\mathbf{A}$ 的多项式。
  • 求高次幂:利用多项式除法计算 $\mathbf{A}^k$ 的余式,把 $\mathbf{A}^{100}$ 降次为低次多项式。
  • 零化多项式:它是寻找最小多项式和判断能否对角化的基础。

2. 韦达定理矩阵版:谱的信息压缩

不要傻乎乎地去解行列式求 $\lambda$。记住两个恒等式,它们是检验计算正确性的快速工具:

  • 迹 (Trace):$\sum \lambda_i = \text{Tr}(\mathbf{A}) = \sum a_{ii}$(对角线之和)。
  • 行列式 (Determinant):$\prod \lambda_i = |\mathbf{A}|$。

3. 对角化的终极目标:解耦 (Decoupling)

如果 $\mathbf{A}$ 有 $n$ 个线性无关的特征向量,我们可以将 $\mathbf{A}$ 分解为 $\mathbf{A} = \mathbf{P} \mathbf{\Lambda} \mathbf{P}^{-1}$。 这种分解让矩阵的幂运算变得极简:$\mathbf{A}^k = \mathbf{P} \mathbf{\Lambda}^k \mathbf{P}^{-1}$。

4. 高阶技巧:交换性与公共特征向量

定理: 如果 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$,且 $\mathbf{A}$ 有 $n$ 个互异特征值,那么 $\mathbf{B}$ 可以被对角化,且 $\mathbf{A}$ 和 $\mathbf{B}$ 拥有公共的特征向量推论: 这种情况下,$\mathbf{B}$ 甚至可以写成 $\mathbf{A}$ 的多项式 $\mathbf{B} = p(\mathbf{A})$。


✍️ 课后实战:谱映射与秩 1 矩阵

  1. (基础计算) 设 $\mathbf{A}$ 为 3 阶矩阵,特征值为 $1, -1, 0$。 求行列式 $|\mathbf{A}^3 + 2\mathbf{A} - \mathbf{E}|$ 的值。

    🔐 点击查看解析 / Click to Reveal

    【直觉】 如果 $\mathbf{A}$ 的特征值是 $\lambda$,那么多项式 $g(\mathbf{A})$ 的特征值就是 $g(\lambda)$。这就像 $\mathbf{A}$ 变身了,它的灵魂 $\lambda$ 也跟着变身。

    【解】 令 $g(x) = x^3 + 2x - 1$。 $\mathbf{A}$ 的特征值为 $\lambda_1=1, \lambda_2=-1, \lambda_3=0$。 则矩阵 $\mathbf{B} = \mathbf{A}^3 + 2\mathbf{A} - \mathbf{E}$ 的特征值为:

    • $\mu_1 = 1^3 + 2(1) - 1 = 2$
    • $\mu_2 = (-1)^3 + 2(-1) - 1 = -4$
    • $\mu_3 = 0^3 + 2(0) - 1 = -1$

    $\mathbf{B}$ 的行列式等于其特征之积: $$ |\mathbf{B}| = \mu_1 \mu_2 \mu_3 = 2 \times (-4) \times (-1) = 8 $$

  2. (经典结论) 已知 $n$ 阶矩阵 $\mathbf{A}$ 的秩为 1($r(\mathbf{A})=1$)。 证明特征多项式为:$|\lambda \mathbf{E} - \mathbf{A}| = \lambda^{n-1}(\lambda - \text{Tr}(\mathbf{A}))$,并由此计算 $|\mathbf{A} - \mathbf{E}|$。

    🔐 点击查看解析 / Click to Reveal

    【证】

    1. 特征值分布: 因为 $r(\mathbf{A})=1$,说明 $\mathbf{A}\boldsymbol{x}=\mathbf{0}$ 的解空间(零空间)维数为 $n-1$。 这意味着 $\lambda = 0$ 是 $n-1$ 重特征值。
    2. 利用迹定最后一个特征值: 设第 $n$ 个特征值为 $\lambda_n$。由 $\sum \lambda_i = \text{Tr}(\mathbf{A})$,得: $$ 0 + \dots + 0 + \lambda_n = \text{Tr}(\mathbf{A}) \implies \lambda_n = \text{Tr}(\mathbf{A}) $$ 所以,$\mathbf{A}$ 的特征值为 $\text{Tr}(\mathbf{A}), 0, \dots, 0$。
    3. 写出特征多项式: $$ |\lambda \mathbf{E} - \mathbf{A}| = \prod (\lambda - \lambda_i) = (\lambda - \text{Tr}(\mathbf{A})) \cdot (\lambda - 0)^{n-1} = \lambda^{n-1}(\lambda - \text{Tr}(\mathbf{A})) $$
    4. 计算 $|\mathbf{A} - \mathbf{E}|$: 利用特征值性质,$\mathbf{A}-\mathbf{E}$ 的特征值为 $\lambda_i - 1$。 即:$\text{Tr}(\mathbf{A})-1, -1, \dots, -1$(共 $n-1$ 个 -1)。 $$ |\mathbf{A} - \mathbf{E}| = (\text{Tr}(\mathbf{A}) - 1) \cdot (-1)^{n-1} $$

  3. (概念挑战) 设 $\mathbf{A}$ 有 $n$ 个互不相同的特征值,且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$,证明 $\mathbf{B}$ 是 $\mathbf{A}$ 的多项式。

    🔐 点击查看解析 / Click to Reveal

    【思路】 这是“双中心化子定理”的一个特例。核心逻辑在于 $\mathbf{A}$ 的特征子空间都是一维的,且 $\mathbf{B}$ 必须保持这些子空间不变。

    【证】

    1. 设 $\mathbf{A}\boldsymbol{p}_i = \lambda_i \boldsymbol{p}_i$,其中 $\lambda_i$ 互异,$\boldsymbol{p}_i$ 为对应的特征向量。
    2. 由 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,考察 $\mathbf{B}\boldsymbol{p}_i$: $$ \mathbf{A}(\mathbf{B}\boldsymbol{p}_i) = \mathbf{B}(\mathbf{A}\boldsymbol{p}_i) = \mathbf{B}(\lambda_i \boldsymbol{p}_i) = \lambda_i (\mathbf{B}\boldsymbol{p}_i) $$ 这说明 $\mathbf{B}\boldsymbol{p}_i$ 也是 $\mathbf{A}$ 关于特征值 $\lambda_i$ 的特征向量。
    3. 因为 $\lambda_i$ 互异,对应的特征子空间是一维的,所以 $\mathbf{B}\boldsymbol{p}_i$ 必须与 $\boldsymbol{p}_i$ 共线。 即存在标量 $\mu_i$,使得 $\mathbf{B}\boldsymbol{p}_i = \mu_i \boldsymbol{p}_i$。这意味着 $\mathbf{A}$ 的特征向量也是 $\mathbf{B}$ 的特征向量。
    4. 利用 Lagrange 插值多项式,构造一个多项式 $g(x)$,使得 $g(\lambda_i) = \mu_i$(对所有 $i=1,\dots,n$)。 于是对于所有特征向量 $\boldsymbol{p}_i$,都有: $$ g(\mathbf{A})\boldsymbol{p}_i = g(\lambda_i)\boldsymbol{p}_i = \mu_i \boldsymbol{p}_i = \mathbf{B}\boldsymbol{p}_i $$ 由于 $\boldsymbol{p}_i$ 构成基,所以 $g(\mathbf{A}) = \mathbf{B}$。


总结

掌握特征值与特征向量,关键在于建立**“算子作用于空间”**的动态图像。

  • 初级阶段:会解 $|\lambda \mathbf{E} - \mathbf{A}|=0$。
  • 中级阶段:熟练运用 TraceRankHamilton-Cayley 定理简化计算。
  • 高级阶段:理解矩阵的空间分解(如直和分解、Jordan 块),并能处理 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$ 这类涉及算子结构的抽象问题。
加载评论