◎ 图解:在混乱的旋转与拉伸中,特征向量是我们唯一能抓住的“定海神针”引言:寻找变换中的不动点
我们在 Day 1 讲过,矩阵 $\mathbf{A}$ 是对空间的一种变换(旋转、拉伸、剪切)。 当一个矩阵作用于整个空间时,绝大多数向量的方向都会被踢飞。 比如一个旋转矩阵,把 $(1,0)$ 转到了 $(0,1)$,方向全变了。
但是,是否存在一些特殊的向量,它们在变换前后,方向保持不变,只是长度伸缩了?
这就是特征向量 (Eigenvector) 的几何定义: $$\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x}$$
- $\boldsymbol{x}$:特征向量(变换中的“轴”)。
- $\lambda$:特征值(Eigenvalue,这个轴伸缩的倍数)。
直觉隐喻: 想象地球自转。赤道上的点动得飞快,方向时刻在变。但是地轴上的点(北极点),它依然留在原来的轴线上。地轴就是地球自转矩阵的特征向量!
核心推导:为什么是 $|\lambda \mathbf{I} - \mathbf{A}| = 0$?
很多同学会背求特征值的公式,但不知道为什么会有这个行列式。 让我们回到定义: $$\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x} \implies \mathbf{A}\boldsymbol{x} - \lambda \mathbf{I} \boldsymbol{x} = \boldsymbol{0} \implies (\mathbf{A} - \lambda \mathbf{I})\boldsymbol{x} = \boldsymbol{0}$$
这里有一个关键逻辑:
- 我们在找特征向量 $\boldsymbol{x}$,根据定义,特征向量不能是零向量(零向量在哪都不动,没意义)。
- 我们在求解齐次方程组 $\mathbf{B}\boldsymbol{x} = \boldsymbol{0}$(其中 $\mathbf{B} = \mathbf{A} - \lambda \mathbf{I}$)。
- 如果要让 $\boldsymbol{x}$ 有非零解 (Non-trivial solution),矩阵 $\mathbf{B}$ 必须是奇异的(不可逆的)。
- 矩阵奇异 $\iff$ 行列式为 0。
所以,特征方程的本质是:寻找让矩阵 $(\mathbf{A} - \lambda \mathbf{I})$ 发生“降维打击”的那个 $\lambda$。 $$f(\lambda) = |\lambda \mathbf{I} - \mathbf{A}| = 0$$
两个超级好用的性质(偷懒专用)
如果你解出了特征值,别急着交卷,先用这两个几何性质验算一下:
- 迹 (Trace) 守恒:$\sum \lambda_i = \text{tr}(\mathbf{A}) = \sum a_{ii}$。
- 体积 (Determinant) 守恒:$\prod \lambda_i = |\mathbf{A}|$。
【秒杀例题】 已知 $\mathbf{A} = \begin{pmatrix} 1 & a \\ 2 & 4 \end{pmatrix}$ 的一个特征值为 2。求 $a$ 和另一个特征值。 解:
- 由迹守恒:$\lambda_1 + \lambda_2 = 1 + 4 = 5$。已知 $\lambda_1=2$,故 $\lambda_2 = 3$。
- 由行列式守恒:$|\mathbf{A}| = \lambda_1 \lambda_2 = 2 \times 3 = 6$。 而 $|\mathbf{A}| = 1 \times 4 - 2a = 4 - 2a$。 故 $4 - 2a = 6 \implies a = -1$。 看,完全不需要解一元二次方程!
终极目标:对角化 (Diagonalization)
算出特征值不仅仅是为了做题,而是为了解耦 (Decoupling)。
如果我们能找到 $n$ 个线性无关的特征向量 $\boldsymbol{p}_1, \dots, \boldsymbol{p}_n$,把它们排成一个矩阵 $\mathbf{P}$,神奇的事情就发生了: $$\mathbf{P}^{-1}\mathbf{A}\mathbf{P} = \boldsymbol{\Lambda} = \begin{pmatrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_n \end{pmatrix}$$
几何意义:
- $\mathbf{A}$:在普通坐标系下看,变换是纠缠的、复杂的。
- $\boldsymbol{\Lambda}$:在特征向量构成的新坐标系下看,变换变成了纯粹的轴向伸缩。
- $\mathbf{P}$:就是连接这两个世界的基变换矩阵。
关键门槛: 不是所有矩阵都能对角化。如果特征方程有重根(比如 $(\lambda-2)^2=0$),我们就需要检查几何重数(特征子空间的维数)。
- 如果 几何重数 = 代数重数,完美,可对角化。
- 如果 几何重数 < 代数重数,完了,特征向量不够用,矩阵是亏损的(Day 5 我们会专门讲这个问题)。
所谓“宿命”:哈密顿-凯莱定理
最后,介绍一个听起来很玄乎,但极其强大的定理:Hamilton-Cayley Theorem。
定理内容只有一句话:
每个矩阵都是它自己特征方程的根。 即若 $f(\lambda) = |\lambda \mathbf{I} - \mathbf{A}|$,则 $f(\mathbf{A}) = \mathbf{O}$。
通俗解释: 矩阵 $\mathbf{A}$ 居然满足它自己的“宿命方程”。
有什么用? 它能把高次幂瞬间化简! 假设 $\mathbf{A}$ 是 $2 \times 2$ 矩阵,特征方程是 $\lambda^2 - 3\lambda + 2 = 0$。 根据定理,有 $\mathbf{A}^2 - 3\mathbf{A} + 2\mathbf{I} = \mathbf{O}$。 所以 $\mathbf{A}^2 = 3\mathbf{A} - 2\mathbf{I}$。 那 $\mathbf{A}^3$ 呢? $\mathbf{A}^3 = \mathbf{A}(3\mathbf{A} - 2\mathbf{I}) = 3\mathbf{A}^2 - 2\mathbf{A} = 3(3\mathbf{A}-2\mathbf{I}) - 2\mathbf{A} = \dots$ 你看,无论多少次幂,最后都能降阶表示为 $\mathbf{A}$ 和 $\mathbf{I}$ 的线性组合。这也是计算矩阵多项式的核心技巧。
✍️ 课后实战
习题 1:谱映射定理 (Spectral Mapping Theorem) 已知 $3$ 阶矩阵 $\mathbf{A}$ 的特征值为 $1, 2, 3$。求矩阵 $\mathbf{B} = \mathbf{A}^3 - 5\mathbf{A}^2 + \mathbf{I}$ 的特征值。
点击查看解析 / Click to Reveal
【思路】 千万别傻乎乎地去把 $\mathbf{B}$ 算出来。 如果 $\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x}$,那么 $\mathbf{A}^2 \boldsymbol{x} = \lambda^2 \boldsymbol{x}$。 推而广之,若 $\mathbf{B} = g(\mathbf{A})$,则 $\mathbf{B}$ 的特征值就是 $g(\lambda)$。
【解】 $\mathbf{B}$ 的特征值 $\mu_i = \lambda_i^3 - 5\lambda_i^2 + 1$。
- $\lambda=1 \implies \mu = 1 - 5 + 1 = -3$
- $\lambda=2 \implies \mu = 8 - 20 + 1 = -11$
- $\lambda=3 \implies \mu = 27 - 45 + 1 = -17$
习题 2:逆向工程(对角化判定) 设 $\mathbf{A} = \begin{pmatrix} 2 & 1 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & a \end{pmatrix}$。
- 求 $\mathbf{A}$ 的所有特征值。
- 若 $\mathbf{A}$ 可对角化,求 $a$ 的值。
点击查看解析 / Click to Reveal
【解】
特征值:因为 $\mathbf{A}$ 是上三角矩阵,特征值就是对角线元素。 $\lambda_1 = 2, \lambda_2 = 2, \lambda_3 = a$。
可对角化条件: 矩阵可对角化 $\iff$ 每个特征值的几何重数等于代数重数。
情况 1:$a \neq 2$ 此时 $\lambda=2$ 是二重根(代数重数 2)。我们需要它的几何重数也是 2。 即要求 $n - r(\mathbf{A} - 2\mathbf{I}) = 3 - r(\mathbf{A} - 2\mathbf{I}) = 2 \implies r = 1$。 计算 $\mathbf{A} - 2\mathbf{I} = \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & a-2 \end{pmatrix}$。 由于 $a \neq 2$,第三行非零,第一行也非零。 秩 $r=2$。几何重数 $= 3-2 = 1 \neq 2$。 结论:$a \neq 2$ 时不可对角化。
情况 2:$a = 2$ 此时 $\lambda=2$ 是三重根。我们需要几何重数为 3,即 $\mathbf{A}-2\mathbf{I}$ 的秩为 0。 $\mathbf{A} - 2\mathbf{I} = \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix}$。 秩 $r=1$。几何重数 $= 3-1 = 2 \neq 3$。 结论:$a = 2$ 时也不可对角化。
最终答案:无论 $a$ 取何值,$\mathbf{A}$ 都不可对角化。(因为右上角那个 $1$ 锁死了几何结构,这正是 Day 5 要讲的 Jordan 块!)
线性代数重构计划 (The Plan)
- Day 0: 为什么你算对了所有的题,却依然不懂线性代数?
- Day 1: 别把矩阵当数字表 —— 线性变换与数据压缩
- Day 2: 空间的解剖学 —— 四大子空间与正交性
- Day 3: 信息的维度 —— 秩、分块与“打洞”绝技
- Day 4: 算子的灵魂 —— 特征值、几何重数与对角化
- Day 5: 无法对角化的妥协 —— Jordan 标准形与最简结构
- Day 6: 缠绕的算子 —— 可交换矩阵与不变子空间
- Day 7: 矩阵的基因 —— 奇异值分解 (SVD)