引言
在量子力学中,如果两个物理量(如位置和动量)对应的算符不可交换($\mathbf{A}\mathbf{B} \neq \mathbf{B}\mathbf{A}$),海森堡不确定性原理告诉我们:你无法同时精确测量它们。
反之,如果 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,则意味着这两个算符是“兼容”的,它们拥有共同的本征态(Eigenstates)。
回到线性代数,“可交换” (Commutativity) 这个性质,远比 $2 \times 3 = 3 \times 2$ 深刻得多。它揭示了两个矩阵在几何结构上的**“缠绕”与“和谐”**。
今天,我们要揭开 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$ 背后的几何秘密。
几何直觉:和谐的变形
想象 $\mathbf{A}$ 和 $\mathbf{B}$ 是两个对空间进行拉伸或旋转的机器。
- $\mathbf{A}$ 的作用是:沿着 $x$ 轴拉伸 2 倍,沿着 $y$ 轴拉伸 3 倍。
- $\mathbf{B}$ 的作用是:沿着 $x$ 轴拉伸 5 倍,沿着 $y$ 轴拉伸 1 倍。
此时,先做 $\mathbf{A}$ 再做 $\mathbf{B}$($\mathbf{B}\mathbf{A}$),还是反过来($\mathbf{A}\mathbf{B}$),结果是一样的。因为它们都在操作同一套轴(特征向量)。
但如果 $\mathbf{B}$ 是旋转 $45^\circ$ 呢?
- $\mathbf{A}$ 先把盒子拉长了。
- $\mathbf{B}$ 再把它旋转。 vs
- $\mathbf{B}$ 先把盒子旋转了。
- $\mathbf{A}$ 再按照原来的 $x, y$ 轴方向拉伸。
结果显然不同!因为 $\mathbf{B}$ 破坏了 $\mathbf{A}$ 的“固有方向”。
直觉结论:
如果 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,说明 $\mathbf{B}$ 尊重 $\mathbf{A}$ 的特征方向。它不会把 $\mathbf{A}$ 的特征向量“踢出”它所属的空间。
核心定理:不变子空间与公共特征向量
1. 它是谁的人?
让我们用数学语言把上面的直觉钉死。
定理: 若 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,则 $\mathbf{A}$ 的任意一个特征子空间(Eigenspace)都是 $\mathbf{B}$-不变的。
【证明】 设 $\boldsymbol{x}$ 是 $\mathbf{A}$ 的属于特征值 $\lambda$ 的特征向量,即 $\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x}$。 我们来看看 $\mathbf{B}\boldsymbol{x}$ 是什么成分: $$ \mathbf{A}(\mathbf{B}\boldsymbol{x}) = (\mathbf{A}\mathbf{B})\boldsymbol{x} = (\mathbf{B}\mathbf{A})\boldsymbol{x} = \mathbf{B}(\mathbf{A}\boldsymbol{x}) = \mathbf{B}(\lambda \boldsymbol{x}) = \lambda (\mathbf{B}\boldsymbol{x}) $$
解读:
- 看头尾:$\mathbf{A}(\mathbf{B}\boldsymbol{x}) = \lambda (\mathbf{B}\boldsymbol{x})$。
- 这说明:$\mathbf{B}\boldsymbol{x}$ 也是 $\mathbf{A}$ 的特征向量(属于同一个特征值 $\lambda$),或者它是零向量。
- 几何意义:向量 $\boldsymbol{x}$ 在 $\mathbf{A}$ 的某个特征空间 $V_\lambda$ 里,经过 $\mathbf{B}$ 变换后,$\mathbf{B}\boldsymbol{x}$ 依然还在 $V_\lambda$ 这个圈子里,没有跑出去。
2. 公共特征向量 (Common Eigenvectors)
如果 $\mathbf{A}$ 的特征值 $\lambda$ 是单重的(对应的特征空间只有 1 维,就是一条直线),事情就更有趣了。
- $\boldsymbol{x}$ 在这条直线上。
- $\mathbf{B}\boldsymbol{x}$ 也在这条直线上。
- 在直线上共线意味着什么?意味着 $\mathbf{B}\boldsymbol{x}$ 必须是 $\boldsymbol{x}$ 的倍数! $$ \mathbf{B}\boldsymbol{x} = \mu \boldsymbol{x} $$
惊人结论:
如果 $\mathbf{A}$ 的特征值都是单重的,且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$,那么 $\mathbf{A}$ 的特征向量自动成为 $\mathbf{B}$ 的特征向量!
如果特征值有重根呢?虽然 $\mathbf{B}\boldsymbol{x}$ 不一定平行于 $\boldsymbol{x}$(它只是在同一个平面里转),但我们依然可以在这个平面里找到一组基,让它们既是 $\mathbf{A}$ 的特征向量,也是 $\mathbf{B}$ 的特征向量。
终极定理(同时对角化): 两个可对角化矩阵 $\mathbf{A}, \mathbf{B}$ 可交换 $\iff$ 它们拥有完全相同的一组特征基(可以同时被对角化)。 $$ \mathbf{P}^{-1}\mathbf{A}\mathbf{P} = \boldsymbol{\Lambda}_1, \quad \mathbf{P}^{-1}\mathbf{B}\mathbf{P} = \boldsymbol{\Lambda}_2 $$
深度解析:双算子系统的解耦
为什么考研和竞赛喜欢考 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$?因为这是解耦的关键。
当你面对一个复杂的矩阵方程(比如 $\mathbf{A}\boldsymbol{x} + \mathbf{B}\boldsymbol{x} = \boldsymbol{0}$)时,如果 $\mathbf{A}$ 和 $\mathbf{B}$ 可交换,你就可以在一个统一的坐标系下审视它们。
- 在这个坐标系 $\mathbf{P}$ 下,$\mathbf{A}$ 变成了对角阵 $\text{diag}(\lambda_i)$。
- $\mathbf{B}$ 也变成了对角阵 $\text{diag}(\mu_i)$。
- 矩阵运算直接退化成了 $n$ 个独立的标量运算!
这就像解联立方程组时,一旦找到了正确的变量代换,方程组就自动分离变量了。
✍️ 课后实战:交换性的威力
- (经典证明) 设 $\mathbf{A}$ 为 $n$ 阶实对称矩阵,$\mathbf{B}$ 为 $n$ 阶实反对称矩阵,且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$。 证明:$\mathbf{A}$ 与 $\mathbf{B}$ 的乘积 $\mathbf{A}\mathbf{B}$ 是反对称矩阵。
点击查看解析 / Click to Reveal
【证】 我们要证明的是 $(\mathbf{A}\mathbf{B})^\mathsf{T} = - \mathbf{A}\mathbf{B}$。 利用转置运算法则: $$ (\mathbf{A}\mathbf{B})^\mathsf{T} = \mathbf{B}^\mathsf{T} \mathbf{A}^\mathsf{T} $$ 利用 $\mathbf{A}, \mathbf{B}$ 的对称性/反对称性:
- $\mathbf{A}$ 对称 $\implies \mathbf{A}^\mathsf{T} = \mathbf{A}$
- $\mathbf{B}$ 反对称 $\implies \mathbf{B}^\mathsf{T} = - \mathbf{B}$
代入得: $$ (\mathbf{A}\mathbf{B})^\mathsf{T} = (-\mathbf{B}) \mathbf{A} = - \mathbf{B}\mathbf{A} $$ 关键一步!利用可交换性 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$: $$ - \mathbf{B}\mathbf{A} = - \mathbf{A}\mathbf{B} $$ 证毕。
- (秩的思考) 设 $\mathbf{A}, \mathbf{B}$ 是 $n$ 阶方阵,且 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A} = \mathbf{O}$。 证明:$r(\mathbf{A} + \mathbf{B}) = r(\mathbf{A}) + r(\mathbf{B})$。
点击查看解析 / Click to Reveal
【思路】 一般的秩不等式是 $r(\mathbf{A}+\mathbf{B}) \le r(\mathbf{A}) + r(\mathbf{B})$。要在等号成立,意味着 $\mathbf{A}$ 和 $\mathbf{B}$ 的列空间几乎是“垂直”或“分离”的。
【证】 由 $\mathbf{A}\mathbf{B} = \mathbf{O}$ 知 $C(\mathbf{B}) \subseteq N(\mathbf{A})$。 由 $\mathbf{B}\mathbf{A} = \mathbf{O}$ 知 $C(\mathbf{A}) \subseteq N(\mathbf{B})$。
考虑方程 $(\mathbf{A} + \mathbf{B})\boldsymbol{x} = \mathbf{0}$。 这意味着 $\mathbf{A}\boldsymbol{x} + \mathbf{B}\boldsymbol{x} = \mathbf{0}$,即 $\mathbf{A}\boldsymbol{x} = -\mathbf{B}\boldsymbol{x}$。 左边向量在 $C(\mathbf{A})$ 里,右边向量在 $C(\mathbf{B})$ 里。 如果 $C(\mathbf{A})$ 和 $C(\mathbf{B})$ 只有零交集(这需要额外证明或利用更强条件,这里实际上题目条件可能需要加强,或者我们要利用 $\mathbf{A}\mathbf{B}$=$\mathbf{B}\mathbf{A}$ 做分块对角化)。
更严格的代数证明(打洞法): 构造分块矩阵 $\begin{pmatrix} \mathbf{A} + \mathbf{B} & \mathbf{O} \ \ \mathbf{O} & \mathbf{O} \end{pmatrix}$。 利用初等变换: $$ \begin{pmatrix} \mathbf{A} & \mathbf{B} \ \ \mathbf{A} & \mathbf{A}+\mathbf{B} \end{pmatrix} \xrightarrow{R_2-R_1} \begin{pmatrix} \mathbf{A} & \mathbf{B} \ \ \mathbf{O} & \mathbf{A} \end{pmatrix} $$ 这似乎走不通。让我们换个角度,利用 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}=\mathbf{O}$ 意味着它们可以同时三角化甚至更简单的形式。 事实上,如果考虑它们可对角化,则它们能同时对角化。在对角基下,由于乘积为 0,对应的对角元 $a_{ii} b_{ii} = 0$。 这意味着对任意 $i$,要么 $a_{ii}=0$,要么 $b_{ii}=0$。 于是 $\mathbf{A} + \mathbf{B}$ 的对角元就是 $a_{ii} + b_{ii}$(其中一个是 0)。 非零元的个数正好是 $r(\mathbf{A}) + r(\mathbf{B})$。 (注:对于一般矩阵,此结论也成立,但证明需要用到 Fitting 分解或秩的加法公式 $\mathbf{A}^2=\mathbf{A}, \mathbf{B}^2=\mathbf{B}, \mathbf{AB}=\mathbf{BA}=\mathbf{O}$ 等特例,本题作为练习可引发思考)。