引言

在量子力学中，如果两个物理量（如位置和动量）对应的算符不可交换（$\mathbf{A}\mathbf{B} \neq \mathbf{B}\mathbf{A}$），海森堡不确定性原理告诉我们：你无法同时精确测量它们。

反之，如果 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$，则意味着这两个算符是“兼容”的，它们拥有共同的本征态（Eigenstates）。

回到线性代数，“可交换” (Commutativity) 这个性质，远比 $2 \times 3 = 3 \times 2$ 深刻得多。它揭示了两个矩阵在几何结构上的**“缠绕”与“和谐”**。

今天，我们要揭开 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$ 背后的几何秘密。

几何直觉：和谐的变形

想象 $\mathbf{A}$ 和 $\mathbf{B}$ 是两个对空间进行拉伸或旋转的机器。

$\mathbf{A}$ 的作用是：沿着 $x$ 轴拉伸 2 倍，沿着 $y$ 轴拉伸 3 倍。
$\mathbf{B}$ 的作用是：沿着 $x$ 轴拉伸 5 倍，沿着 $y$ 轴拉伸 1 倍。

此时，先做 $\mathbf{A}$ 再做 $\mathbf{B}$（$\mathbf{B}\mathbf{A}$），还是反过来（$\mathbf{A}\mathbf{B}$），结果是一样的。因为它们都在操作同一套轴（特征向量）。

但如果 $\mathbf{B}$ 是旋转 $45^\circ$ 呢？

$\mathbf{A}$ 先把盒子拉长了。
$\mathbf{B}$ 再把它旋转。 vs
$\mathbf{B}$ 先把盒子旋转了。
$\mathbf{A}$ 再按照原来的 $x, y$ 轴方向拉伸。

结果显然不同！因为 $\mathbf{B}$ 破坏了 $\mathbf{A}$ 的“固有方向”。

直觉结论：

如果 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$，说明 $\mathbf{B}$ 尊重 $\mathbf{A}$ 的特征方向。它不会把 $\mathbf{A}$ 的特征向量“踢出”它所属的空间。

核心定理：不变子空间与公共特征向量

1. 它是谁的人？

让我们用数学语言把上面的直觉钉死。

定理： 若 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$，则 $\mathbf{A}$ 的任意一个特征子空间（Eigenspace）都是 $\mathbf{B}$-不变的。

【证明】 设 $\boldsymbol{x}$ 是 $\mathbf{A}$ 的属于特征值 $\lambda$ 的特征向量，即 $\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x}$。我们来看看 $\mathbf{B}\boldsymbol{x}$ 是什么成分： $$ \mathbf{A}(\mathbf{B}\boldsymbol{x}) = (\mathbf{A}\mathbf{B})\boldsymbol{x} = (\mathbf{B}\mathbf{A})\boldsymbol{x} = \mathbf{B}(\mathbf{A}\boldsymbol{x}) = \mathbf{B}(\lambda \boldsymbol{x}) = \lambda (\mathbf{B}\boldsymbol{x}) $$

解读：

看头尾：$\mathbf{A}(\mathbf{B}\boldsymbol{x}) = \lambda (\mathbf{B}\boldsymbol{x})$。
这说明：$\mathbf{B}\boldsymbol{x}$ 也是 $\mathbf{A}$ 的特征向量（属于同一个特征值 $\lambda$），或者它是零向量。
几何意义：向量 $\boldsymbol{x}$ 在 $\mathbf{A}$ 的某个特征空间 $V_\lambda$ 里，经过 $\mathbf{B}$ 变换后，$\mathbf{B}\boldsymbol{x}$ 依然还在 $V_\lambda$ 这个圈子里，没有跑出去。

2. 公共特征向量 (Common Eigenvectors)

如果 $\mathbf{A}$ 的特征值 $\lambda$ 是单重的（对应的特征空间只有 1 维，就是一条直线），事情就更有趣了。

$\boldsymbol{x}$ 在这条直线上。
$\mathbf{B}\boldsymbol{x}$ 也在这条直线上。
在直线上共线意味着什么？意味着 $\mathbf{B}\boldsymbol{x}$ 必须是 $\boldsymbol{x}$ 的倍数！ $$ \mathbf{B}\boldsymbol{x} = \mu \boldsymbol{x} $$

惊人结论：

如果 $\mathbf{A}$ 的特征值都是单重的，且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$，那么 $\mathbf{A}$ 的特征向量自动成为 $\mathbf{B}$ 的特征向量！

如果特征值有重根呢？虽然 $\mathbf{B}\boldsymbol{x}$ 不一定平行于 $\boldsymbol{x}$（它只是在同一个平面里转），但我们依然可以在这个平面里找到一组基，让它们既是 $\mathbf{A}$ 的特征向量，也是 $\mathbf{B}$ 的特征向量。

终极定理（同时对角化）： 两个可对角化矩阵 $\mathbf{A}, \mathbf{B}$ 可交换 $\iff$ 它们拥有完全相同的一组特征基（可以同时被对角化）。 $$ \mathbf{P}^{-1}\mathbf{A}\mathbf{P} = \boldsymbol{\Lambda}_1, \quad \mathbf{P}^{-1}\mathbf{B}\mathbf{P} = \boldsymbol{\Lambda}_2 $$

深度解析：双算子系统的解耦

为什么考研和竞赛喜欢考 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$？因为这是解耦的关键。

当你面对一个复杂的矩阵方程（比如 $\mathbf{A}\boldsymbol{x} + \mathbf{B}\boldsymbol{x} = \boldsymbol{0}$）时，如果 $\mathbf{A}$ 和 $\mathbf{B}$ 可交换，你就可以在一个统一的坐标系下审视它们。

在这个坐标系 $\mathbf{P}$ 下，$\mathbf{A}$ 变成了对角阵 $\text{diag}(\lambda_i)$。
$\mathbf{B}$ 也变成了对角阵 $\text{diag}(\mu_i)$。
矩阵运算直接退化成了 $n$ 个独立的标量运算！

这就像解联立方程组时，一旦找到了正确的变量代换，方程组就自动分离变量了。

✍️ 课后实战：交换性的威力

（经典证明） 设 $\mathbf{A}$ 为 $n$ 阶实对称矩阵，$\mathbf{B}$ 为 $n$ 阶实反对称矩阵，且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$。证明：$\mathbf{A}$ 与 $\mathbf{B}$ 的乘积 $\mathbf{A}\mathbf{B}$ 是反对称矩阵。

🔐 点击查看解析 / Click to Reveal

【证】 我们要证明的是 $(\mathbf{A}\mathbf{B})^\mathsf{T} = - \mathbf{A}\mathbf{B}$。利用转置运算法则： $$ (\mathbf{A}\mathbf{B})^\mathsf{T} = \mathbf{B}^\mathsf{T} \mathbf{A}^\mathsf{T} $$ 利用 $\mathbf{A}, \mathbf{B}$ 的对称性/反对称性：

$\mathbf{A}$ 对称 $\implies \mathbf{A}^\mathsf{T} = \mathbf{A}$
$\mathbf{B}$ 反对称 $\implies \mathbf{B}^\mathsf{T} = - \mathbf{B}$

代入得： $$ (\mathbf{A}\mathbf{B})^\mathsf{T} = (-\mathbf{B}) \mathbf{A} = - \mathbf{B}\mathbf{A} $$ 关键一步！利用可交换性 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$： $$ - \mathbf{B}\mathbf{A} = - \mathbf{A}\mathbf{B} $$ 证毕。

（秩的思考） 设 $\mathbf{A}, \mathbf{B}$ 是 $n$ 阶方阵，且 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A} = \mathbf{O}$。证明：$r(\mathbf{A} + \mathbf{B}) = r(\mathbf{A}) + r(\mathbf{B})$。

🔐 点击查看解析 / Click to Reveal

【思路】 一般的秩不等式是 $r(\mathbf{A}+\mathbf{B}) \le r(\mathbf{A}) + r(\mathbf{B})$。要在等号成立，意味着 $\mathbf{A}$ 和 $\mathbf{B}$ 的列空间几乎是“垂直”或“分离”的。

【证】 由 $\mathbf{A}\mathbf{B} = \mathbf{O}$ 知 $C(\mathbf{B}) \subseteq N(\mathbf{A})$。由 $\mathbf{B}\mathbf{A} = \mathbf{O}$ 知 $C(\mathbf{A}) \subseteq N(\mathbf{B})$。

考虑方程 $(\mathbf{A} + \mathbf{B})\boldsymbol{x} = \mathbf{0}$。这意味着 $\mathbf{A}\boldsymbol{x} + \mathbf{B}\boldsymbol{x} = \mathbf{0}$，即 $\mathbf{A}\boldsymbol{x} = -\mathbf{B}\boldsymbol{x}$。左边向量在 $C(\mathbf{A})$ 里，右边向量在 $C(\mathbf{B})$ 里。如果 $C(\mathbf{A})$ 和 $C(\mathbf{B})$ 只有零交集（这需要额外证明或利用更强条件，这里实际上题目条件可能需要加强，或者我们要利用 $\mathbf{A}\mathbf{B}$=$\mathbf{B}\mathbf{A}$ 做分块对角化）。

更严格的代数证明（打洞法）： 构造分块矩阵 $\begin{pmatrix} \mathbf{A} + \mathbf{B} & \mathbf{O} \ \ \mathbf{O} & \mathbf{O} \end{pmatrix}$。利用初等变换： $$ \begin{pmatrix} \mathbf{A} & \mathbf{B} \ \ \mathbf{A} & \mathbf{A}+\mathbf{B} \end{pmatrix} \xrightarrow{R_2-R_1} \begin{pmatrix} \mathbf{A} & \mathbf{B} \ \ \mathbf{O} & \mathbf{A} \end{pmatrix} $$ 这似乎走不通。让我们换个角度，利用 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}=\mathbf{O}$ 意味着它们可以同时三角化甚至更简单的形式。事实上，如果考虑它们可对角化，则它们能同时对角化。在对角基下，由于乘积为 0，对应的对角元 $a_{ii} b_{ii} = 0$。这意味着对任意 $i$，要么 $a_{ii}=0$，要么 $b_{ii}=0$。于是 $\mathbf{A} + \mathbf{B}$ 的对角元就是 $a_{ii} + b_{ii}$（其中一个是 0）。非零元的个数正好是 $r(\mathbf{A}) + r(\mathbf{B})$。（注：对于一般矩阵，此结论也成立，但证明需要用到 Fitting 分解或秩的加法公式 $\mathbf{A}^2=\mathbf{A}, \mathbf{B}^2=\mathbf{B}, \mathbf{AB}=\mathbf{BA}=\mathbf{O}$ 等特例，本题作为练习可引发思考）。

Day 6: 缠绕的算子 —— 可交换矩阵与不变子空间

引言