Day 6: 缠绕的算子 —— 可交换矩阵与不变子空间

图解:当两个算子可交换时,它们共享同一套“骨架”(特征向量) ◎ 图解:当两个算子可交换时,它们共享同一套“骨架”(特征向量)

引言

在量子力学里,有一个著名的反直觉现象:你无法同时精确测量粒子的位置和动量。海森堡不确定性原理告诉我们,这背后的数学原因仅仅是因为代表位置的矩阵 $\mathbf{X}$ 和代表动量的矩阵 $\mathbf{P}$ 不可交换,即 $\mathbf{X}\mathbf{P} \neq \mathbf{P}\mathbf{X}$。

反之,如果两个算子满足 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,物理学家会说这两个物理量是“相容”的。这意味着什么?意味着它们可以“共享”本征态。

回到线性代数,“可交换” (Commutativity) 这个性质,远比 $2 \times 3 = 3 \times 2$ 深刻得多。它揭示了两个矩阵在几何结构上的 “缠绕”“和谐”

今天,我们就来拆解 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$ 背后的几何秘密。


几何直觉:和谐的变形

想象 $\mathbf{A}$ 和 $\mathbf{B}$ 是两台对空间进行拉伸或旋转的机器。

  • $\mathbf{A}$ 的作用是:沿着 $x$ 轴拉伸 2 倍,沿着 $y$ 轴拉伸 3 倍。
  • $\mathbf{B}$ 的作用是:沿着 $x$ 轴拉伸 5 倍,沿着 $y$ 轴拉伸 1 倍。

此时,先做 $\mathbf{A}$ 再做 $\mathbf{B}$(即 $\mathbf{B}\mathbf{A}$),还是反过来做(即 $\mathbf{A}\mathbf{B}$),最终盒子被拉伸的形状是一模一样的。为什么?因为它们都在操作同一套轴——也就是它们有共同的特征向量。

但如果 $\mathbf{B}$ 是旋转 $45^\circ$ 呢?

  • 方案 1 ($\mathbf{B}\mathbf{A}$):$\mathbf{A}$ 先把盒子沿着 $x,y$ 轴拉长了,然后 $\mathbf{B}$ 把它整个斜着转过来。
  • 方案 2 ($\mathbf{A}\mathbf{B}$):$\mathbf{B}$ 先把盒子转斜了,然后 $\mathbf{A}$ 依然死板地沿着原来的 $x,y$ 轴方向拉伸。

结果显然不同!方案 2 中,$\mathbf{A}$ 拉伸的方向不再是盒子现在的长边方向,而是原来的坐标轴方向,这会把盒子拉得“面目全非”。

直觉结论:

如果 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,说明 $\mathbf{B}$ 尊重 $\mathbf{A}$ 的特征方向。它不会把 $\mathbf{A}$ 的特征向量“踢出”它所属的空间。


核心定理:不变子空间与公共特征向量

1. 它是谁的人?

让我们把上面的直觉钉死在数学定义上。

定理: 若 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,则 $\mathbf{A}$ 的任意一个特征子空间(Eigenspace)都是 $\mathbf{B}$-不变的。

【证明】 设 $\boldsymbol{x}$ 是 $\mathbf{A}$ 的属于特征值 $\lambda$ 的特征向量,即 $\mathbf{A}\boldsymbol{x} = \lambda \boldsymbol{x}$。 我们来看看 $\mathbf{B}\boldsymbol{x}$ 这个新向量到底是何方神圣。 我们将 $\mathbf{A}$ 作用在它身上: $$\mathbf{A}(\mathbf{B}\boldsymbol{x}) = (\mathbf{A}\mathbf{B})\boldsymbol{x} = (\mathbf{B}\mathbf{A})\boldsymbol{x} = \mathbf{B}(\mathbf{A}\boldsymbol{x}) = \mathbf{B}(\lambda \boldsymbol{x}) = \lambda (\mathbf{B}\boldsymbol{x})$$

解读:

  1. 看头尾:$\mathbf{A}(\mathbf{B}\boldsymbol{x}) = \lambda (\mathbf{B}\boldsymbol{x})$。
  2. 这说明什么?说明 $\mathbf{B}\boldsymbol{x}$ 也是 $\mathbf{A}$ 的特征向量(属于同一个特征值 $\lambda$),除非它是零向量。
  3. 几何意义:向量 $\boldsymbol{x}$ 原本乖乖待在 $\mathbf{A}$ 的特征空间 $V_\lambda$ 里,经过 $\mathbf{B}$ 的变换,$\mathbf{B}\boldsymbol{x}$ 居然还在 $V_\lambda$ 这个圈子里,没有跑出去。这就是“不变子空间”的真谛。

2. 公共特征向量 (Common Eigenvectors)

如果 $\mathbf{A}$ 的特征值 $\lambda$ 是单重的(对应的特征空间只有 1 维,就是一条直线),事情就更有趣了。

  • $\boldsymbol{x}$ 在这条直线上。
  • 由刚才的证明,$\mathbf{B}\boldsymbol{x}$ 也必须在这条直线上。
  • 在直线上共线意味着什么?意味着 $\mathbf{B}\boldsymbol{x}$ 只能是 $\boldsymbol{x}$ 的缩放! $$\mathbf{B}\boldsymbol{x} = \mu \boldsymbol{x}$$

惊人结论:

如果 $\mathbf{A}$ 的特征值都是单重的,且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$,那么 $\mathbf{A}$ 的特征向量自动成为 $\mathbf{B}$ 的特征向量!

如果特征值有重根呢?虽然 $\mathbf{B}\boldsymbol{x}$ 不一定平行于 $\boldsymbol{x}$(它只是在同一个平面里转),但我们依然可以在这个平面里找到一组基,让它们既是 $\mathbf{A}$ 的特征向量,也是 $\mathbf{B}$ 的特征向量。

终极定理(同时对角化): 两个可对角化矩阵 $\mathbf{A}, \mathbf{B}$ 可交换 $\iff$ 它们拥有完全相同的一组特征基(可以同时被对角化)。 $$\mathbf{P}^{-1}\mathbf{A}\mathbf{P} = \boldsymbol{\Lambda}_1, \quad \mathbf{P}^{-1}\mathbf{B}\mathbf{P} = \boldsymbol{\Lambda}_2$$


深度解析:双算子系统的解耦

为什么考研和竞赛如此迷恋 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$?因为这是解耦的关键。

当你面对一个复杂的矩阵方程(比如 $\mathbf{A}\boldsymbol{x} + \mathbf{B}\boldsymbol{x} = \boldsymbol{0}$)时,如果 $\mathbf{A}$ 和 $\mathbf{B}$ 可交换,你就可以在一个统一的坐标系下审视它们。

  • 在这个坐标系 $\mathbf{P}$ 下,$\mathbf{A}$ 变成了对角阵 $\text{diag}(\lambda_i)$。
  • $\mathbf{B}$ 也变成了对角阵 $\text{diag}(\mu_i)$。
  • 复杂的矩阵运算瞬间退化成了 $n$ 个独立的标量运算!

这就像解联立方程组时,一旦找到了正确的变量代换,方程组就自动分离变量了,整个世界都清爽了。


✍️ 课后实战:交换性的威力

  1. (基础证明) 设 $\mathbf{A}$ 有 $n$ 个互异特征值 $\lambda_1, \dots, \lambda_n$,对应的特征向量为 $\boldsymbol{p}_1, \dots, \boldsymbol{p}_n$。若 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,证明 $\mathbf{B}$ 在基 $\boldsymbol{p}_i$ 下也是对角矩阵(即 $\boldsymbol{p}_i$ 也是 $\mathbf{B}$ 的特征向量)。
🔐 点击查看解析 / Click to Reveal
【证】 由 $\mathbf{A}$ 的特征值互异可知,其特征子空间 $V_{\lambda_i}$ 均为一维,且由 $\boldsymbol{p}_i$ 生成。 根据正文结论,$\mathbf{B}$ 保持 $\mathbf{A}$ 的特征子空间不变。即 $\mathbf{B}\boldsymbol{p}_i \in V_{\lambda_i}$。 因为 $V_{\lambda_i}$ 是一维的,所以 $\mathbf{B}\boldsymbol{p}_i$ 必须与 $\boldsymbol{p}_i$ 共线。 即存在标量 $\mu_i$,使得: $$\mathbf{B}\boldsymbol{p}_i = \mu_i \boldsymbol{p}_i$$ 这意味着 $\boldsymbol{p}_i$ 也是 $\mathbf{B}$ 的特征向量。 若令 $\mathbf{P} = (\boldsymbol{p}_1, \dots, \boldsymbol{p}_n)$,则 $\mathbf{P}^{-1}\mathbf{B}\mathbf{P} = \text{diag}(\mu_1, \dots, \mu_n)$。
  1. (Frobenius 理论应用) 设 $\mathbf{A} = \text{diag}(1, 2, 3)$,$\mathbf{B}$ 是一个 $3 \times 3$ 矩阵。 若 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,试确定 $\mathbf{B}$ 的形式。它有多少个自由参数?
🔐 点击查看解析 / Click to Reveal

【思路】 这道题直接考察了我们前面提到的“双中心化子”直觉。由于 $\mathbf{A}$ 的对角元(特征值)互异,$\mathbf{B}$ 受到极强的约束。

【解】 设 $\mathbf{B} = (b_{ij})_{3 \times 3}$。 计算 $\mathbf{A}\mathbf{B}$ 和 $\mathbf{B}\mathbf{A}$:

  • $\mathbf{A}\mathbf{B}$:第 $i$ 行乘以 $\lambda_i$。即 $(\lambda_i b_{ij})$。
  • $\mathbf{B}\mathbf{A}$:第 $j$ 列乘以 $\lambda_j$。即 $(b_{ij} \lambda_j)$。

要使 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$,必须有: $$\lambda_i b_{ij} = b_{ij} \lambda_j \implies b_{ij} (\lambda_i - \lambda_j) = 0$$ 已知 $\mathbf{A} = \text{diag}(1, 2, 3)$,特征值互异 ($\lambda_i \neq \lambda_j$ 当 $i \neq j$)。 所以当 $i \neq j$ 时,$(\lambda_i - \lambda_j) \neq 0$,这迫使 $b_{ij} = 0$。

结论: $\mathbf{B}$ 的非对角元全为 0,必须是对角矩阵: $$\mathbf{B} = \begin{pmatrix} b_{11} & 0 & 0 \\ 0 & b_{22} & 0 \\ 0 & 0 & b_{33} \end{pmatrix}$$ 它有 3 个自由参数。这正好对应了多项式 $c_0\mathbf{I} + c_1\mathbf{A} + c_2\mathbf{A}^2$ 的 3 个系数。这验证了 $\mathbf{B}$ 可以表示为 $\mathbf{A}$ 的多项式。

  1. (经典证明) 设 $\mathbf{A}$ 为 $n$ 阶实对称矩阵,$\mathbf{B}$ 为 $n$ 阶实反对称矩阵,且 $\mathbf{A}\mathbf{B}=\mathbf{B}\mathbf{A}$。 证明:$\mathbf{A}$ 与 $\mathbf{B}$ 的乘积 $\mathbf{A}\mathbf{B}$ 是反对称矩阵。
🔐 点击查看解析 / Click to Reveal

【证】 我们要证明的是 $(\mathbf{A}\mathbf{B})^\mathsf{T} = - \mathbf{A}\mathbf{B}$。 利用转置运算法则: $$(\mathbf{A}\mathbf{B})^\mathsf{T} = \mathbf{B}^\mathsf{T} \mathbf{A}^\mathsf{T}$$ 利用 $\mathbf{A}, \mathbf{B}$ 的对称性/反对称性:

  • $\mathbf{A}$ 对称 $\implies \mathbf{A}^\mathsf{T} = \mathbf{A}$
  • $\mathbf{B}$ 反对称 $\implies \mathbf{B}^\mathsf{T} = - \mathbf{B}$

代入得: $$(\mathbf{A}\mathbf{B})^\mathsf{T} = (-\mathbf{B}) \mathbf{A} = - \mathbf{B}\mathbf{A}$$ 关键一步!利用可交换性 $\mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A}$: $$- \mathbf{B}\mathbf{A} = - \mathbf{A}\mathbf{B}$$ 证毕。


线性代数重构计划 (The Plan)

加载评论