Day 2: 空间的解剖学 —— 四大子空间与正交性

直觉重构:空间的解剖 ◎ 直觉重构:空间的解剖

引言

昨天我们从 $\mathbf{A}=\mathbf{C}\mathbf{R}$ 的视角,把矩阵看作了“运动”和“压缩”。今天,我们要把镜头拉远,看一看这个运动发生的“宇宙”究竟长什么样。

Gilbert Strang 教授之所以被誉为线性代数之神,就是因为他画了一张图——“线性代数的基本定理图”(The Big Picture)

Strang 的“宇宙图景”:两个世界,四个空间 ◎ Strang 的“宇宙图景”:两个世界,四个空间

这张图,就是线性方程组 $\mathbf{A}\boldsymbol{x}=\boldsymbol{b}$ 的上帝视角。它不仅告诉我们解在哪里,还告诉我们解的结构是什么。


一、 宇宙的四分天下 (The Four Subspaces)

矩阵 $\mathbf{A}_{m \times n}$ 建立了两个世界之间的桥梁:

  • 来源世界 $\mathbb{R}^n$:这里住着输入向量 $\boldsymbol{x}$(有 $n$ 个分量)。
  • 目标世界 $\mathbb{R}^m$:这里住着输出向量 $\boldsymbol{b}$(有 $m$ 个分量)。

Strang 的宏伟图像告诉我们,每个世界都被垂直(正交)地切成了两半。

1. 维度的守恒

就像物质守恒一样,空间的总维数也是守恒的。

所在世界子空间名称符号维度 (Dimension)直觉含义
$\mathbb{R}^n$ (输入)行空间$C(\mathbf{A}^\mathsf{T})$$r$矩阵真正“利用”的输入维度
零空间$N(\mathbf{A})$$n-r$被矩阵“压扁”消失的维度
$\mathbb{R}^m$ (输出)列空间$C(\mathbf{A})$$r$矩阵能“生产”出的有效维度
左零空间$N(\mathbf{A}^\mathsf{T})$$m-r$矩阵无法触及的盲区

核心洞察

矩阵 $\mathbf{A}$ 的本质工作,就是把 $\mathbb{R}^n$ 中的 $r$ 维(行空间)无损地映射到 $\mathbb{R}^m$ 中的 $r$ 维(列空间),而把剩下的 $n-r$ 维(零空间)全部粉碎为零。

2. 正交的本质 (Orthogonality)

为什么我们要把空间切开?因为它们之间存在着完美的正交关系

在来源世界 $\mathbb{R}^n$ 中: $$\mathbf{A}\boldsymbol{x} = \mathbf{0} \iff \begin{pmatrix} \text{row}_1 \\ \vdots \\ \text{row}_m \end{pmatrix} \cdot \boldsymbol{x} = \begin{pmatrix} 0 \\ \vdots \\ 0 \end{pmatrix}$$ 这意味着:零空间中的任意向量 $\boldsymbol{x}$,必须垂直于矩阵的每一行。 既然垂直于每一行,它就垂直于这些行向量张成的整个空间——行空间

数学语言描述为直和分解: $$ \mathbb{R}^n = C(\mathbf{A}^\mathsf{T}) \oplus N(\mathbf{A}) $$

这句话的物理含义是: 空间里的任何一个向量 $\boldsymbol{x}$,都可以唯一地分解为两个互相垂直的分量: $$ \boldsymbol{x} = \boldsymbol{x}_{row} + \boldsymbol{x}_{null} $$ 其中 $\boldsymbol{x}_{row}$ 属于行空间,$\boldsymbol{x}_{null}$ 属于零空间。


二、 线性方程组的“罗生门”

理解了空间的分解,我们就能看透 $\mathbf{A}\boldsymbol{x}=\boldsymbol{b}$ 的各种情况。

1. 有解 vs 无解

  • 有解: $\boldsymbol{b}$ 必须住在列空间 $C(\mathbf{A})$ 里。
  • 无解: $\boldsymbol{b}$ 跑到了左零空间 $N(\mathbf{A}^\mathsf{T})$ 的地盘里。
    • 此时我们无法求出精确解,只能求“最小二乘解”。其几何本质就是把 $\boldsymbol{b}$ 投影回列空间。

2. 唯一解 vs 无穷多解

  • 如果 $N(\mathbf{A}) = {\mathbf{0}}$(零空间只有零向量):
    • $\boldsymbol{x}_{null}$ 只能是 0。
    • 解 $\boldsymbol{x} = \boldsymbol{x}_{row} + \mathbf{0}$ 是唯一的。
  • 如果 $N(\mathbf{A}) \neq {\mathbf{0}}$(零空间很大):
    • 通解 = 特解 + 齐次解。
    • 对应几何分解:$x = \boldsymbol{x}_{row} + \boldsymbol{x}_{null}$。
    • $\boldsymbol{x}_{row}$ 是那个独一无二的“特解”,而 $\boldsymbol{x}_{null}$ 可以在零空间里随意游荡,导致了无穷多解。

✍️ 课后实战:正交性的威力

利用“空间正交分解”的直觉,我们可以解决一些非常深刻的问题。

  1. (经典结论:最小范数解) 设 $\mathbf{A}\boldsymbol{x}=\boldsymbol{b}$ 有无穷多解。请利用 $\mathbb{R}^n = C(\mathbf{A}^\mathsf{T}) \oplus N(\mathbf{A})$ 的性质证明: 在所有解中,存在唯一的一个解 $\boldsymbol{y}$ 属于行空间 $C(\mathbf{A}^\mathsf{T})$,且这个解的长度(范数)最小。
🔐 点击查看解析 / Click to Reveal

【证 1:存在性与唯一性】 对于任意一个解 $\boldsymbol{x}$,根据正交分解定理,我们可以把它拆分为: $$ \boldsymbol{x} = \boldsymbol{x}_r + \boldsymbol{x}_n $$ 其中 $\boldsymbol{x}_r \in C(\mathbf{A}^\mathsf{T})$,$\boldsymbol{x}_n \in N(\mathbf{A})$。

将这个 $\boldsymbol{x}$ 代入方程: $$ \mathbf{A}\boldsymbol{x} = \mathbf{A}(\boldsymbol{x}_r + \boldsymbol{x}_n) = \mathbf{A}\boldsymbol{x}_r + \mathbf{A}\boldsymbol{x}_n = \mathbf{A}\boldsymbol{x}_r + \mathbf{0} = \boldsymbol{b} $$ 1. 存在性: 可见 $\boldsymbol{x}_r$ 也是一个解!且 $\boldsymbol{x}_r$ 完全位于行空间。

2. 唯一性: 假设行空间里还有另一个解 $\boldsymbol{x}_r'$。

  • 差值在零空间:因为两者都是解,所以 $\mathbf{A}(\boldsymbol{x}_r - \boldsymbol{x}_r') = \boldsymbol{b} - \boldsymbol{b} = \mathbf{0}$。即差值向量 $\boldsymbol{d} = \boldsymbol{x}_r - \boldsymbol{x}_r'$ 属于零空间 $N(\mathbf{A})$。
  • 差值在行空间:因为 $\boldsymbol{x}_r, \boldsymbol{x}_r'$ 都在行空间,向量空间对减法封闭,所以差值 $\boldsymbol{d}$ 也属于行空间 $C(\mathbf{A}^\mathsf{T})$。
  • 结论:向量 $\boldsymbol{d}$ 既属于行空间又属于零空间。由于这两个空间是正交互补的(唯一的交集是零向量),所以 $\boldsymbol{d} = \mathbf{0}$,即 $\boldsymbol{x}_r = \boldsymbol{x}_r'$。

【证 2:最小长度】 计算任意解 $\boldsymbol{x}$ 的长度平方: $$ | \boldsymbol{x} |^2 = | \boldsymbol{x}_r + \boldsymbol{x}_n |^2 = | \boldsymbol{x}_r |^2 + | \boldsymbol{x}_n |^2 $$ (由勾股定理,因 $\boldsymbol{x}_r \perp \boldsymbol{x}_n$)。 显然当且仅当 $\boldsymbol{x}_n = \mathbf{0}$ 时,长度取得最小值。
结论: 行空间解即为最小范数解(伪逆解)。

  1. (作图题) 画出矩阵 $\mathbf{A} = \begin{pmatrix} 1 & 2 \\ 3 & 6 \end{pmatrix}$ 的四个子空间示意图(画在平面直角坐标系中)。
🔐 点击查看解析 / Click to Reveal

【解】

  1. 分析矩阵: 第 2 行是第 1 行的 3 倍。秩 $r=1$。维度 $n=2, m=2$。
  2. 来源世界 $\mathbb{R}^2$
    • 行空间 $\mathbf{C}(\mathbf{A}^\mathsf{T})$:由行向量 $(1, 2)^\mathsf{T}$ 生成的直线($y=2x$ 方向)。
    • 零空间 $\mathbf{N}(\mathbf{A})$:垂直于行空间的直线($y = -0.5x$)。
  3. 目标世界 $\mathbb{R}^2$
    • 列空间 $\mathbf{C}(\mathbf{A})$:由列向量 $(1, 3)^\mathsf{T}$ 生成的直线($y=3x$ 方向)。
    • 左零空间 $\mathbf{N}(\mathbf{A}^\mathsf{T})$:垂直于列空间的直线($y = - \frac{1}{3} x$)。
直觉验证:两个世界的垂直十字架 ◎ 直觉验证:两个世界的垂直十字架

总结: 你会看到两个十字架(虽然不是水平垂直的),分别在两个坐标系中。行空间与零空间垂直,列空间与左零空间垂直。这就是原本的图像!

加载评论