阅读翻译Mathematics for Machine Learning之2.8 Affine Subspaces

阅读翻译Mathematics for Machine Learning之2.8 Affine Subspaces

关于:

  • 首次发表日期:2024-07-24
  • Mathematics for Machine Learning官方链接: https://mml-book.com
  • ChatGPT和KIMI机翻,人工润色
  • 非数学专业,如有错误,请不吝指出

2.8 仿射空间

接下来,我们将更详细地考察从原点偏移的空间,即不再是向量子空间的空间。此外,我们还将简要讨论这些仿射空间之间映射的性质,这些映射类似于线性映射。

备注。在机器学习文献中,线性和仿射之间的区别有时并不明确,以至于我们可以发现将仿射空间/映射称为线性空间/映射的参考文献。

2.8.1 仿射空间

定义 2.25(仿射子空间)。设 (V) 为一个向量空间,(boldsymbol{x}_0 in V)(U subseteq V) 为一个子空间。那么子集

[begin{align*} L & =boldsymbol{x}_0+U:=left{boldsymbol{x}_0+boldsymbol{u}: boldsymbol{u} in Uright} tag{2.130a} \ & =left{boldsymbol{v} in V mid exists boldsymbol{u} in U: boldsymbol{v}=boldsymbol{x}_0+boldsymbol{u}right} subseteq V tag{2.130b} end{align*} ]

称为 (V)仿射子空间线性流形(linear manifold)(U) 称为方向方向空间(direction space)(boldsymbol{x}_0) 称为支点(support point)。在第12章中,我们将这种子空间称为超平面。

注意,如果 (boldsymbol{x}_0 notin U),则仿射子空间的定义排除了 (mathbf{0})。因此,对于 (boldsymbol{x}_0 notin U),仿射子空间不是 (V) 的(线性)子空间(向量子空间)。

仿射子空间的例子有 (mathbb{R}^3) 中的点、线和平面,这些点、线和平面不(一定)通过原点。

备注。考虑向量空间 (V) 的两个仿射子空间 (L = boldsymbol{x}_0 + U)(tilde{L} = tilde{boldsymbol{x}}_0 + tilde{U})。当且仅当 (U subseteq tilde{U})(x_0 - tilde{x}_0 in tilde{U}) 时,(L subseteq tilde{L})

仿射子空间通常由参数描述:考虑一个 (V)(k) 维仿射空间 (L = boldsymbol{x}_0 + U)。如果 (left(boldsymbol{b}_1, ldots, boldsymbol{b}_kright))(U) 的一个有序基,那么每个元素 (boldsymbol{x} in L) 都可以唯一地描述为

[boldsymbol{x}=boldsymbol{x}_0+lambda_1 boldsymbol{b}_1+ldots+lambda_k boldsymbol{b}_k, tag{2.131} ]

其中 (lambda_1, ldots, lambda_k in mathbb{R})。这种表示称为具有方向向量 (boldsymbol{b}_1, ldots, boldsymbol{b}_k) 和参数 (lambda_1, ldots, lambda_k)(L) 的参数方程。


**例 2.26(仿射子空间)**

  • 一维仿射子空间称为直线,可以写作 (boldsymbol{y}=boldsymbol{x}_0+lambda boldsymbol{b}_1),其中 (lambda in mathbb{R})(U=operatorname{span}left[boldsymbol{b}_1right] subseteq mathbb{R}^n)(mathbb{R}^n) 的一维子空间。这意味着直线由一个支点 (boldsymbol{x}_0) 和一个定义方向的向量 (boldsymbol{b}_1) 定义。参见图 2.13 了解示意图。
  • (mathbb{R}^n) 的二维仿射子空间称为平面。平面的参数方程为 (boldsymbol{y}=boldsymbol{x}_0+lambda_1 boldsymbol{b}_1+lambda_2 boldsymbol{b}_2),其中 (lambda_1, lambda_2 in mathbb{R})(U=operatorname{span}left[boldsymbol{b}_1, boldsymbol{b}_2right] subseteq mathbb{R}^n)。这意味着平面由一个支点 (boldsymbol{x}_0) 和两个线性独立的向量 (boldsymbol{b}_1, boldsymbol{b}_2) 定义,这两个向量张成方向空间(span the direction space)。
  • (mathbb{R}^n) 中,((n-1)) 维仿射子空间被称为超平面,相应的参数方程为 (boldsymbol{y}=boldsymbol{x}_0+sum_{i=1}^{n-1} lambda_i boldsymbol{b}_i),其中 (boldsymbol{b}_1, ldots, boldsymbol{b}_{n-1}) 构成 (mathbb{R}^n) 的一个 ((n-1)) 维子空间 (U) 的基。这意味着超平面由一个支点 (boldsymbol{x}_0)((n-1)) 个线性独立的向量 (boldsymbol{b}_1, ldots, boldsymbol{b}_{n-1}) 定义,这些向量张成方向空间。在 (mathbb{R}^2) 中,直线也是超平面。在 (mathbb{R}^3) 中,平面也是超平面。

阅读翻译Mathematics for Machine Learning之2.8 Affine Subspaces


备注(非齐次线性方程组和仿射子空间)。对于 (boldsymbol{A} in mathbb{R}^{m times n})(boldsymbol{x} in mathbb{R}^m),线性方程组 (boldsymbol{A} boldsymbol{lambda}=boldsymbol{x}) 的解要么是空集,要么是 (mathbb{R}^n) 中维度为 (n-operatorname{rk}(boldsymbol{A})) 的仿射子空间。特别地,当 (left(lambda_1, ldots, lambda_nright) neq (0, ldots, 0)) 时,线性方程 (lambda_1 boldsymbol{b}_1 + ldots + lambda_n boldsymbol{b}_n = boldsymbol{x}) 的解是 (mathbb{R}^n) 中的一个超平面。

(mathbb{R}^n) 中,每个 (k) 维仿射子空间都是非齐次线性方程组 (boldsymbol{A x}=boldsymbol{b}) 的解,其中 (boldsymbol{A} in mathbb{R}^{m times n})(boldsymbol{b} in mathbb{R}^m) 并且 (operatorname{rk}(boldsymbol{A})=n-k)。回想一下,对于齐次方程组 (boldsymbol{A x}=mathbf{0}),解是一个向量子空间,我们也可以将其视为一个特殊的仿射空间,其支点为 (boldsymbol{x}_0=mathbf{0})

2.8.2 仿射映射

类似于我们在 2.7 节讨论的向量空间之间的线性映射,我们可以在两个仿射空间之间定义仿射映射。线性映射和仿射映射密切相关。因此,我们从线性映射中已经知道的许多性质,例如线性映射的复合(composition)是一个线性映射,也适用于仿射映射。

定义 2.26(仿射映射)。对于两个向量空间 (V, W),一个线性映射 (Phi: V rightarrow W),以及 (boldsymbol{a} in W),映射

[begin{align*} phi: V & rightarrow W tag{2.132} \ boldsymbol{x} & mapsto boldsymbol{a} + Phi(boldsymbol{x}) tag{2.133} end{align*} ]

是从 (V)(W) 的仿射映射。向量 (boldsymbol{a}) 被称为 (phi) 的平移向量。

  • 每一个仿射映射 (phi: V rightarrow W) 也是线性映射 (Phi: V rightarrow W)(W) 中的平移 (tau: W rightarrow W) 的复合,使得 (phi = tau circ Phi)。映射 (Phi)(tau) 是唯一确定的(uniquely determined)。
  • 仿射映射 (phi: V rightarrow W, phi^{prime}: W rightarrow X) 的复合 (phi^{prime} circ phi) 是仿射的。
  • 如果 (phi) 是双射的,仿射映射保持几何结构不变。它们还保留维度和平行性。
发表评论

评论已关闭。

相关文章