参考Introduction to graph theroy
群的公理与基本例子
核心定义与公理
一个 二元结构 (binary structure) 是一对 (G,∗)(G, *),其中:
- 是一个集合。
- 是定义在 上的二元运算(binary operation)。
群 是满足下列公理的二元结构 (G,∗):
| 公理 | 内容 |
|---|---|
| 闭包 (Closure) | ,有 (运算结果仍在集合内) |
| 结合律 (Associativity) | , |
| 单位元 (Identity) | 存在 ,使得 ; |
| 逆元 (Inverse) | 对每个 ,存在,使得 |
同构与同态 (Homomorphism & Isomorphism)
- 同态 (Homomorphism):如果 与 是两个二元结构/群,一个函数 是同态,如果对所有 ,有 即运算“被保留/对应”。
- 同构 (Isomorphism):同态之外还要是双射(bijective/invertible)。如果存在一个这样的同构 ,我们写 。同构的群是“结构上一样”的,只是名字/表示方式可能不同。
- 结构性属性 (Structural properties):在同构关系下不变的特性,例如群的阶(元素个数,order)、是否交换群、结合律、是否有某种特性……这些都是结构性属性。查看同构有助于认出两个看起来不一样的群其实本质上是一样的。
图论基础
定义 A.2(群在集合上的作用)。设 是一个带有对称群 的集合。群 在集合 上的(左)群作用是一个映射:
该映射与群合成运算和单位元 兼容,使得以下性质成立:
我们主要研究具有向量空间结构的集合上的对称变换。在大多数实际情况下,群在向量空间上的作用是线性的,允许将对称变换表示为线性可逆映射。一旦选择了空间的基,这些映射可以用矩阵形式表示。
定义 A.3(线性群表示)。设 是一个带有对称群 的向量空间。 在 上的一个线性表示是一个映射,记为 ,它在对称变换和 上的可逆线性映射之间建立联系(即,一般线性群 的元素):
\begin{aligned} \rho_{\mathcal{X}}: \quad \mathbb{G} \quad &\longrightarrow \quad \mathbb{GL}(\mathcal{X})\\ g \quad &\longrightarrow \quad \rho_{\mathcal{X}}(g), \end{aligned}$$ 使得以下性质成立:\begin{aligned} \text{合成:} &\quad \rho_{\mathcal{X}}(g_1 \circ g_2) = \rho_{\mathcal{X}}(g_1) \rho_{\mathcal{X}}(g_2), \quad \forall g_1, g_2 \in \mathbb{G}, \ \text{逆元:} &\quad \rho_{\mathcal{X}}(g^{-1}) = \rho_{\mathcal{X}}(g)^{-1}, \quad \forall g \in \mathbb{G}. \ \text{单位元:} &\quad \rho_{\mathcal{X}}(g \circ g^{-1}) = \rho_{\mathcal{X}}(e) = \mathbf{I}, \end{aligned}
每当向量空间是有限维的 $|\mathcal{X}| = n < \infty$ 时,线性映射可以以矩阵形式 $\rho_{\mathcal{X}}(g) \in \mathbb{R}^{n \times n}$ 表示,一旦选择了向量空间 $\mathcal{X}$ 的基集 $\mathbb{I}_{\mathcal{X}}$。在这种情况下,方程 (12b) 到 (12d) 展示了对称变换的合成和逆如何分别转化为矩阵乘法和逆。此外,$\rho_{\mathcal{X}}$ 允许将(线性)群作用(定义 A.2)表示为矩阵-向量乘法:\begin{aligned} (\triangleright): \quad \mathbb{G} \times \mathcal{X} \quad &\longrightarrow \quad \mathcal{X} \ (g, \mathbf{x}) \quad &\longrightarrow \quad g \triangleright \mathbf{x} := \rho_{\mathcal{X}}(g) \mathbf{x} \end{aligned}
**定义 A.4(张量积表示)**。设 $\mathcal{X}$ 和 $\mathcal{Y}$ 是具有共同对称群 $\mathbb{G}$ 的(有限维)向量空间。记 $\rho_{\mathcal{X}}: \mathbb{G} \to \mathbb{GL}(\mathcal{X})$ 和 $\rho_{\mathcal{Y}}: \mathbb{G} \to \mathbb{GL}(\mathcal{Y})$ 为相应的线性表示。张量积表示通过群作用在向量空间上的表示的克罗内克积定义: $$ \begin{aligned} (\rho_{\mathcal{X}} \otimes \rho_{\mathcal{Y}}): \quad \mathbb{G} \quad &\longrightarrow \quad \mathbb{GL}(\mathcal{X} \otimes \mathcal{Y}) \\ g \quad &\longrightarrow \quad \rho_{\mathcal{X}}(g) \otimes \rho_{\mathcal{Y}}(g), \end{aligned}注释 A.1。每当用 和 表示群作用时,我们将使用符号 来表示在张量积空间 上的群作用。使得:
定义 A.5(-等变和 -不变映射)。设 和 是具有相同对称群 的两个向量空间,分别带有群作用 和 。一个映射 被称为 -等变的,如果它与群作用可交换,使得:
-等变映射的一个特例是 -不变映射,它们与群作用可交换,并且具有平凡的输出群作用 ,使得 对所有 成立。即:
定义 B.1(对称 POMDP)。一个 POMDP 具有对称群 ,当状态空间 和动作空间 承认群作用 和 ,且 都是 -不变的。也就是说,对于每一个 ,,和 ,我们有:
满足方程 (2) 的 POMDP 被约束为具有最优策略和价值函数,它们满足:
命题 B.1(最优性条件 )。给定在最优策略 上的 -等变约束和在最优价值函数 上的 -不变约束(如方程 (17) 中所示)的对称 POMDP,任何参数化策略 和价值函数 可以分别被构造为 -等变和 -不变的,如果观察函数 是 -等变的,从而赋予观察空间相同的对称群 和群作用 。 这是因为两个函数的复合要成为 -等变()或 -不变(),这两个函数都必须是 -等变的,使得: