情報幾何に入門した (4): 統計多様体とか

入門 情報幾何―統計的モデルをひもとく微分幾何学―』の復習メモ。

\((M,g)\) を Riemann 多様体、\(\nabla\) を \(M\) の affine 接続とする。各 \(X,Z \in \mathfrak{X}(M)\) に対して、

$$ X g(Y, Z) = g(\nabla_X Y, Z) + g(Y, \nabla^*_X Z)
\quad (\forall Y \in \mathfrak{X}(M))$$

となる \( \nabla^*_X Z \in \mathfrak{X}(M) \) が一意に定まる。この \( \nabla^* \) は affine 接続となっていて、\( \nabla \) の双対接続という。

\( X \) に関する \(g\) の共変微分 \(\nabla_X g\) を

$$ X g(Y, Z) = (\nabla_X g)(Y, Z) + g( \nabla_X Y, Z) + g(Y, \nabla_X Z) $$

で定義する(これは対称な \((0,2)\) 型テンソル場)。

\(\nabla\) の捩率 \(T=0\) のとき、\(\nabla^*\) の捩率 \(T^*=0\) であることと、以下の Codazzi の方程式が成り立つことは同値である:

$$ (\nabla_X g)(Y, Z) = (\nabla_Z g)(Y, X) \quad ( \forall X,Y,Z \in \mathfrak{X}(M) ). $$

\(M\) を多様体、\(\nabla\) を \(M\) の affine 接続、\(g\) を \(M\) の Riemann 計量とする。\(\nabla\) が捩れをもたず、さらに、Codazzi の方程式が成り立つ(⇔ \(\nabla^*\) が捩れをもたない)とき、\((M, \nabla, g)\) を統計多様体という。

例えば、統計的モデル \(S\) に対して Fisher 計量 \(g\) とα-接続 \(\nabla^{(\alpha)}\) を考えると、\(\nabla^{(-\alpha)}\) が双対接続となって、\((S, \nabla^{(\alpha)}, g)\) は統計多様体である。

\((M, \nabla, g)\) を統計多様体とすると、\(\nabla\) が平坦であることと双対接続 \(\nabla^*\) が平坦であることは同値である。このとき、\((M, g, \nabla, \nabla^*)\) を双対平坦空間という。

指数型分布族と混合型分布族について。\(\Omega\) を \(\mathbf{R}\) の空でない高々可算な部分集合あるいは \(\mathbf{R}\) とし、\(S\) を \(\Omega\) 上の \(n\) 次元統計的モデルとする。

ある関数 \(C,F_1,\ldots,F_n\colon\Omega\to\mathbf{R}\), \(\psi\colon\Theta\to\mathbf{R}\) を用いて

$$ S = \{p(\cdot;\boldsymbol{\theta}) \mid \boldsymbol{\theta} \in \Theta \}, $$

$$ p(x;\boldsymbol{\theta}) = \exp\left(
C(x) + \sum_{1 \le i \le n} \theta_i F_i(x) – \psi( \boldsymbol{\theta} )
\right) $$

と表されるとき、\(S\) を指数型分布族といい、\( \boldsymbol{\theta} \) を自然座標系という。

また、ある確率密度関数 \(p_0,p_1,\ldots,p_n\colon\Omega\to\mathbf{R}\) を用いて

$$ S = \{p(\cdot;\boldsymbol{\theta}) \mid \boldsymbol{\theta} \in \Theta \}, $$

$$ p(x;\boldsymbol{\theta}) =
\sum_{1 \le i \le n} \theta_i p_i(x) +
\left( 1- \sum_{1 \le i \le n} \theta_i \right) p_0(x)
$$

と表されるとき、\(S\) を混合型分布族といい、\( \boldsymbol{\theta} \) を混合座標系という。

指数型分布族の \(\nabla^{(1)}\) の曲率は 0 となり、平坦となる。一般の統計的モデルの \(\nabla^{(1)}\) を指数型接続または e-接続といい、\(\nabla^{(\mathrm{e})}\) とも書く。指数型分布族 \(S\) と Fisher 計量 \(g\) に対して、\((S, g, \nabla^{(1)}, \nabla^{(-1)})\) は双対平坦空間である。

混合型分布族の \(\nabla^{(-1)}\) の曲率は 0 となり、平坦となる。一般の統計的モデルの \(\nabla^{(-1)}\) を混合型接続または m-接続といい、\(\nabla^{(\mathrm{m})}\) とも書く。 混合型分布族 \(S\) と Fisher 計量 \(g\) に対して、\((S, g, \nabla^{(-1)}, \nabla^{(1)})\) は双対平坦空間である。

コメント

タイトルとURLをコピーしました