情報幾何に入門した (3): α-接続

入門 情報幾何―統計的モデルをひもとく微分幾何学―』の復習メモ。

\(M\) を多様体とし、\( \mathfrak{X}(M) \) を \(M\) 上の \(C^\infty\) 級ベクトル場全体の集合とする。写像 \(\nabla \colon \mathfrak{X}(M) \times \mathfrak{X}(M) \to \mathfrak{X}(M);\;(X,Y)\mapsto \nabla_Y X \) が affine 接続であるとは、任意の \( X,Y,Z\in\mathfrak{X}(M)\) および任意の \( f \in C^\infty(M)\) に対して以下が成り立つときにいう。

(1) \( \nabla_{Y+Z} X = \nabla_Y X + \nabla_Z X. \)

(2) \( \nabla_{fY} X = f \, \nabla_Y X. \)

(3) \( \nabla_Z (X+Y) = \nabla_Z X + \nabla_Z Y. \)

(4) \( \nabla_Y (fX) = (Yf)X + f \, \nabla_Y X . \)

なお、このとき、\( \nabla_Y X \) を \(Y\) に関する \(X\) の共変微分という。

写像 \(T \colon \mathfrak{X}(M) \times \mathfrak{X}(M) \to \mathfrak{X}(M) \) を

$$T(X,Y) = \nabla_X Y – \nabla_Y X – [X,Y] $$

で定める。\(T\) を \(\nabla\) の捩率テンソル場または捩率という。

\(\nabla\) の捩率が 0 のとき、\(\nabla\) は捩れをもたない、または捩れがないという。

写像 \( R \colon \mathfrak{X}(M) \times \mathfrak{X}(M) \times \mathfrak{X}(M) \to \mathfrak{X}(M) \) を

$$R(X,Y)Z = \nabla_X \nabla_Y Z – \nabla_Y \nabla_X Z – \nabla_{[X,Y]}Z $$

で定める。\(R\) を \(\nabla\) の曲率テンソル場または曲率という。

\(\nabla\) の捩率も曲率も 0 のとき、\(\nabla\) は平坦という。

\((U,\varphi)\) を \(M\) の座標近傍とし、\(\varphi = (x_1,\ldots,x_n)\) と表しておく(\(n=\dim M\), \(x_i\colon U\to\mathbf{R}\))。Christoffel の記号 \(\Gamma_{ij}^k \in C^\infty(U)\) を

$$\nabla_{\frac{\partial}{\partial x_i}} \frac{\partial}{\partial x_j}
= \sum_{1 \le k \le n} \Gamma_{ij}^k \frac{\partial}{\partial x_k} $$

で定めることができる。

\(\nabla\) が捩れをもたないことと、任意の座標近傍と任意の \(i,j,k\) で \( \Gamma_{ij}^k = \Gamma_{ji}^k \) となることは同値である。

Riemann 多様体 \((M,g)\) に対しては、以下の Christoffel 記号も定まる:

$$\Gamma_{ij,k} = g\left( \nabla_{\frac{\partial}{\partial x_i}} \frac{\partial}{\partial x_j} , \frac{\partial}{\partial x_k} \right).$$

Riemann 多様体 \((M,g)\) には、以下の条件を満たす affine 接続 \(\nabla\) が一意に存在し、Levi-Civita 接続または Riemann 接続 という。

(1) \(\nabla\) は捩れをもたない。

(2) \(\nabla\) は計量的である:任意の \(X,Y,Z \in \mathfrak{X}(M)\) に対して、

$$ X g(Y,Z) = g( \nabla_X Y, Z)+g(Y, \nabla_X Z).$$

以上の微分幾何的な準備をもとに、統計的モデルのα-接続を定義する。

\(\Omega\) を \(\mathbf{R}\) の空でない高々可算な部分集合あるいは \(\mathbf{R}\) とし、\(S = \{p(\cdot;\boldsymbol{\xi}) \mid \boldsymbol{\xi} \in \Xi \}\) を \(\Omega\) 上の \(n\) 次元統計的モデルとする。\(\partial_i = \partial / \partial \xi_i \), \(l_{ \boldsymbol{\xi} }(x) = \log p(x; \boldsymbol{\xi} ) \) とする。

$$g_{ij}( \boldsymbol{\xi} ) = \mathbf{E}_{ \boldsymbol{\xi} }[( \partial_i l_{ \boldsymbol{\xi} })( \partial_j l_{ \boldsymbol{\xi} } )]$$

とおく(cf. Chentsov の定理)。\( (g_{ij}( \boldsymbol{\xi} ))_{i,j} \) を \(S\) の \( \boldsymbol{\xi} \) におけるFisher 情報行列という(可積分性とかは仮定)。これは半正定値対称行列だが、正定値なら \(\Xi\) 上の Riemann 計算が定まる。\( \boldsymbol{\xi} \in \Xi \) を \( p(\cdot;\boldsymbol{\xi}) \in S\) とみなして、Fisher 情報行列は \(S\) 上の Riemann 計量を定め、この計量を Fisher 計量という。

\(\nabla\) を Fisher 計量 \(g\) に関する Levi-Civita 接続とし、\(\overline{T}\) を

$$ \overline{T}_{ijk}( \boldsymbol{\xi} ) = \mathbf{E}_{ \boldsymbol{\xi} }[( \partial_i l_{ \boldsymbol{\xi} })( \partial_j l_{ \boldsymbol{\xi} } ) ( \partial_k l_{ \boldsymbol{\xi} } ) ] $$

で定まる \(S\) 上の \((0,3)\) 型テンソル場とする(cf. Chentsov の定理)。このとき、\(\alpha\in\mathbf{R}\) に対して、\(S\) の affine 接続 \(\nabla^{(\alpha)}\) を

$$ g( \nabla^{(\alpha)}_Y X, Z ) = g( \nabla_Y X, Z ) – \frac{\alpha}{2} \overline{T}(X,Y,Z)$$

により定めることができる。\(\nabla^{(\alpha)}\) をα-接続という。

α-接続の Christoffel 記号は

$$ \Gamma_{ij,k}^{(\alpha)} = \mathbf{E}_{ \boldsymbol{\xi} }\left[
\left( \partial_i \partial_j l_{ \boldsymbol{\xi} } + \frac{1-\alpha}{2}( \partial_i l_{ \boldsymbol{\xi} } )( \partial_j l_{ \boldsymbol{\xi} } ) \right) ( \partial_k l_{ \boldsymbol{\xi} } )
\right] $$

となり、\(\nabla^{(\alpha)}\) は捩れをもたない。

コメント

タイトルとURLをコピーしました