先日、逐次ベイズ推定とカルマンフィルタにて、ベイズ推定とカルマンフィルタの関係を考察したが、「誤差の共分散」が何を表すのか深く考えないでいた。68–95–99.7則から「共分散すなわち $ \sigma $ の多変量版」だから、68%確率円(気象庁|台風情報の種類と表現方法) くらいに思っていたが、甘かったのでした。
おかげで、カルマンフィルタにおける誤差楕円の計算方法 - MyEnigmaを拝見した時に、意気がったツイートをしてしまったのですが、私のほうが違っていたのでお詫び申し上げます。すみませんでした!!
正規分布と確率
1次元
確率変数Xがスカラーで、1次元の場合を考えます。
\[
X \sim \mathcal{N}(\mu, \sigma^2) \qquad \sigma \in \mathbb{R}^+
\]
このとき、$ X $ が閉区間 $ [\mu -a \sigma, \mu + a \sigma] $ (ただし、$ a \in \mathbb{R}^+ $) に収まる確率は、標準正規分布の累積密度関数 $ \Phi(x) $ を用いて
\[
\text{Pr}(|X - \mu |\leq a \sigma) = \Phi(a) - \Phi(-a) = erf(\frac{a}{\sqrt{2}})
\]
(厳密には半開区間だが、下限の等号の有無は気にしない方が多いようなので…)
あとは標準正規分布表やらerfやらを用いると「$ 3 \sigma $ の範囲に99.7%に収まる」などが求まります。「何が範囲に収まるんですか?」というところについては、
カルマンフィルタの予測ステップなりフィルタステップなりで得られた事後分布 $ \mathcal{N}(\hat{\mu}, \sigma) $
に対して、確信区間という形で「真値が収まる確率」という解釈で良いでしょう。
erfの逆関数を用いる形で任意の確率について、aを求めることができます。
多次元
さて、k次元の場合に移ります。まず、おさらいで、多変量正規分布の確率密度分布は、
\[
f(\mathbf{x}) = \mathcal{N}_k(\textbf{x}|\mathbf{\mu}, \Sigma) =\left(\frac{1}{2\pi}\right)^{k/2}|\Sigma|^{-1/2}\exp\{-\frac{1}{2}(\textbf{x}-\mathbf{\mu})'\Sigma^{-1}(\textbf{x}-\mathbf{\mu})\}
\]
のように定義されます。1次元のときと同様に閉区間にあたるものを定義したいですね。
expの中の項に注目すると $ (\textbf{x}-\mathbf{\mu})'\Sigma^{-1}(\textbf{x}-\mathbf{\mu}) $ が目に付きます。
この値が等しいときは確率密度 $ f(\cdot) $ も等しくなるわけですね。
$ \sqrt{(\textbf{x}-\mathbf{\mu})'\Sigma^{-1}(\textbf{x}-\mathbf{\mu})} $ はマハラノビス距離と呼ばれていて、
マハラノビス距離が($ \mathbf{\mu}$から)等距離のベクトルはk次元の楕円の表面上にあります。
ここから、
\[
g(d) = \text{Pr}\{(\textbf{x}-\mathbf{\mu})'\Sigma^{-1}(\textbf{x}-\mathbf{\mu}) \le d\}
\]
と、dと確率を結びつける関数g(1次元の例ではerf)を知りたくなります。
さて、これについては証明は参考文献[1]に讓りますが、自由度kのカイ二乗分布を用いて下記の関係があります。
\[
\text{Pr}\{(\textbf{x}-\mathbf{\mu})'\Sigma^{-1}(\textbf{x}-\mathbf{\mu}) \le \chi^2_{k,\alpha}\}=1-\alpha
\]
したがって、カイ二乗分布の累積密度関数の逆関数を使えば、k次元の正規分布について確率 $ \alpha $とマハラノビス距離を結び付けられそうですね。
よって、カルマンフィルタで求めた正規分布$ p(x_n \vert Y_n) = \mathcal{N}(x_n \vert \hat{x}_{n|n}, P_{n|n}) , x_n \in \mathbb{R}^k $ などに対しては、
自由度kのカイ二乗分布を使って誤差楕円を求められそうです。
具体的な方法は、こちらの神サイトを御覧ください。
カルマンフィルタにおける誤差楕円の計算方法 - MyEnigma
カルマンフィルタ誤差の共分散の意味
というわけで、68–95–99.7則の感覚で意味づけすることを考えると
\[
\text{Pr}\{(x-\hat{x})'P^{-1}(x-\hat{x}) \le n^2 \} \quad n = 1\ or\ 3
\]
などと一般化した上で、
$ P_{t|t} $ (あるいは $ P_{t|t-1} $) の次元に応じて「真値がXX%の確率で収まる確信区間」という意味でした。
XX%の下りは参考に以下を御覧ください(次元の呪いっぽいものも見えます。)
次元 |
1σ(?) |
3σ(?) |
1 |
68.3% |
99.7% |
2 |
39.3% |
98.9% |
3 |
19.9% |
97.1% |
4 |
9.0% |
93.9% |
というか、ひょっとしてモデルの次元が高まるほど真値が楕円の中心に来る確率は限りなく低くなってくるのか…?
参考
- N-DIMENSIONAL CUMULATIVE FUNCTION, AND OTHER USEFUL FACTS ABOUT GAUSSIANS AND NORMAL DENSITIES
- 4.3 - Exponent of Multivariate Normal Distribution | STAT 505
- カイ2乗分布 - 高精度計算サイト
- 高次元空間中の正規分布は超球面状に分布する - Qiita
No comments:
Post a Comment