目的のない勉強会

主にブルーバックスをまとめています

「MCMC」について調べてみた

 

MCMCで事後分布が計算できるということ

www.youtube.com

尤度関数を説明のために不連続としたところがわかりやすい。ある点 q における尤度を計算して、その q のお隣さんの尤度も計算する。右隣と左隣がいて、どちらか高い方に移動するというのがアルゴリズムである。最尤推定法では、高い方に移動して、低い方には絶対に移動しないという特徴がある*1。一方のMCMCでは、普通は高い方に移動するが、たまに尤度が低い方にも移動する。こんなことしてなにが嬉しいのか?という問題提議の後にされた説明がなんか腑に落ちた感じがした。なぜだろう?MCMCでのイテレーションを横軸に、尤度を縦軸にとったグラフで、最初にうろうろしている様子を示したのが重要だと思う。

最初にうろうろする

サンプルされたqのヒストグラムはふた山で、q=0.35 あたりでうろうろしてたんだなということしかわからない*2イテレーションをさらに大きくしていくと、ヒストグラムが実線で示される正規分布に近づく。こうしてパラメータ q が分布で示せるのだ、という流れがなんか染み込んだ。

その後の、久保さんのベイズの説明もなんかいい*3

*1:最尤推定方がこういう逐次推定をしているという理解はあるのだろうか?

*2:なんでここでうろうろしたんでしょうね。遷移を確率的にするときに対数尤度の比を使う。対数尤度の増加分が大きいほど、遷移確率が小さくなる。急峻な山であればあるほど登るのをためらう、みたいなことだろうか。わからない。

*3:MCMCの逐次更新が、ベイズの更新に対応するのだろうか?事後分布が更新後のヒストグラムで、尤度が更新前のヒストグラム。事前分布はデータ?なんかどうなんだろう。