目的のない勉強会

主にブルーバックスをまとめています

【MLP】統計的因果探索【1章】

1.1 はじめに

統計的因果推論

因果関係*1を推測する方法のこと。

統計的因果探索

統計的因果推論の技術のひとつで、因果関係の大きさを予測する機械学習といえる。他にどんなのがあるのか?

1.2 因果探索における最大の困難:擬似相関

観測変数
未観測変数
因果グラフ

ノードとエッジからなるグラフで、エッジは矢印で方向性がある。矢印の始点にあるノードが原因で、終点にあるノードは結果である。因果グラフは、定性的な因果関係を表すもので、「因果効果の大きさがどのくらいか」という定量的な情報は含まない。

共通原因
未観測共通原因
擬似相関 spurious correlation

1.3 擬似相関の数値列

データ生成過程

データ、つまり変数の「値」が実際にどう決まってくるのかを表す手順のこと。数式で表せる。

誤差変数

ある結果を説明する原因は因果グラフにノードとして明示的に描かれる。一方で、明示されていない原因を誤差変数としてまとめる。

ガウス分布

他の章へはこちらから

catano.hatenablog.com

*1:例えば、チョコレートの消費量とノーベル賞の受賞者数に正の相関(相関係数は 0.79)がある。だからといってノーベル賞のために子どもにチョコレートをたくさん食べさせる政策を打つ政治家はいない。なぜなら、因果関係があるかはわからないから。相関は因果を意味しない。