情報科学の発展により、誰でも簡単にコンピュータを使ってデータを扱える時代になりました。
簡単にデータに触れることができる便利な時代である一方、不完全な分析事例も同時に増えていることは間違いありません。
自分や自分の周り含め、相関関係と因果関係を混同したり、不完全な分析によって生み出された根拠のない通説が社会全体に広まっていたりと枚挙にいとまがありません。
相関関係だけでなく因果関係を示す分析のことをエビデンスと呼びますが、間違った形で使われていたり、そもそも認識されていなかったりします。
2019年のノーベル経済学賞はバナジー、デュフロ、クレマーの三氏に与えられましたが、ランダム化比較試験(RCT)を用いて貧困削減へ実験的にアプローチしたことが評価され受賞に繋がりました。
因果関係を明らかにすることは、世界の役に立つ行為なのです。
『原因と結果の経済学』は因果推論の考え方をやさしく解説した書籍です。
著者の1人である中室氏は教育経済学者、津川氏は医師かつ医療政策学者であり、第一線で因果推論を扱う研究者によって書かれた本になってます。
この記事では、『原因と結果の経済学』で学んだ知識を簡単にまとめていこうと思います。
因果推論の基本的な考え方
物事の因果関係を明らかにするには、原因が起こった事実における結果と、原因が起きなかった反事実における結果を比較しなければなりません。
実際には起きることのなかった反事実を得ることはできないので、もっともらしい値で反事実における結果を生み出すことが因果推論の基本的な考え方になります。
本書では反事実における結果の作り方を解説しており、次の手法について主に解説しています。
- ランダム化比較試験(RCT)
- 自然実験
- 差の差分析
- 操作変数法
- 回帰不連続デザイン
- マッチング法
- 回帰分析
それぞれの手法について以下に簡単にまとめてみます。
ランダム化比較試験
研究対象をランダムに介入を受けるグループ(介入群)と受けないグループ(対照群) に分け、反事実における結果を対照群で穴埋めすることで、因果関係を検証する。
条件:ランダム化比較試験は必要なリソースが多い。倫理的に実行が困難な場合がある。
自然実験
法律や制度の変更、自然災害など自然的・経済的・社会的な「外生的なショック」によって介入群と対照群が自然に分かれてしまった状況を利用し、因果関係を検証する。
差の差分析
介入群と対照群において、介入前後の結果の差と、介入群と対照群の結果の差の2つの差を取る方法。
前提条件1:介入群と対照群の介入前のトレンドが同じであること
前提条件2:介入と同じタイミングで結果を与えるような別の変化がそれぞれのグループに対して起きていないこと
操作変数法
原因に影響を与えるが結果には直接に影響を与えない操作変数を用いて、介入群と対照群を比較する。
前提条件1:操作変数が結果に影響を与えないこと
前提条件2:操作変数と結果の両方に影響する第4の変数が存在しないこと
回帰不連続デザイン
恣意的に決めたカットオフ値の両側で、介入群と対照群が分かれる状況を利用して2つのグループを比較する。
前提条件:カットオフ値の周辺で結果に影響を与える他のイベントが起こっていないこと
マッチング法
結果に影響を与えるような共変量を用いて、対照群の中から介入群によく似たサンプルをマッチングさせて比較する。共変量をまとめてひとつの得点にしたものを用いる方法は、傾向スコアマッチングと呼ばれる。
前提条件:結果に影響を与える共変量が全て観察可能であること
まとめ
先日紹介した『データ分析の力』と比較すると、取り上げる手法も高度なものが多く、文体も難しめです。
統計学の知識が全くない人には読み進めるのは難しいかもとは想いますが、各手法に対する説明がコンパクトにまとまっており、図を使った説明も多いので分かりやすいです。
この本をスムーズに読めてもっと因果推論について勉強したい人は、次は学術的な入門書を手にとって大丈夫だと思います。
コメントを残す