マッチング法

実験的手法 vs 観察データ

 

・実験的手法(RCTなど)

メリット

 因果関係を明らかにしやすい

デメリット

 サンプルサイズが十分に必要

 コストが高い

 

観察データから因果関係を見つける方法

→ ある介入を行ったAさんと介入を行っていないBさん(反実仮想)で比較する

Aさんの効果:Ya

Bさんの効果:Yb

介入の効果 = Ya - Yb

 

マッチング法

AさんBさんの効果を回帰式で表す Aさん: Ya = β0 + β1 Xa + β2 Ca + Ua Bさん: Yb = β0 + β1 Xb + β2 Cb + Ub C: 外的条件 この時、 Ca = Cb となるBさんを探すのがベスト

→ 外的条件が同じようなBさんを探す = 政策の効果だけの差を知ることができる (外的条件Cを共変量Xとして複数定めることも可能)

Bさん(外的条件が近い人)の探し方

1.完全マッチング:Cが全く同じ人 2.最近傍マッチング:Cが近い人 3.半径マッチング:ある程度の距離にいるグループの平均値をとる 4.カーネルマッチング:各個人に重みをつけて加重平均 → どれがいいのかは意見が分かれる 頑健性分析(いろいろやってよかったやつを使う)をする

なかなか同じ外的条件を持っている人は少ない

対処法

→ 傾向スコアマッチング

様々な要因から施策を受ける確率が同じグループで

施策を受ける人 vs  受けない人 で比較する

施策を受けた人を1とするダミー変数を作成する

施策を受ける確率を求める回帰式は

ダミー変数(受けた人:1)= β0 + β1 X1 + β2 X2 + U

→回帰分析の結果からβが求められる

その結果を用いて

施策を受ける確率(傾向スコア) = β0 + β1 X1 + β2 X2 + U

を求める

傾向スコアが同じ人で

政策の効果 = X(受けた人) - X(受けていない人)