介入に効果があったか?を知る
介入に効果があったか?を知る方法
Z=1 :介入あり
Z=0:介入なし
Y(1) (Z=1):介入をした時の結果
Y(0)(Z=0):介入をしていない時の結果
→ 式を1本にまとめる
Y = Y(0)(1-Z) + Y(1)Z (ex. Zが0の時、Y(1)Zが消える)
同一の集団に (介入あり/介入なし) を試すことができる場合、
介入効果は
τ = Y(1) - Y(0)
となる。
現実では、同一の集団に介入あり、介入なしを試すことができない。
ex. ある人が薬を飲んだ場合、その人の薬を飲まない場合の結果がわからない
つまり、ある集団から知ることができる情報は
介入ありの場合 → Z, Y(1)
介入なしの場合 → Z, Y(0)
よってY(1)とY(0)のどちらかは知ることができない。
解決策→ 介入あり / 介入なしの2つの集団の結果を比較する
図の説明
左が介入する集団 / 右が介入しない集団
E[Y(1)|Z=1]: 介入をした群の介入する前の状態 + 介入の効果
E[Y(0)|Z=1]:介入をした群の介入する前の状態
E[Y(0)|Z=0]:介入をしない群の状態
介入効果(τ)が知りたい。
τ = E[Y(1)|Z=1] - E[Y(0)|Z=1]
よくある間違い
間違い→ × ( τ= E[Y(1)|Z=1] - E[Y(0)|Z=0])
間違い→ ×(介入をした群の結果) - (介入をしない群の結果)
上の説明
イメージ図を見ると、間違えている式は
E[Y(1)|Z=1] - E[Y(0)|Z=0] = τ + (セレクションバイアス)
と説明できる。
セレクションバイアス とは:
介入する群と介入しない群の介入前から存在する差
ex. 商品に興味がある集団に広告を出す。興味がない集団には広告を出さない
→ 介入前から商品に興味がある集団は介入前から買う人が多い
解決方法→ 2つの集団をランダムに選ぶ(RCT)
ex. 商品に興味がある人、ない人に関係なく、ランダムに2つの集団を作る
ランダムに選んだ場合、
E[Y(0)|Z=1] = E[Y(0)|Z=0]
つまり、
セレクションバイアス = E[Y(0)|Z=1] - E[Y(0)|Z=0] = 0
セレクションバイアスが0であると仮定できる。
その後、t検定で有意差を確認
結論
介入効果を知りたい場合は、
1. ランダムに2集団に分けて介入あり、介入なしを行う
2. 有意差検定をする
これにより、分析の不確実性を小さくすることができる。