パネルデータ分析

外的条件Cを制御する様々な方法

  1. 複数時点で観測されたデータ

クロスセクションデータ:同時点で複数の対象から取得されたデータ

繰り返しクロスセクションデータ:いくつかの時点で収集されたデータ

パネルデータ:いくつかの時点で同じ対象から収集されたデータ

(クロスセクションデータを同じ対象で繰り返して取得したもの)

ex) ある施策をする前のデータとした後のデータ(時点が違う)

時点A:Ya, X1a, X2a, X3a

時点B:Yb, X1b, X2b, X3b

 

AとBでYの違いを知りたい場合、

Yを説明する回帰式で

Aのデータであれば0

Bのデータであれば1のダミー変数を追加

→ 傾きパラメータβを推定する

ダミー変数のβがAとBの差

例題)

1995年の雇用補助金の導入が平均所得を引きあげたかどうかを知りたい

データ

・1995年の平均所得

・2000年の平均所得

→1995年をダミー変数0 / 2000年をダミー変数1 でとする

ダミー変数の傾きパラメータβは政策の効果を示す?

βには政策の効果 + 他の要因(景気など)が含まれる

対処法

政策が導入されている地域 vs 導入されていない地域 で比べる

(同時点で比較することで景気の影響をなくしている)

2. 差の差の推定法

差の差の推定法→ クロスセクションデータ・パネルデータで可能

 

f:id:R_posit:20210202222959p:plain

 

政策の効果は?

600-550 = 50

700-600 = 100

それぞれ、政策によって得点が低下しているようにも見える

→ 他の要因の可能性がある(例;景気)

この場合、政策の効果は

100 - 50 = 50

結論:政策によって得点が50点引き上がった

回帰式で表すと

Y = β0 + β1T + β2 AFTER + β3(T * AFTER) + β4 C + U

T: 二群の条件のダミー変数

AFTER:前後のダミー変数

β3: 知りたい政策効果

C: 外的条件(制御する)

 

自己選択のバイアス

ある政策の効果を知りたい時、

政策を試行する対象者が自分で政策を受けることを志願した場合

→ 政策を受けた人がやる気のある人→ 元々効果の得やすい人であった可能性がある

対処法

外的条件Cをできるだけ制御する

しかし、やる気のように制御できないものもある

その他

  • RCT
  • 自然実験
  • マッチング法
  • 回帰連続デザイン

などの準実験的な方法

 

3. 2期間パネルデータ

差の差の推定法→ クロスセクションデータ・パネルデータで可能

パネルデータはもっと有効に使うことができる

時間を通して変化しない個別効果であれば観測できない要因でも制御できる

→ 政策効果の評価が可能

方法(注意:時間の経過によって変化しないXを入れない(消えてしまうため:性別など))

○ 1階差分法

○ 平均差分法

 

○1階差分法

Y = β0 + β1X1 + β2X2 ・・・ + A + U

A(個別効果): 個人の生まれつきの能力など

→ 時間がたっても変わらない

→ 全体で測定することができない

U: 誤差

 

これを考慮して

Y = β0 + β1X1 + β2X2 ・・・ + V

V: A + U

 

この場合、Aと説明変数Xは相関関係にある可能性がある

→ 内生性の問題(XとVの相関)

→ 一致推定量でなくなる?

パネルデータの場合、大丈夫!

時間方向の差分をとる→ 1階差分法

 

f:id:R_posit:20210202223404p:plain

回帰モデル

DY = β1DX1 + β2DX2 + ・・・+ DU

定数項β0は消えている

時点Aと時点Bで定数項が異なるモデル(=時間固定効果を考慮した回帰モデル)

を推定したい場合

定数項をダミー変数を使って回帰式を作る→ その後、1階差分法

DY = σ + β1DX1 + β2DX2 + ・・・+ DU

σ: 定数項

自己選択バイアスがある場合

・外的条件Cをできるだけ制御する

・しかし、やる気のように制御できないものもある

→ 2期間パネルデータの差分をとる

=時間を通して変化しない個別効果Aを制御しながら政策効果の評価を行うことが可能

Y = β0 + β1T + β2 AFTER + β3(T * AFTER) + β4 C + U

Before:

Y = β0 + β1T + β2 + β3   +     β4 C + A + U

After:

Y = β0 + β1T + β2 + β3・T + β4 C + A + U

1階差分法(After - Before)

DY = β2 + β3・T + β4 DC + DU

β3: 差の差の推定値(知りたい政策効果/ 元々は→β3(T * AFTER)

A: 自己選択バイアス (消える)

 

平均差分法

各個人のY, Xについて時間平均を作る→ 重回帰モデルから引く

2時点の場合

(Y1 + Y2) /2

(X1 + X2) /2

(A1 + A2) /2 = A

これを引くことでAが消去できる