選択バイアス

Common effectを条件付ける時に起こるバイアス(close→openに変化:関連してしまう)

 

Q. センサリングとは?

A. 何らかの理由で測定できなくなったデータ

C=1: 打ち切り

C=0: 打ち切られていない

 

Q. センサリングによるselection biasとは?

A. C=1のcausal risk ratioとC=0のcausal risk ratioが違う

 

IPW

C=0(打ち切りでない)のデータを使ってC=1(打ち切り)のデータを考える

C=0のYの確率を使用する

C=0の人数が0なら無理(positivity)

f:id:R_posit:20211213175838p:plain

 

Q. IPWが達成されるCの条件は

A.

Consistency

Positivity(C=1が0人なら無理)

Exchangeability

を満たす

Consistencyについて

・Cは死亡など、あらゆる変数に影響を受けそうなものは利用できない

・連絡が取れなくなったとか、たまたまそうなったものは他の変数に影響を与えないから使用可能

 

Stratification

Q. Stratificationが満たされない条件は?

A.

(前出)

Lで条件づけた場合に

1.Consistency

2.Positivity

3.Exchangeability

が満たされない時

(今回)

Lで条件付けた時に、open backdoor pathになる時(Exchangeabilityが満たされないのと同義?)

 

Q. IPWとstratificationどっちがいい?

A. stratificationは条件付けた時にopen backdoor pathになるため注意

f:id:R_posit:20211213221312p:plain

 

条件付き独立が成り立つ場合、成り立たない場合

f:id:R_posit:20211213221529p:plain

f:id:R_posit:20211213221936p:plain




 

因果推論What If Chapter 7メモ

7 Confounding

交絡とはtreatmentとoutcomeが共通の原因を持つことによって生じるバイアス

→exchangeabilityがなくなる

 

基本

Consistency

Positivity

Exchangeability← これに注目

 

Exchangeability がないパターン2つ

  1. Common causeがある→ open backdoor pathがある:confounding
  2. Common effectがある→ 条件付けた場合、close→openになる:selection bias

目標:Exchangeabilityを満たすためのLを見つける

  • Backdoor基準
  • SWIG

→このどちらかの基準を満たすとexchangeabilityがある

 

Backdoor基準

→back door pathが閉じればOK→ exchangeabilityあり

・交絡がない=そもそもback door pathが開いていない

・全てのLが測定されている+LがA非子孫であるとき(条件付ければOK):Lで条件付けするとopen→ closeになる

 

backdoor pathとは?:AとYの共通の原因

open backdoor path:Lで条件付けられていない時のAとYの共通の原因

U: unmeasured cause(未観測な変数)

f:id:R_posit:20211211220643p:plain

 

Backdoor基準の注意点:交絡の向き、強さはわからない

他にもcausal DAGでは表現できないことがあるらしい

 

いろんなパターン

f:id:R_posit:20211211174511p:plain

f:id:R_posit:20211211174600p:plain

 

 

SWIG(よくわからん)

SWIGは、すべての個人が治療レベルaを受けた仮想世界で観察されるであろう変数と因果関係を描いたものである

Lで条件づけるとAとYはd-separateされている

 

交絡因子を調整する方法

  1. G-method

Backdoor pathを消す

Standardization, IP weighting, g-estimation

  1. Stratification-based method

Lで条件付けする

Stratification, restriction, outcome regression matching

 

 

Time-varying treatmentがあるとき

→G-method: 交絡の調整に用いてOK

✖︎Stratification-based method: 条件付けによってselection biasが生じる恐れがある

Conditional exchangeability以外を仮定する手法はダメ

 

Q. Conditional exchangeability以外を仮定するとは?

A. conditional exchangeabilityを基準に考えない手法

・Difference-in-Difference

・instrumental variable estimation

・the front door criterion

→全てexchangeabilityのような検証不可能な仮定を必要とする

からしい仮定を考えてから、どれを使うか考える

 

よくわからん

LがAのdescendantである場合、SWIGではLで条件付けてAとYが独立のように見えても、実際は独立ではない。

因果推論What If Chapter 6メモ

GRAPHICAL REPRESENTATION OF CAUSAL EFFECTS

ルール

  • 共通原因は計測されてなくても書く
  • 反事実も表すことができる
  • Effect modifierは含まなくてもいい(因果ではないから?明確にするなら、細かく書く)
  • Effect modifierのタイプを区別して表現するのは難しい(タイプ : Aとの相乗効果、打ち消し、など)

 

種類

・conditionally randomized experiment

(条件付けの時は、変数を四角で囲む)

・marginally randomized experiment

 

Compound treatment(R):2値変数のtreatment

A:連続変数

連続変数をある値より小さい、大きいという条件で2群に分ける時、詳細の因果効果を表現するために、連続変数も含むべき

 

系統バイアス

Structural classification vias

→ sampleサイズに関係なく起こるエラーでtreatmentとoutcomeの因果関係と関係ないもの

(データが無限になると、母集団との誤差は0に近づく)

 

Unconditional vias

→ exchangeability がないとき

(vias under the null:causal effectがなくても関連があるとき、その差がvias under the null)

 

Conditional vias

→ exchangeability がないとき

 

Confounding:交絡

→ DAGでみると、common causeによるバイアス

 

Selection bias:選択バイアス

→ DAGでみると、conditional common effects(条件付けた時、AとYは関連する)

 

Effect modifierについて

Surrogate effect modifier はcausal effect modifierと関連があるものを指す

因果推論What If Chapter 5メモ

INTERACTION

Eを用いて複数の介入(A, E)の因果効果を見ることができる

(Vにexchangeabilityがあるイメージ)

 

Effect modification をVを用いて行う場合、

Vにexchangeabilityなし

→ Aの因果効果を見る(Vはeffect modifier(因果効果ではない)である)

outcomeは\Pr\left(Y^{a}| V\right)

Vにexchangeabilityあり(V = E)

→ Aの因果効果 + Vの因果効果 を見ることができる

outcomeは\Pr \left[ Y^{a}| V\right]

 

 

ポイント

  • AとEについてexchangeability, positivity, and consistencyが必要
  • Aを分ける→ Eを分けると考えるより、介入AEと考える(A,E) = (0,0), (0,1), (1,0),(1,1)

 

Vの解釈

Vにexchangeabilityがない場合

→ V自体に因果効果はない。Vに関連している別の要素(変数)がYに対するAとのinteractionがある

 

組み合わせとinteractionの確認

  AもEもYに対する因果効果がないパターン  
  (A, E)=(1,1) (A, E)=(0,1) (A, E)=(1,0) (A, E)=(0,0)  
1 Y=1 Y=1 Y=1 Y=1  
2 Y=0 Y=0 Y=0 Y=0  
           
  Aに依存するパターン      
  (A, E)=(1,1) (A, E)=(0,1) (A, E)=(1,0) (A, E)=(0,0)  
3 Y=1 Y=0 Y=1 Y=0  
4 Y=0 Y=1 Y=0 Y=1  
           
  Eに依存するパターン      
  (A, E)=(1,1) (A, E)=(0,1) (A, E)=(1,0) (A, E)=(0,0)  
5 Y=1 Y=1 Y=0 Y=0  
6 Y=0 Y=0 Y=1 Y=1  
           
  AとEにinteractionがあるパターン    
  (A, E)=(1,1) (A, E)=(0,1) (A, E)=(1,0) (A, E)=(0,0)  
7 Y=1 Y=1 Y=1 Y=0 3つY = 1
8 Y=1 Y=0 Y=0 Y=0 1つY = 1
9 Y=1 Y=0 Y=0 Y=1 AとEが同じなら
Y=1みたいな
10 Y=0 Y=1 Y=1 Y=0

 

  AとEにinteractionがない状況  
  逆のことが観察される場合:解釈に困る  
  (A, E)=(1,1) (A, E)=(0,1) (A, E)=(1,0) (A, E)=(0,0)
Y=1 Y=0 Y=0 Y=1
Y=0 Y=1 Y=1 Y=0
Y=1 Y=0 Y=0 Y=0
Y=0 Y=1 Y=0 Y=0

 

Sufficient cause

Sufficient cause(U)はAまたはEの因果のメカニズムまたはAとEのinteractionの要素を説明する変数

①U_{1}:A=1においてU_{1}の有無で結果が変わる

②U_{2}:A=0においてU_{2}の有無で結果が変わる

③U_{0}:Aとは関係なく結果が変わる

f:id:R_posit:20211209200537p:plain

causal pies

 

①〜③がA, Eの組み合わせの数だけ考えられる。

f:id:R_posit:20211209201452p:plain

 

f:id:R_posit:20211209201819p:plain

a, b) synergistic:UがA, Eの相乗効果を表す

c, d)antagonistic:UがAとEの効果の打ち消し合いを表現

 

Counteractualとsufficient-componentの違い

f:id:R_posit:20211209202549p:plain

counterfactual definition of interaction:interactionがどのように起こっているか

sufficient cause (causal mechanisms):interactionが起きている原因は(因果のメカニズムは?)

 

 

 

 

 

 

 

 

 

 

 

因果推論What If Chapter 4メモ

EFFECT MODIFICATION

V(ある因子)の状態によってYに対するAの平均因果効果が異なる

→ VはYにおけるAの効果に対するeffect modifierである

 

集団の1部がeffect modifierである時

stratified analysis(層別解析)をする

ex) 集団全体の効果ではなく、1部の集団の因果効果について知りたい時

・ある町の政策は他の町にも通用するか?

・男女で分けた時は?

 

stratified analysisの手順

1. stratification (Vによって層別化)

2. standardization / IPW(L毎に合わせる)

 

effect modifierの評価方法

  • qualitative: causal effectの正負が違う
  • quantitative: causal effectの正負は等しいが絶対値が違う

 

  • additive scale:causal risk differenceがVによって異なる

   multiplicativeよりも介入による恩恵が大きい指標?

  • multiplicative scale:causal risk ratio がVによって異なる

   multiplicativeだけではあまり意味はなさない?

 

評価の結果、必ずしも因果効果が明白になるとは言えない

Ex) 国籍で層分けした場合、国籍にどの要素が因果関係にあるかが重要

 (DNA、環境、宗教…)

stratified analysisの解釈の仕方

 

  1. Transportabilityを検証

他の同様の特徴を持った集団にも適応できるかどうか

(集団の分布が違う, or 未知の因子が存在するため、完全に知ることはできない)

→ 専門家の知見と掛け合わせて、効果があるかどうか議論するためのもの

  1. 介入効果がある対象を見つける
  2. 因果関係を考察することで、AとYの関係をより深く追求する

 

 

LとVの違いは?

L: exchangabilityを満たすため。

(Lは因果関係に興味がないが、exchangabilityを得るためにやること)

V: 層別の効果の違い(effect modifier)を見るため。(Vは層別の因果効果に興味がある。)

(VはLと同じ意味をなすことも多い)

 

 

restriction:

stratificationの中で特定の集団のみ層分けする手法

 

Matching

介入(A=1)と非介入(A = 0)で同じような特徴(L)を持つデータをマッチングする

one-to-one (1対1) / one-to-many (1対多)

利点:positivityが保証される(絶対データがある)

欠点:A = 1 or 0のどちらかの群のマッチングされなかったデータは除外

   → その群のaverage causal effectはわからない

   ex) one-to-oneのマッチングでtreated>untreatedの場合

                 因果効果はuntreated(余っていないほう)が計算可能

 

まとめ

分類

adjustment method

  • Lを使い、同じ分布にする
  • Matching

effect modification

  • stratified analysis

 

何を知りたいかで使い分ける

Standardization, IPW(Lを使う)→ marginal と conditional effectsの因果効果を測れる

Stratification/restrictionとmatching→ ある集団という条件付きの因果効果を測れる

不明点:(Stratificationは平均因果効果はわかるが、individual effectsはわからない?)

 

dwellers 住人
fluoridation フッ化物添加
households 世帯
heterogeneity 不均一性
susceptibilities 感受性
additive 加法
multiplicative 乗法
qualitative effect modification 定性的効果の修正
prevalence 有病率
 asbestos exposure   アスベスト曝露
extrapolation 外挿
transportability 可搬性
surrogate 代理
synonymous 同義語
noncollapsibility 折りたたみ不可
 prerequisite   前提条件
priori eligibility criteria 先験的適格基準
explicitly 明示的に
discrepant 不一致
individual effects 個々の効果
Effect modification  効果の変更

 

 

因果推論What If Chapter 3メモ

観察研究OBSERVATIONAL STUDIES

考え方:自分が知りたい因果関係を解釈できるランダム化比較試験(Target Trial

を観察研究で模倣する

 

条件付きランダム化実験を模倣

→ Identifiability conditionsを作る:(因果効果を)識別可能な状況

→ その後、IPWstandardizationを実行

→ ランダム化比較試験と同じように因果を解釈できる

Identifiability conditionsを満たす条件

  1. Consistency(一貫性)
  2. Exchangeabilit(交換可能性)
  3. Positivity(正値性)

1. Consistency(Aについて)

2種類

  • 介入が一定の条件で行われているか

Aとaの内容が明確に一致しているか(1人だけ薬投与してみたとかはなし)

(しっかり研究をデザインできているか(A = aかどうか))

  • 反事実上の結果の観察された結果への連結

A = 1になった個人が、本当にa=1になっているか(逆も同じ)

Ex) 観察研究で保健師からの健康指導がない群(A=0)に属しているが、自分で健康管理を完璧にやっている人→欲しいのはYa=0だが、実際はYa=1のようなデータ

(しっかり実行できているか)

 

2. Exchangeability(Lが少なすぎる場合)

f:id:R_posit:20211205122601p:plainを確実に保証するためのLを見つける必要がある

(Lに含めるべき因子の最適解は誰もわからない)

 

達成できない場合

instrumental variable法を用いる→第16章

ex)

観察研究においては、介入を受ける確率(手術を受ける確率)は、

患者の状態に依存しているため、outcome因子の分布が違う

(ex: 死亡率(Y)が高い群は手術を受ける(A = 1))

 

3. positivity(Lが多すぎる場合)

Lを条件とした治療のすべての値を受ける確率は、ゼロより大きい、すなわち正である。

→ Lを詳細に分けた場合、データがない、または少なくなりすぎてしまう可能性がある

 

Target Trial

  • そのプロトコルの主要な構成要素
  • 適格基準(サンプリング基準)
  • 介入(または治療戦略)
  • アウトカム
  • フォローアップ
  • 因果関係の対比
  • 統計解析

 

英語

exogeneity 外因性
denominator 分母
inconclusive 決定的ではない
criticisms 批判
astrophysics 天体物理学
   
Identifiability 識別可能性
consequence 結果
convincing 説得力のある
endow 与える
compromise 妥協
intrinsic 内在的
we are stuck with 私たちは立ち往生しています
approximation 近似
conditionally randomized experiment 条件付きランダム化実験
informally 非公式に
heroic ヒロイック
suspicion 疑い
assumptions 仮定
Importantly 重要なのは
suffice 十分です
privileged 特権
 disciplines   規律
marginally わずかに
predictors 予測子
scarce 希少
strata 階層
human leukocyte antigen ヒト白血球抗原
   
convincing 説得力のある
deceptive 欺瞞的
precise 正確
a stringent mandatory 厳格な必須
weighed 計量した
The implication is that 含意はそれです
feasible 実行可能
   
causal inference 因果推論
emulation 模倣
   
eligibility criteria 適格基準
eligibility 適格性
disposal 廃棄
tantamount 同等?
strata 階層
implements 実装

 

 

 

 

 

 

 

 

 

因果推論What If Chapter 2メモ

randamazationランダム化比較試験

種類

  1. marginally randomized experiments

  2. conditionally randomized experiments

 

  1. marginally randomized experiments の条件

  • A = 1 とA = 0 でP[Y]が等しい

→ ✖︎ 悪い例:死亡確率が高いかどうかでA = 1 or 0を決める

f:id:R_posit:20211204211516p:plain

 = Pr[Ya = 1]

A = 1: 介入を受ける群

a = 1: 介入を受ける個人

 

  • Aに属する確率とYは独立

f:id:R_posit:20211204212021p:plain

独立

exchangebilityがある(介入群の人数と非介入群の人数を入れ替えて実験してもOK)

→ ✖︎ 悪い例:心臓の状態が悪い人を優先して手術(A =1)する

特徴:exchangebility(介入群の人数と非介入群の人数を入れ替えて実験してもOK)

 

      2. conditionally randomized experiments

f:id:R_posit:20211204213207p:plain

イメージ

FRCISTG (fully randomized causally interpreted structured tree graph)

  • 条件を分けてmarginally randomized experimentsを行う(各条件でP[A]は異なる)
  • 条件(L)のexchangebilityはなし(各条件のAについてはexchangebilityあり)
  • 全体で見るとAに属する確率とYは独立ではないが、条件Lの中では独立

   ex)全体で心臓の状態が悪いと悪くない人では手術を行う確率が違う。

    心臓の状態が悪い群の中では、手術を行う確率が同じ

f:id:R_posit:20211205122601p:plain

Lの条件の中ではYaとAは独立

conditionally randomized experimentsのcausal effectの見方

  1. 各条件でcausal effectを見る
  2. 全体のcausal effectを計算する
  • 各条件でcausal effectを見る

f:id:R_posit:20211204214554p:plain

L = 1の条件におけるcausal effect
  • 全体のcausal effectを計算する

手法2つ

  1. Standardization
  2. Inverse probility weighting

(数学的にはどちらも同じらしい)

f:id:R_posit:20211205125247p:plain

A = 1の場合(A = 0も同様に計算)
解釈:条件付き確率を元に戻す

f:id:R_posit:20211205124228p:plain

  • IPW(Inverse probility weighting)

もし、全てA = 1(or A = 0)だったら、を考える

f:id:R_posit:20211205131735p:plain

左:A = 1/ 右:A = 0




f:id:R_posit:20211205131959p:plain

IPWの重み付け(L条件の中でAに属す確率の逆数)
→ 全員がAに属した場合が考えられる(P[A = 0] = 1 や P[A = 1] = 1)
(解釈:増加分がcounterfactual outcomeにあたる?
→ 全てのcounterfactual outcomeが考慮できて、比較可能になる?)
全体で見るとサンプル数は2倍→ Pseudo-population