2021-01-01から1年間の記事一覧
選択バイアス Common effectを条件付ける時に起こるバイアス(close→openに変化:関連してしまう) Q. センサリングとは? A. 何らかの理由で測定できなくなったデータ C=1: 打ち切り C=0: 打ち切られていない Q. センサリングによるselection biasとは? A.…
7 Confounding 交絡とはtreatmentとoutcomeが共通の原因を持つことによって生じるバイアス →exchangeabilityがなくなる 基本 Consistency Positivity Exchangeability← これに注目 Exchangeability がないパターン2つ Common causeがある→ open backdoor pat…
GRAPHICAL REPRESENTATION OF CAUSAL EFFECTS ルール 共通原因は計測されてなくても書く 反事実も表すことができる Effect modifierは含まなくてもいい(因果ではないから?明確にするなら、細かく書く) Effect modifierのタイプを区別して表現するのは難し…
INTERACTION Eを用いて複数の介入(A, E)の因果効果を見ることができる (Vにexchangeabilityがあるイメージ) Effect modification をVを用いて行う場合、 Vにexchangeabilityなし → Aの因果効果を見る(Vはeffect modifier(因果効果ではない)である) ou…
EFFECT MODIFICATION V(ある因子)の状態によってYに対するAの平均因果効果が異なる → VはYにおけるAの効果に対するeffect modifierである 集団の1部がeffect modifierである時 →stratified analysis(層別解析)をする ex) 集団全体の効果ではなく、1部の…
観察研究OBSERVATIONAL STUDIES 考え方:自分が知りたい因果関係を解釈できるランダム化比較試験(Target Trial) を観察研究で模倣する 条件付きランダム化実験を模倣 → Identifiability conditionsを作る:(因果効果を)識別可能な状況 → その後、IPW や …
randamazationランダム化比較試験 種類 marginally randomized experiments conditionally randomized experiments marginally randomized experiments の条件 A = 1 とA = 0 でP[Y]が等しい → ✖︎ 悪い例:死亡確率が高いかどうかでA = 1 or 0を決める = Pr[…
因果効果の評価 (i)差/ (ii)比率/ (iii)オッズ比 NNT(number need to treat) Y = 1を1減らすために必要な(a = 1)の数ex) 死亡数を1減らすために必要な臓器移植の件数 解釈: 分母:因果効果の指標(差): → 臓器移植によって死亡例が減る→(-)の値が大きく…
医療費抑制のための医療サービスの分類 Cost-saving:医療費抑制効果あり + 健康増進 Cost-effective:医療費増加 + 健康増進(医療費増加に見合う改善) Cost-ineffective: 1. 医療費増加 + 健康状態悪化 2. 医療費増加 + 健康増進(医療費増加に見合…
2つの手法を費用と効果によって求める方法 費用効果分析(Cost Effectiveness Analysis; CEA) ・疾患や治療法に応じて臨床的な指標を用いる (例: 生存年, 血圧などの検査値,QALYなど) ・CEA = 費用/ 効果 QALY: 生存年数をQOLで重み付けしたもの。QOLは0~…
Digital technology and COVID-19 ※ 1年以上前の論文です。 コロナを収束させるためにデジタル技術を活用しようという内容の論文です。 この論文はデータを収集して結果を出すものではなく、著者の意見を述べているもの(comment)です。 デジタル活用の詳細…
github.com
SmaSurf クイック検索
回帰式 Y: 目的変数 Z: 介入変数 X: 共変量 どれくらいXを加えれば良い? 判断基準 → × 統計的に有意なβ ○ 脱落変数バイアス(OVB)が大きいもの = 目的変数Y , 介入変数Z と関係性の大きいX これによってセレクションバイアスを小さくすることができる 脱…
ロジスティック回帰 パーセプトロンの収束が保証される条件 ・2クラスが線形分離可能であること 線形分離不可の場合 →エポックごとに誤分類されている訓練データがある → 重みが絶えず更新されてしまう 対応策 ロジスティック回帰 特徴 ・分類モデル ・多ク…
分類アルゴリズムの選択 ノーフリーランチ定理 → データに関する予備知識・前提知識→ 良いアルゴリズムを作ることができる 全てのデータに最適な1つのアルゴリズムは存在しない → 複数のアルゴリズムで試す中で、最善のものを選ぶ scikit-learnの関数、クラ…
バッチ勾配降下法 → 訓練データ全体から学習を計算する = 学習ごとに、訓練データ全体を評価するー計算コストが高い 対応 確率的勾配降下法: 訓練データごとに段階的に重みをつける 特徴 ・高速に収束する(重みの更新頻度が高いため) ・浅い局所的最小値…
機械学習アルゴリズム ・パーセプトロン ・ADLINE 人口ニューロン McCulloch-Pittsニューロン(MCPニューロン) → 2値出力を行う単純な理論ゲートとしての神経細胞 理論ゲート:論理演算の結果0 or 1を返す電気回路 Frank Roseblattさん:MCPニューロンモデ…
ビジネスでランダム化比較試験はコストがかかる → 因果推論 計量経済学 で解決する しかし、セレクションバイアスの理解が必要! セレクションバイアスはどういう時に発生するのか? セレクションバイアスは 人orシステムが意思決定する時に起こりやすい → …
実験的手法 vs 観察データ ・実験的手法(RCTなど) メリット 因果関係を明らかにしやすい デメリット サンプルサイズが十分に必要 コストが高い ・観察データから因果関係を見つける方法 → ある介入を行ったAさんと介入を行っていないBさん(反実仮想)で比…
外的条件Cを制御する様々な方法 複数時点で観測されたデータ クロスセクションデータ:同時点で複数の対象から取得されたデータ 繰り返しクロスセクションデータ:いくつかの時点で収集されたデータ パネルデータ:いくつかの時点で同じ対象から収集されたデ…
Y = β0 + β1X + U 内生性:政策変数Xと誤差項Uが相関を持つこと → この場合、βは一致推定量にならない XとUの関係性 βが不偏推定量の条件4つの内の1つ: XとUが平均独立 βが一致推定量の条件:XとUが無相関 = {Cov(X, U)=0} 内生性があっても一致推定できる…
最良な線形不偏推定量である条件 →ガウスマルコフ仮定 不偏推定量であるルール4つ + 最もβの分散が小さいルール1つ Uの分散が均一かどうか調べる → F検定 ・ブルーシュ=ペーガン検定 ・ホワイト検定 帰無仮説: 分散は均一である (= Uの分散はXに依存し…
重回帰分析 変数(X)とパラメータ(β)の解釈 回帰分析: 政策変数(X)を用いて成果変数(Y)を推定するためのパラメータ(β)を求める 政策変数 (X)の種類 ・連続変数 限界効果:Xを+1することの効果 X → X + 1 で β分の成果が得られる。 ↑これでは説明できない場合…
介入に効果があったか?を知る方法 Z=1 :介入あり Z=0:介入なし Y(1) (Z=1):介入をした時の結果 Y(0)(Z=0):介入をしていない時の結果 → 式を1本にまとめる Y = Y(0)(1-Z) + Y(1)Z (ex. Zが0の時、Y(1)Zが消える) 同一の集団に (介入あり/介入なし) を試…