2021-02-01から1ヶ月間の記事一覧

傾向スコア①

SmaSurf クイック検索

Post Treatment Bias

CIA (Conditional Independence Assumption)

脱落変数バイアス

回帰式 Y: 目的変数 Z: 介入変数 X: 共変量 どれくらいXを加えれば良い? 判断基準 → × 統計的に有意なβ ○ 脱落変数バイアス(OVB)が大きいもの = 目的変数Y , 介入変数Z と関係性の大きいX これによってセレクションバイアスを小さくすることができる 脱…

ロジスティック回帰

ロジスティック回帰 パーセプトロンの収束が保証される条件 ・2クラスが線形分離可能であること 線形分離不可の場合 →エポックごとに誤分類されている訓練データがある → 重みが絶えず更新されてしまう 対応策 ロジスティック回帰 特徴 ・分類モデル ・多ク…

モデル作成のための基礎知識

分類アルゴリズムの選択 ノーフリーランチ定理 → データに関する予備知識・前提知識→ 良いアルゴリズムを作ることができる 全てのデータに最適な1つのアルゴリズムは存在しない → 複数のアルゴリズムで試す中で、最善のものを選ぶ scikit-learnの関数、クラ…

バッチ勾配降下法・確率的勾配降下法

バッチ勾配降下法 → 訓練データ全体から学習を計算する = 学習ごとに、訓練データ全体を評価するー計算コストが高い 対応 確率的勾配降下法: 訓練データごとに段階的に重みをつける 特徴 ・高速に収束する(重みの更新頻度が高いため) ・浅い局所的最小値…

パーセプトロン ・ ADALINE

機械学習アルゴリズム ・パーセプトロン ・ADLINE 人口ニューロン McCulloch-Pittsニューロン(MCPニューロン) → 2値出力を行う単純な理論ゲートとしての神経細胞 理論ゲート:論理演算の結果0 or 1を返す電気回路 Frank Roseblattさん:MCPニューロンモデ…

ビジネスでのRCTと因果推論の注意点

ビジネスでランダム化比較試験はコストがかかる → 因果推論 計量経済学 で解決する しかし、セレクションバイアスの理解が必要! セレクションバイアスはどういう時に発生するのか? セレクションバイアスは 人orシステムが意思決定する時に起こりやすい → …

マッチング法

実験的手法 vs 観察データ ・実験的手法(RCTなど) メリット 因果関係を明らかにしやすい デメリット サンプルサイズが十分に必要 コストが高い ・観察データから因果関係を見つける方法 → ある介入を行ったAさんと介入を行っていないBさん(反実仮想)で比…

パネルデータ分析

外的条件Cを制御する様々な方法 複数時点で観測されたデータ クロスセクションデータ:同時点で複数の対象から取得されたデータ 繰り返しクロスセクションデータ:いくつかの時点で収集されたデータ パネルデータ:いくつかの時点で同じ対象から収集されたデ…

回帰分析の内生性について

Y = β0 + β1X + U 内生性:政策変数Xと誤差項Uが相関を持つこと → この場合、βは一致推定量にならない XとUの関係性 βが不偏推定量の条件4つの内の1つ: XとUが平均独立 βが一致推定量の条件:XとUが無相関 = {Cov(X, U)=0} 内生性があっても一致推定できる…

回帰分析:βの分散が不均一の時

最良な線形不偏推定量である条件 →ガウスマルコフ仮定 不偏推定量であるルール4つ + 最もβの分散が小さいルール1つ Uの分散が均一かどうか調べる → F検定 ・ブルーシュ=ペーガン検定 ・ホワイト検定 帰無仮説: 分散は均一である (= Uの分散はXに依存し…