論文の概要: Machine learning for causal inference: on the use of cross-fit
estimators
- arxiv url: http://arxiv.org/abs/2004.10337v4
- Date: Fri, 28 Aug 2020 19:30:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 07:23:04.805728
- Title: Machine learning for causal inference: on the use of cross-fit
estimators
- Title(参考訳): 因果推論のための機械学習--クロスフィット推定器を用いて
- Authors: Paul N Zivich, Alexander Breskin
- Abstract要約: より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern causal inference methods allow machine learning to be used to weaken
parametric modeling assumptions. However, the use of machine learning may
result in complications for inference. Doubly-robust cross-fit estimators have
been proposed to yield better statistical properties.
We conducted a simulation study to assess the performance of several
different estimators for the average causal effect (ACE). The data generating
mechanisms for the simulated treatment and outcome included log-transforms,
polynomial terms, and discontinuities. We compared singly-robust estimators
(g-computation, inverse probability weighting) and doubly-robust estimators
(augmented inverse probability weighting, targeted maximum likelihood
estimation). Nuisance functions were estimated with parametric models and
ensemble machine learning, separately. We further assessed doubly-robust
cross-fit estimators.
With correctly specified parametric models, all of the estimators were
unbiased and confidence intervals achieved nominal coverage. When used with
machine learning, the doubly-robust cross-fit estimators substantially
outperformed all of the other estimators in terms of bias, variance, and
confidence interval coverage.
Due to the difficulty of properly specifying parametric models in high
dimensional data, doubly-robust estimators with ensemble learning and
cross-fitting may be the preferred approach for estimation of the ACE in most
epidemiologic studies. However, these approaches may require larger sample
sizes to avoid finite-sample issues.
- Abstract(参考訳): 現代の因果推論法では、機械学習を用いてパラメトリックモデリングの仮定を弱めることができる。
しかし、機械学習の使用は推論の複雑さをもたらす可能性がある。
二重ロバスト型クロスフィット推定器は、より優れた統計特性をもたらすために提案されている。
平均因果効果(ACE)に対する複数の異なる推定器の性能を評価するためのシミュレーション研究を行った。
シミュレーション処理と結果のためのデータ生成機構は, 対数変換, 多項式項, 不連続性であった。
本研究は, 単独の確率推定器(g計算, 逆確率重み付け)と2倍の確率重み付け(増分逆確率重み付け, 目標最大推定)を比較した。
ニュアンス関数はパラメトリックモデルとアンサンブル機械学習を別々に推定した。
さらに,二重ロバストクロスフィット推定器についても検討した。
正確に特定されたパラメトリックモデルでは、全ての推定値は偏りがなく、信頼区間は名目上の範囲に達した。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
高次元データでパラメトリックモデルを適切に指定することが困難であるため、アンサンブル学習とクロスフィッティングを伴う二重ロバスト推定器は、ほとんどの疫学研究においてaceの推定に好適なアプローチである。
しかし、これらのアプローチは有限サンプル問題を避けるためにより大きなサンプルサイズを必要とするかもしれない。
関連論文リスト
- Ranking and Combining Latent Structured Predictive Scores without Labeled Data [2.5064967708371553]
本稿では,新しい教師なしアンサンブル学習モデル(SUEL)を提案する。
連続的な予測スコアを持つ予測器のセット間の依存関係を利用して、ラベル付きデータなしで予測器をランク付けし、それらをアンサンブルされたスコアに重み付けする。
提案手法の有効性は、シミュレーション研究とリスク遺伝子発見の現実的応用の両方を通じて厳密に評価されている。
論文 参考訳(メタデータ) (2024-08-14T20:14:42Z) - Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - Benign-Overfitting in Conditional Average Treatment Effect Prediction
with Linear Regression [14.493176427999028]
線形回帰モデルを用いて条件平均処理効果(CATE)の予測における良性過剰適合理論について検討した。
一方,IPW-learnerは確率スコアが分かっていればリスクをゼロに収束させるが,T-learnerはランダムな割り当て以外の一貫性を達成できないことを示す。
論文 参考訳(メタデータ) (2022-02-10T18:51:52Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Doubly Robust Semiparametric Difference-in-Differences Estimators with
High-Dimensional Data [15.27393561231633]
不均一な治療効果を推定するための2段半パラメトリック差分差分推定器を提案する。
第1段階では、確率スコアを推定するために、一般的な機械学習手法が使用できる。
第2段階ではパラメトリックパラメータと未知関数の両方の収束率を導出する。
論文 参考訳(メタデータ) (2020-09-07T15:14:29Z) - A Semiparametric Approach to Interpretable Machine Learning [9.87381939016363]
機械学習におけるブラックボックスモデルは、複雑な問題と高次元設定において優れた予測性能を示した。
透明性と解釈可能性の欠如は、重要な意思決定プロセスにおけるそのようなモデルの適用性を制限します。
半パラメトリック統計学のアイデアを用いて予測モデルにおける解釈可能性と性能のトレードオフを行う新しい手法を提案する。
論文 参考訳(メタデータ) (2020-06-08T16:38:15Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Nonparametric inverse probability weighted estimators based on the
highly adaptive lasso [0.966840768820136]
非パラメトリック逆確率重み付き推定器は非効率であり、次元性の呪いに苦しむことが知られている。
高度適応型ラッソのアンダースムーシングにより重み付け機構を推定する非パラメトリック逆確率重み付き推定器のクラスを提案する。
我々の開発は、大規模統計モデルと様々な問題設定における効率的な逆確率重み付き推定器の構築に幅広い意味を持つ。
論文 参考訳(メタデータ) (2020-05-22T17:49:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。