論文の概要: Causal Effect Estimation with TMLE: Handling Missing Data and Near-Violations of Positivity
- arxiv url: http://arxiv.org/abs/2510.22202v1
- Date: Sat, 25 Oct 2025 08:01:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.910144
- Title: Causal Effect Estimation with TMLE: Handling Missing Data and Near-Violations of Positivity
- Title(参考訳): TMLEによる因果効果の推定:欠測データと電位の近紫外化処理
- Authors: Christoph Wiederkehr, Christian Heumann, Michael Schomaker,
- Abstract要約: 欠損データシナリオにおける平均処理効果を推定する目的最大推定(TMLE)の性能を評価する。
我々はモデルと設計に基づくシミュレーションを採用し、後者は'WASHベネフィットバングラデシュ'データセット上で、アンダースムースな高度適応型ラッソを用いています。
解析手法としてTMLEと組み合わせて8つの欠落データ手法を比較し,非多重命令法(non-MI)と多重命令法(multiple imputation,MI)を区別する。
- 参考スコア(独自算出の注目度): 1.1546538067103258
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We evaluate the performance of targeted maximum likelihood estimation (TMLE) for estimating the average treatment effect in missing data scenarios under varying levels of positivity violations. We employ model- and design-based simulations, with the latter using undersmoothed highly adaptive lasso on the 'WASH Benefits Bangladesh' dataset to mimic real-world complexities. Five missingness-directed acyclic graphs are considered, capturing common missing data mechanisms in epidemiological research, particularly in one-point exposure studies. These mechanisms include also not-at-random missingness in the exposure, outcome, and confounders. We compare eight missing data methods in conjunction with TMLE as the analysis method, distinguishing between non-multiple imputation (non-MI) and multiple imputation (MI) approaches. The MI approaches use both parametric and machine-learning models. Results show that non-MI methods, particularly complete cases with TMLE incorporating an outcome-missingness model, exhibit lower bias compared to all other evaluated missing data methods and greater robustness against positivity violations across. In Comparison MI with classification and regression trees (CART) achieve lower root mean squared error, while often maintaining nominal coverage rates. Our findings highlight the trade-offs between bias and coverage, and we recommend using complete cases with TMLE incorporating an outcome-missingness model for bias reduction and MI CART when accurate confidence intervals are the priority.
- Abstract(参考訳): 本研究では, 平均処理効果を推定するための目標最大推定値(TMLE)の性能評価を行った。
我々はモデルと設計に基づくシミュレーションを採用し、後者は現実世界の複雑さを模倣するために 'WASH Benefits Bangladesh' データセットに過度に適応的なラッソを用いている。
5つの非環状グラフが欠落しており、特に1点露光実験において、疫学研究において共通の欠落データ機構を捉えている。
これらのメカニズムには、露出、結果、共同設立者における異常な欠如も含まれる。
解析手法としてTMLEと組み合わせて8つの欠落データ手法を比較し,非多重命令法(non-MI)と多重命令法(multiple imputation,MI)を区別する。
MIアプローチはパラメトリックモデルと機械学習モデルの両方を使用する。
結果,非MI法,特にTMLEの完全症例は,他のすべての評価された欠落データ手法と比較してバイアスが低く,また,実証的違反に対するロバスト性も高いことがわかった。
分類と回帰木(CART)との比較MIでは、ルート平均二乗誤差は低く、しばしば名目カバレッジ率を維持している。
本研究は, 偏差とカバレッジのトレードオフを浮き彫りにしたものであり, 精度の高い信頼区間が優先される場合には, 偏差低減のための結果許容性モデルとMI CARTを併用して, TMLEによる完全症例の活用を推奨する。
関連論文リスト
- A Gradient Analysis Framework for Rewarding Good and Penalizing Bad Examples in Language Models [63.949883238901414]
本稿では,損失関数の勾配解析の特異な角度について述べる。
ExMATEはMLEの優れたサロゲートであり,DPOとMLEの代わりにExMATEを組み合わせることで,統計的(5-7%)と生成的(+18%)の性能が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-29T17:46:18Z) - Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models [5.336076422485076]
非均一な観測値分布が、最先端のモデルに深刻なバイアスをもたらすことを示す。
我々は、すべての研究領域とモデルでそれを定量化できる新しい指標として、Eccentricity-Area Under the Curve (EAUC)を紹介した。
論文 参考訳(メタデータ) (2024-01-19T13:41:08Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - RIFLE: Imputation and Robust Inference from Low Order Marginals [10.082738539201804]
我々は,不備なデータの存在下での回帰と分類のための統計的推論フレームワークを開発する。
我々のフレームワークであるRIFLEは、基礎となるデータ分布の低次モーメントを対応する信頼区間で推定し、分布的に堅牢なモデルを学ぶ。
実験の結果,RIFLEは,欠落値の割合が高い場合や,データポイント数が比較的小さい場合には,他のベンチマークアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-09-01T23:17:30Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - Model-based clustering of partial records [11.193504036335503]
観測値の限界密度を用いたモデルベースの手法でクラスタリング手法を開発しています。
提案アルゴリズムは,不完全データセットの欠落値を考慮した,対応する全期待最大化(EM)手法と比較する。
シミュレーション研究により,本手法は実クラスタ分割の回復に有利であることが示された。
論文 参考訳(メタデータ) (2021-03-30T13:30:59Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。