論文の概要: Causal Machine Learning Methods for Estimating Personalised Treatment Effects -- Insights on validity from two large trials
- arxiv url: http://arxiv.org/abs/2501.04061v1
- Date: Tue, 07 Jan 2025 09:44:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-09 14:55:33.971813
- Title: Causal Machine Learning Methods for Estimating Personalised Treatment Effects -- Insights on validity from two large trials
- Title(参考訳): パーソナライズド・トリート・エフェクト推定のための因果機械学習手法 -- 2つの大規模トライアルによる妥当性の検討-
- Authors: Hongruyu Chen, Helena Aebersold, Milo Alan Puhan, Miquel Serra-Burriel,
- Abstract要約: 因果機械学習(ML)手法は、精密医療の進歩に大いに貢献する。
本研究では,17種類の主流因果ML法の内部および外的妥当性について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Causal machine learning (ML) methods hold great promise for advancing precision medicine by estimating personalized treatment effects. However, their reliability remains largely unvalidated in empirical settings. In this study, we assessed the internal and external validity of 17 mainstream causal heterogeneity ML methods -- including metalearners, tree-based methods, and deep learning methods -- using data from two large randomized controlled trials: the International Stroke Trial (N=19,435) and the Chinese Acute Stroke Trial (N=21,106). Our findings reveal that none of the ML methods reliably validated their performance, neither internal nor external, showing significant discrepancies between training and test data on the proposed evaluation metrics. The individualized treatment effects estimated from training data failed to generalize to the test data, even in the absence of distribution shifts. These results raise concerns about the current applicability of causal ML models in precision medicine, and highlight the need for more robust validation techniques to ensure generalizability.
- Abstract(参考訳): 因果機械学習(ML)の手法は、パーソナライズされた治療効果を推定することにより、精度の高い医療を推し進める大きな可能性を秘めている。
しかし、その信頼性は実証的な環境ではほとんど役に立たない。
本研究では, 金属加工業者, 木工法, 深層学習手法を含む17種類の主流因果不均一ML法の内部および外的妥当性を, 国際ストローク裁判(N=19,435)と中国急性ストローク裁判(N=21,106)の2つの大ランダム化対照試験のデータを用いて評価した。
以上の結果から,ML手法は内外を問わず,評価指標のトレーニングデータとテストデータとの間に有意な差異があることが判明した。
トレーニングデータから推定した個別化処理効果は, 分散シフトがない場合でも, テストデータに一般化できなかった。
これらの結果は、精密医療における因果MLモデルの現在の適用可能性への懸念を提起し、一般化性を確保するためのより堅牢なバリデーション技術の必要性を強調している。
関連論文リスト
- ML-assisted Randomization Tests for Detecting Treatment Effects in A/B Experiments [3.79377147545355]
本稿では, 複雑な処理効果に対するランダム化試験を構築した。
このアプローチの重要な特徴は、フレキシブル機械学習(ML)モデルを使用することです。
このアプローチは、現代のMLツールの予測力とランダム化手順の有限サンプル妥当性を組み合わせる。
論文 参考訳(メタデータ) (2025-01-13T22:14:58Z) - Measuring Variable Importance in Heterogeneous Treatment Effects with Confidence [33.12963161545068]
因果機械学習は、複雑なデータから個々の治療効果を推定する約束を持っている。
本稿では,CPI(Conditional Permutation Importance)法に基づくアルゴリズムPermuCATEを提案する。
シミュレーションおよび実世界の健康データセットにおけるPermuCATEの利点を実証的に示す。
論文 参考訳(メタデータ) (2024-08-23T11:44:07Z) - Estimating Causal Effects with Double Machine Learning -- A Method Evaluation [5.904095466127043]
DML(Double/Debiased Machine Learning)の最も顕著な手法の1つについてレビューする。
この結果から, DML 内でのフレキシブルな機械学習アルゴリズムの適用により, 様々な非線形共起関係の調整が向上することが示唆された。
大気汚染が住宅価格に与える影響を推定すると、DMLの見積もりは柔軟性の低い方法の推定よりも一貫して大きいことが分かる。
論文 参考訳(メタデータ) (2024-03-21T13:21:33Z) - Mixed-Integer Projections for Automated Data Correction of EMRs Improve
Predictions of Sepsis among Hospitalized Patients [7.639610349097473]
本稿では,領域制約として臨床専門知識をシームレスに統合する革新的プロジェクションに基づく手法を提案する。
我々は、患者データの健全な範囲を規定する制約から補正されたデータの距離を測定する。
AUROCは0.865で、精度は0.922で、従来のMLモデルを上回る。
論文 参考訳(メタデータ) (2023-08-21T15:14:49Z) - A Double Machine Learning Approach to Combining Experimental and Observational Data [59.29868677652324]
実験と観測を組み合わせた二重機械学習手法を提案する。
我々の枠組みは、より軽度の仮定の下で、外部の妥当性と無知の違反を検査する。
論文 参考訳(メタデータ) (2023-07-04T02:53:11Z) - B-Learner: Quasi-Oracle Bounds on Heterogeneous Causal Effects Under
Hidden Confounding [51.74479522965712]
本稿では,B-Learnerと呼ばれるメタラーナーを提案する。
我々は、その推定が有効で、鋭く、効率的であることを証明し、既存の方法よりも一般的な条件下で構成推定器に対して準オーラル特性を持つことを示した。
論文 参考訳(メタデータ) (2023-04-20T18:07:19Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Comparison of meta-learners for estimating multi-valued treatment
heterogeneous effects [2.294014185517203]
条件平均処理効果(CATE)の推定は、観測データによる因果推論における主な課題の1つである。
メタラーナーと呼ばれる非パラメトリック推定器は、特定の教師付き学習方法に対する推定を抑えない主な利点として、CATEを推定するために開発された。
本稿では,多値処理の異種効果を推定するためのメタラーナーについて検討する。
論文 参考訳(メタデータ) (2022-05-29T16:46:21Z) - Assessment of Treatment Effect Estimators for Heavy-Tailed Data [70.72363097550483]
ランダム化制御試験(RCT)における治療効果の客観的評価における中心的な障害は、その性能をテストするための基礎的真理(または検証セット)の欠如である。
この課題に対処するための新しいクロスバリデーションのような方法論を提供する。
本手法は,Amazonサプライチェーンに実装された709RCTに対して評価を行った。
論文 参考訳(メタデータ) (2021-12-14T17:53:01Z) - SurvITE: Learning Heterogeneous Treatment Effects from Time-to-Event
Data [83.50281440043241]
時系列データから不均一な処理効果を推定する問題について検討する。
本稿では,バランス表現に基づく治療特異的ハザード推定のための新しいディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-10-26T20:13:17Z) - Interpretable Off-Policy Evaluation in Reinforcement Learning by
Highlighting Influential Transitions [48.91284724066349]
強化学習におけるオフ政治評価は、医療や教育などの領域における将来の成果を改善するために観察データを使用する機会を提供する。
信頼区間のような従来の尺度は、ノイズ、限られたデータ、不確実性のために不十分である可能性がある。
我々は,人間専門家が政策評価評価評価の妥当性を分析できるように,ハイブリッドAIシステムとして機能する手法を開発した。
論文 参考訳(メタデータ) (2020-02-10T00:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。