論文の概要: A Two-Stage Pretraining-Finetuning Framework for Treatment Effect Estimation with Unmeasured Confounding
- arxiv url: http://arxiv.org/abs/2501.08888v1
- Date: Wed, 15 Jan 2025 15:58:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 15:51:59.446205
- Title: A Two-Stage Pretraining-Finetuning Framework for Treatment Effect Estimation with Unmeasured Confounding
- Title(参考訳): 非測定コンバウンディングによる処理効果推定のための2段階事前学習フレームワーク
- Authors: Chuan Zhou, Yaxuan Li, Chunyuan Zheng, Haiteng Zhang, Min Zhang, Haoxuan Li, Mingming Gong,
- Abstract要約: 観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。
大規模観測データと小型RTTデータの両方を用いた2段階事前学習ファインタニング(TSPF)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 51.03273343290189
- License:
- Abstract: Estimating the conditional average treatment effect (CATE) from observational data plays a crucial role in areas such as e-commerce, healthcare, and economics. Existing studies mainly rely on the strong ignorability assumption that there are no unmeasured confounders, whose presence cannot be tested from observational data and can invalidate any causal conclusion. In contrast, data collected from randomized controlled trials (RCT) do not suffer from confounding, but are usually limited by a small sample size. In this paper, we propose a two-stage pretraining-finetuning (TSPF) framework using both large-scale observational data and small-scale RCT data to estimate the CATE in the presence of unmeasured confounding. In the first stage, a foundational representation of covariates is trained to estimate counterfactual outcomes through large-scale observational data. In the second stage, we propose to train an augmented representation of the covariates, which is concatenated to the foundational representation obtained in the first stage to adjust for the unmeasured confounding. To avoid overfitting caused by the small-scale RCT data in the second stage, we further propose a partial parameter initialization approach, rather than training a separate network. The superiority of our approach is validated on two public datasets with extensive experiments. The code is available at https://github.com/zhouchuanCN/KDD25-TSPF.
- Abstract(参考訳): 観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。
既存の研究は主に、計測されていない共同設立者がいないという強い無知の仮定に依存しており、その存在は観測データから検証できず、因果的な結論を無効にすることができる。
対照的に、ランダム化制御試験(RCT)から収集されたデータは、コンバウンディングに苦しむことはないが、通常、小さなサンプルサイズによって制限される。
本稿では,大規模観測データと小型RTTデータの両方を用いた2段階事前学習ファインタニング(TSPF)フレームワークを提案する。
第1段階では、大規模観測データを用いて、共変量の基本表現を訓練し、対実結果の推定を行う。
第2段階では,第1段で得られた基礎的表現と結合した共変数の増分表現を訓練し,不測な共役に適応させることを提案する。
第2段階での小規模RCTデータによる過度な適合を回避するため,別のネットワークをトレーニングするのではなく,部分パラメータの初期化手法を提案する。
我々のアプローチの優位性は、広範な実験を伴う2つの公開データセットで検証される。
コードはhttps://github.com/shuchuanCN/KDD25-TSPFで公開されている。
関連論文リスト
- Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。
まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。
本稿では,実証的リスク最小化法(DEM)を提案する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects [10.9134216137537]
既存の観測データとランダム化データを統合するには,テキスト完全観測データが必要である。
我々は、HTE推定のためのtextbfCombine textbfIncomplete textbfObservationalデータとランダム化データに対するレジリエントなアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-28T06:19:14Z) - RCT Rejection Sampling for Causal Estimation Evaluation [25.845034753006367]
コンバウンディングは、観測データから因果効果の偏りのない推定に対する重要な障害である。
評価設計を簡略化し,実データを使用する,有望な実証評価戦略を構築した。
提案アルゴリズムは, 既成試料からオラクル推定器を評価した場合に, バイアスが小さくなることを示す。
論文 参考訳(メタデータ) (2023-07-27T20:11:07Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。
本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T21:47:23Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Individual Treatment Effect Estimation Through Controlled Neural Network
Training in Two Stages [0.757024681220677]
個別の単位レベルで因果的影響推定を推定するために,2段階で学習した因果的ディープニューラルネットワークモデルを開発した。
我々はCDNNが競争力が高く、最も正確な個別治療効果の推定値が得られることを観察する。
論文 参考訳(メタデータ) (2022-01-21T06:34:52Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Quantifying Ignorance in Individual-Level Causal-Effect Estimates under
Hidden Confounding [38.09565581056218]
共同設立者による高次元観測データから条件付き平均治療効果(CATE)の学習問題について検討した。
高次元データに適した新しいパラメトリック間隔推定器を提案する。
論文 参考訳(メタデータ) (2021-03-08T15:58:06Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。