論文の概要: A Partial Initialization Strategy to Mitigate the Overfitting Problem in CATE Estimation with Hidden Confounding
- arxiv url: http://arxiv.org/abs/2501.08888v2
- Date: Sun, 26 Jan 2025 02:30:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 20:37:50.531792
- Title: A Partial Initialization Strategy to Mitigate the Overfitting Problem in CATE Estimation with Hidden Confounding
- Title(参考訳): 隠れ畳み込みによるCATE推定におけるオーバーフィッティング問題の緩和のための部分初期化戦略
- Authors: Chuan Zhou, Yaxuan Li, Chunyuan Zheng, Haiteng Zhang, Haoxuan Li, Mingming Gong,
- Abstract要約: 観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。
既存の研究は主に、隠れた共同設立者がいないという強い無知の仮定に依存している。
ランダム化制御試験 (RCT) から収集されたデータは、共起に苦しむことはないが、通常は小さなサンプルサイズによって制限される。
- 参考スコア(独自算出の注目度): 44.874826691991565
- License:
- Abstract: Estimating the conditional average treatment effect (CATE) from observational data plays a crucial role in areas such as e-commerce, healthcare, and economics. Existing studies mainly rely on the strong ignorability assumption that there are no hidden confounders, whose existence cannot be tested from observational data and can invalidate any causal conclusion. In contrast, data collected from randomized controlled trials (RCT) do not suffer from confounding but are usually limited by a small sample size. To avoid overfitting caused by the small-scale RCT data, we propose a novel two-stage pretraining-finetuning (TSPF) framework with a partial parameter initialization strategy to estimate the CATE in the presence of hidden confounding. In the first stage, a foundational representation of covariates is trained to estimate counterfactual outcomes through large-scale observational data. In the second stage, we propose to train an augmented representation of the covariates, which is concatenated with the foundational representation obtained in the first stage to adjust for the hidden confounding. Rather than training a separate network from scratch, part of the prediction heads are initialized from the first stage. The superiority of our approach is validated on two datasets with extensive experiments.
- Abstract(参考訳): 観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。
既存の研究は主に、隠れた共同設立者がいないという強い無知の仮定に依存しており、その存在は観測データからテストすることはできず、因果的な結論を無効にすることができる。
対照的に、ランダム化制御試験(RCT)から収集されたデータは、コンバウンディングに苦しむことはないが、通常、小さなサンプルサイズによって制限される。
小型RCTデータによる過度な適合を回避するため,隠れたコンバウンディングの存在下でCATEを推定する部分パラメータ初期化戦略を備えた新しい2段階事前学習ファインタニング(TSPF)フレームワークを提案する。
第1段階では、大規模観測データを用いて、共変量の基本表現を訓練し、対実結果の推定を行う。
第2段階では,第1段で得られた基本表現と結合した共変数の増分表現を訓練し,隠れた共役に適応することを提案する。
スクラッチから別のネットワークをトレーニングするのではなく、予測ヘッドの一部が第1ステージから初期化される。
我々のアプローチの優位性は、広範囲な実験を伴う2つのデータセットで検証される。
関連論文リスト
- Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects [10.9134216137537]
既存の観測データとランダム化データを統合するには,テキスト完全観測データが必要である。
我々は、HTE推定のためのtextbfCombine textbfIncomplete textbfObservationalデータとランダム化データに対するレジリエントなアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-28T06:19:14Z) - Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。
本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T21:47:23Z) - DESCN: Deep Entire Space Cross Networks for Individual Treatment Effect
Estimation [7.060064266376701]
因果推論は、Eコマースや精密医療など様々な分野で広く応用されている。
本稿では,エンド・ツー・エンドの観点から治療効果をモデル化するためのDeep Entire Space Cross Networks (DESCN)を提案する。
論文 参考訳(メタデータ) (2022-07-19T01:25:31Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Individual Treatment Effect Estimation Through Controlled Neural Network
Training in Two Stages [0.757024681220677]
個別の単位レベルで因果的影響推定を推定するために,2段階で学習した因果的ディープニューラルネットワークモデルを開発した。
我々はCDNNが競争力が高く、最も正確な個別治療効果の推定値が得られることを観察する。
論文 参考訳(メタデータ) (2022-01-21T06:34:52Z) - Assessment of Treatment Effect Estimators for Heavy-Tailed Data [70.72363097550483]
ランダム化制御試験(RCT)における治療効果の客観的評価における中心的な障害は、その性能をテストするための基礎的真理(または検証セット)の欠如である。
この課題に対処するための新しいクロスバリデーションのような方法論を提供する。
本手法は,Amazonサプライチェーンに実装された709RCTに対して評価を行った。
論文 参考訳(メタデータ) (2021-12-14T17:53:01Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Quantifying Ignorance in Individual-Level Causal-Effect Estimates under
Hidden Confounding [38.09565581056218]
共同設立者による高次元観測データから条件付き平均治療効果(CATE)の学習問題について検討した。
高次元データに適した新しいパラメトリック間隔推定器を提案する。
論文 参考訳(メタデータ) (2021-03-08T15:58:06Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。