Fugu-MT 論文翻訳(概要): A Two-Stage Pretraining-Finetuning Framework for Treatment Effect Estimation with Unmeasured Confounding

論文の概要: A Two-Stage Pretraining-Finetuning Framework for Treatment Effect Estimation with Unmeasured Confounding

arxiv url: http://arxiv.org/abs/2501.08888v1
Date: Wed, 15 Jan 2025 15:58:16 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-16 16:46:28.47559
Title: A Two-Stage Pretraining-Finetuning Framework for Treatment Effect Estimation with Unmeasured Confounding
Title（参考訳）: 非測定コンバウンディングによる処理効果推定のための2段階事前学習フレームワーク
Authors: Chuan Zhou, Yaxuan Li, Chunyuan Zheng, Haiteng Zhang, Min Zhang, Haoxuan Li, Mingming Gong,
Abstract要約: 観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。大規模観測データと小型RTTデータの両方を用いた2段階事前学習ファインタニング(TSPF)フレームワークを提案する。
参考スコア（独自算出の注目度）: 51.03273343290189
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Estimating the conditional average treatment effect (CATE) from observational data plays a crucial role in areas such as e-commerce, healthcare, and economics. Existing studies mainly rely on the strong ignorability assumption that there are no unmeasured confounders, whose presence cannot be tested from observational data and can invalidate any causal conclusion. In contrast, data collected from randomized controlled trials (RCT) do not suffer from confounding, but are usually limited by a small sample size. In this paper, we propose a two-stage pretraining-finetuning (TSPF) framework using both large-scale observational data and small-scale RCT data to estimate the CATE in the presence of unmeasured confounding. In the first stage, a foundational representation of covariates is trained to estimate counterfactual outcomes through large-scale observational data. In the second stage, we propose to train an augmented representation of the covariates, which is concatenated to the foundational representation obtained in the first stage to adjust for the unmeasured confounding. To avoid overfitting caused by the small-scale RCT data in the second stage, we further propose a partial parameter initialization approach, rather than training a separate network. The superiority of our approach is validated on two public datasets with extensive experiments. The code is available at https://github.com/zhouchuanCN/KDD25-TSPF.
Abstract（参考訳）: 観察データから条件平均治療効果(CATE)を推定することは、電子商取引、医療、経済などの分野において重要な役割を果たす。既存の研究は主に、計測されていない共同設立者がいないという強い無知の仮定に依存しており、その存在は観測データから検証できず、因果的な結論を無効にすることができる。対照的に、ランダム化制御試験(RCT)から収集されたデータは、コンバウンディングに苦しむことはないが、通常、小さなサンプルサイズによって制限される。本稿では,大規模観測データと小型RTTデータの両方を用いた2段階事前学習ファインタニング(TSPF)フレームワークを提案する。第1段階では、大規模観測データを用いて、共変量の基本表現を訓練し、対実結果の推定を行う。第2段階では,第1段で得られた基礎的表現と結合した共変数の増分表現を訓練し,不測な共役に適応させることを提案する。第2段階での小規模RCTデータによる過度な適合を回避するため,別のネットワークをトレーニングするのではなく,部分パラメータの初期化手法を提案する。我々のアプローチの優位性は、広範な実験を伴う2つの公開データセットで検証される。コードはhttps://github.com/shuchuanCN/KDD25-TSPFで公開されている。

関連論文リスト

Observationally Informed Adaptive Causal Experimental Design [55.998153710215654]
本稿では,観測モデルを基礎的先行として活用する新たなパラダイムであるアクティブ残留学習を提案する。このアプローチは、実験的な焦点を、目標因果量の学習から、観察バイアスの補正に必要な残差を効率的に推定するへとシフトさせる。合成および半合成ベンチマークの実験は、R-Designがベースラインを大幅に上回ることを示した。
論文参考訳（メタデータ） (2026-03-04T06:52:37Z)
Asymptotic Theory of Iterated Empirical Risk Minimization, with Applications to Active Learning [15.858234832499585]
本研究では,2つの連続ERMを同一データセット上で実行した反復的経験的リスク(ERM)のクラスについて検討する。ガウス混合データに対して幅広い凸損失を訓練した線形モデルに対して、テスト誤差の鋭い特徴付けを導出する。ラベル付け予算の段階的配分に関する基本的なトレードオフを明らかにするとともに、データ選択によって純粋に駆動されるテストエラーの2D動作を実証する。
論文参考訳（メタデータ） (2026-01-30T14:39:51Z)
Conditional Average Treatment Effect Estimation Under Hidden Confounders [25.62280114114055]
擬似共同生成器とCATEモデルに基づくCATE推定手法を提案する。我々の方法は、特にプライバシーが懸念される多くの実践的なシナリオに当てはまる。
論文参考訳（メタデータ） (2025-06-14T01:43:07Z)
Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。本稿では,実証的リスク最小化法(DEM)を提案する。
論文参考訳（メタデータ） (2025-02-10T10:52:17Z)
Deep evolving semi-supervised anomaly detection [14.027613461156864]
本研究の目的は,連続的半教師付き異常検出(CSAD)のタスクを形式化することである。本稿では,半教師付きデータを扱うための変分オートエンコーダ(VAE)のベースラインモデルを提案する。
論文参考訳（メタデータ） (2024-12-01T15:48:37Z)
Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects [10.9134216137537]
既存の観測データとランダム化データを統合するには,テキスト完全観測データが必要である。我々は、HTE推定のためのtextbfCombine textbfIncomplete textbfObservationalデータとランダム化データに対するレジリエントなアプローチを提案する。
論文参考訳（メタデータ） (2024-10-28T06:19:14Z)
RCT Rejection Sampling for Causal Estimation Evaluation [25.845034753006367]
コンバウンディングは、観測データから因果効果の偏りのない推定に対する重要な障害である。評価設計を簡略化し,実データを使用する,有望な実証評価戦略を構築した。提案アルゴリズムは, 既成試料からオラクル推定器を評価した場合に, バイアスが小さくなることを示す。
論文参考訳（メタデータ） (2023-07-27T20:11:07Z)
Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文参考訳（メタデータ） (2023-06-08T07:05:36Z)
Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-09-27T21:47:23Z)
Hierarchical Semi-Supervised Contrastive Learning for Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文参考訳（メタデータ） (2022-07-24T18:49:26Z)
Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。実験結果から,これらの手法が直面する課題を分析した。本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文参考訳（メタデータ） (2022-03-23T07:33:37Z)
Individual Treatment Effect Estimation Through Controlled Neural Network Training in Two Stages [0.757024681220677]
個別の単位レベルで因果的影響推定を推定するために,2段階で学習した因果的ディープニューラルネットワークモデルを開発した。我々はCDNNが競争力が高く、最も正確な個別治療効果の推定値が得られることを観察する。
論文参考訳（メタデータ） (2022-01-21T06:34:52Z)
Assessment of Treatment Effect Estimators for Heavy-Tailed Data [70.72363097550483]
ランダム化制御試験(RCT)における治療効果の客観的評価における中心的な障害は、その性能をテストするための基礎的真理(または検証セット)の欠如である。この課題に対処するための新しいクロスバリデーションのような方法論を提供する。本手法は,Amazonサプライチェーンに実装された709RCTに対して評価を行った。
論文参考訳（メタデータ） (2021-12-14T17:53:01Z)
Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文参考訳（メタデータ） (2021-07-05T12:44:39Z)
Quantifying Ignorance in Individual-Level Causal-Effect Estimates under Hidden Confounding [38.09565581056218]
共同設立者による高次元観測データから条件付き平均治療効果(CATE)の学習問題について検討した。高次元データに適した新しいパラメトリック間隔推定器を提案する。
論文参考訳（メタデータ） (2021-03-08T15:58:06Z)
Efficient Causal Inference from Combined Observational and Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-03-08T14:29:07Z)
Provably Efficient Causal Reinforcement Learning with Confounded Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-06-22T14:49:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。