論文の概要: Causal-EPIG: A Prediction-Oriented Active Learning Framework for CATE Estimation
- arxiv url: http://arxiv.org/abs/2509.21866v1
- Date: Fri, 26 Sep 2025 04:44:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.185513
- Title: Causal-EPIG: A Prediction-Oriented Active Learning Framework for CATE Estimation
- Title(参考訳): Causal-EPIG:CATE推定のための予測指向型アクティブラーニングフレームワーク
- Authors: Erdun Gao, Jake Fawkes, Dino Sejdinovic,
- Abstract要約: 本稿では,獲得関数が観測不能な因果量をターゲットにすべきとする因果的客観的アライメントの原理を紹介する。
我々はCausal-EPIGフレームワークを通じてこの原則を運用する。
基本的なトレードオフを具現化する2つの異なる戦略を導出します。
- 参考スコア(独自算出の注目度): 18.560880912660885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the Conditional Average Treatment Effect (CATE) is often constrained by the high cost of obtaining outcome measurements, making active learning essential. However, conventional active learning strategies suffer from a fundamental objective mismatch. They are designed to reduce uncertainty in model parameters or in observable factual outcomes, failing to directly target the unobservable causal quantities that are the true objects of interest. To address this misalignment, we introduce the principle of causal objective alignment, which posits that acquisition functions should target unobservable causal quantities, such as the potential outcomes and the CATE, rather than indirect proxies. We operationalize this principle through the Causal-EPIG framework, which adapts the information-theoretic criterion of Expected Predictive Information Gain (EPIG) to explicitly quantify the value of a query in terms of reducing uncertainty about unobservable causal quantities. From this unified framework, we derive two distinct strategies that embody a fundamental trade-off: a comprehensive approach that robustly models the full causal mechanisms via the joint potential outcomes, and a focused approach that directly targets the CATE estimand for maximum sample efficiency. Extensive experiments demonstrate that our strategies consistently outperform standard baselines, and crucially, reveal that the optimal strategy is context-dependent, contingent on the base estimator and data complexity. Our framework thus provides a principled guide for sample-efficient CATE estimation in practice.
- Abstract(参考訳): 条件平均処理効果 (CATE) の推定には, 結果測定のコストが高く, 積極的学習が不可欠である場合が多い。
しかし、従来のアクティブラーニング戦略は、根本的な客観的なミスマッチに悩まされている。
それらは、モデルパラメータや観測可能な事実結果の不確実性を減らすために設計されており、関心の対象である観測不可能な因果量を直接的にターゲットすることができない。
この不整合に対処するために、我々は、間接的プロキシではなく、潜在的な結果やCATEのような観測不能な因果量をターゲットにして、獲得関数が目的とする因果的客観的アライメントの原則を導入する。
我々は、予測予測情報ゲイン(EPIG)の情報理論的基準を適用して、観測不能な因果量に関する不確実性を減らし、クエリの価値を明示的に定量化するCausal-EPIGフレームワークを通じて、この原則を運用する。
この統合された枠組みから、基本的なトレードオフを具現化する2つの異なる戦略を導出します。これは、結合ポテンシャルによる完全な因果メカニズムを堅牢にモデル化する包括的アプローチと、最大サンプル効率のためにCATE推定を直接ターゲットとする集中的アプローチです。
大規模な実験により、我々の戦略は標準ベースラインを一貫して上回り、そして決定的に、最適な戦略は文脈に依存し、ベース推定器とデータ複雑さに基づいていることが明らかになった。
したがって,本フレームワークは,サンプル効率の高いCATE推定の原則的ガイドを提供する。
関連論文リスト
- Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Bridging Internal Probability and Self-Consistency for Effective and Efficient LLM Reasoning [53.25336975467293]
パープレキシティや自己整合性などの手法の第一理論誤差分解解析について述べる。
パープレキシティ法は、適切な整合関数が存在しないため、かなりのモデル誤差に悩まされる。
本稿では、自己整合性とパープレキシティを統合したReasoning-Pruning Perplexity Consistency(RPC)と、低確率推論経路を排除したReasoning Pruningを提案する。
論文 参考訳(メタデータ) (2025-02-01T18:09:49Z) - On the Impact of Uncertainty and Calibration on Likelihood-Ratio Membership Inference Attacks [42.18575921329484]
我々は,情報理論の枠組みにおける可能性比攻撃(LiRA)の性能を解析する。
我々は、MIAの有効性に対する不確実性と校正の影響についての洞察を提供することを目的として、MIA敵の利点に基づいて境界を導出する。
論文 参考訳(メタデータ) (2024-02-16T13:41:18Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - False Correlation Reduction for Offline Reinforcement Learning [115.11954432080749]
本稿では,実効的かつ理論的に証明可能なアルゴリズムであるオフラインRLに対するfalSe Correlation Reduction (SCORE)を提案する。
SCOREは、標準ベンチマーク(D4RL)において、様々なタスクにおいて3.1倍の高速化でSoTA性能を達成することを実証的に示す。
論文 参考訳(メタデータ) (2021-10-24T15:34:03Z) - Offline Contextual Bandits with Overparameterized Models [52.788628474552276]
オフラインの文脈的盗賊にも同じ現象が起こるかどうかを問う。
この相違は, 目的の強調安定性によるものであることを示す。
大規模なニューラルネットワークを用いた実験では、アクション安定な値ベース目標と不安定なポリシベース目標とのギャップは、大きなパフォーマンス差をもたらす。
論文 参考訳(メタデータ) (2020-06-27T13:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。