論文の概要: Beyond Differences: Doubly Robust Meta-Learners for Ratio-Based Treatment Effects
- arxiv url: http://arxiv.org/abs/2605.26288v1
- Date: Mon, 25 May 2026 19:24:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.381264
- Title: Beyond Differences: Doubly Robust Meta-Learners for Ratio-Based Treatment Effects
- Title(参考訳): 違いを超えて:2倍のロバストなメタ学習者による治療効果
- Authors: Michael Fuchs, Dominik Kreiss,
- Abstract要約: Q-Learnerは$(x)$を2つの奇数比の積に分解する。
S/T-とQ-style比学習者の2倍頑健な増分を導出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When treatment effects are naturally expressed as ratios -- as in medicine, pricing, and marketing -- the ratio-based CATE $τ(x) = E[Y|W=1,X=x] / E[Y|W=0,X=x]$ is the appropriate estimand. Yet existing estimators either impose a log-linear parametric structure or apply generic regression without robustness guarantees for this functional. We introduce the Q-Learner, which decomposes $τ(x)$ into a product of two odds ratios, reducing ratio-CATE estimation for binary outcomes to two propensity classification tasks. We further derive doubly robust augmentations for both S/T- and Q-style ratio learners and characterize their distinct robustness properties. In benchmarks on seven RCT datasets, the Q-Learner is the most consistently competitive method in low-conversion regimes, where its propensity-only construction sidesteps the imbalanced regression that hurts outcome-based estimators. On four observational datasets, where propensity must be estimated and confounding cannot be ruled out, the DR learners introduced here decisively come out on top, making them practitioners' natural default for confounded observational data.
- Abstract(参考訳): CATE $τ(x) = E[Y|W=1,X=x] / E[Y|W=0,X=x]$は適切な推定値である。
しかし、既存の推定器は、対数線形パラメトリック構造を課すか、あるいはこの関数に対して堅牢性を保証することなく、一般的な回帰を適用する。
Q-Learnerを導入し、$τ(x)$を2つの確率比の積に分解し、二項結果の比CATE推定を2つの確率分類タスクに還元する。
さらに、S/T-とQ-スタイルの比学習者に対して2倍の頑健性向上を導き、それぞれの頑健性特性を特徴付ける。
7つのRCTデータセットのベンチマークでは、Q-Learnerは低コンバージョン方式において最も一貫して競合する手法であり、その確率のみの構成は結果に基づく推定を損なう不均衡な回帰を横取りしている。
ここで紹介されたDR学習者は、4つの観測データセットにおいて、確率を推定し、矛盾を排除できない。
関連論文リスト
- Temporal Smoothness Doubly Robust Learning for Debiased Knowledge Tracing [29.91193246346701]
知識追跡(KT)のための二重頑健(DR)定式化を導入する。
DRは確率モデルと誤差計算モデルを統合し、理論上どちらのモデルも正確であれば不偏性を保証する。
これらの理論的知見に基づいて、時間的平滑性2重ロバスト(TSDR)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-07T10:05:53Z) - Multimodal Learning on Low-Quality Data with Conformal Predictive Self-Calibration [72.0672328514289]
マルチモーダル学習は、しばしば低品質データの課題に悩まされる。
コンフォーマル予測自己校正(Conformal Predictive Self-Calibration)と呼ばれる統合フレームワークを提案する。
私たちのフレームワークは、既存の最先端メソッドを一貫して上回ります。
論文 参考訳(メタデータ) (2026-05-05T14:48:52Z) - A novel hybrid approach for positive-valued DAG learning [60.917028769172795]
正値データから有向非巡回グラフ(DAG)を学習するためのHybrid Moment-Ratio Scoring (H-MRS)アルゴリズムを提案する。
H-MRSは、モーメント比推定のためのログスケールリッジ回帰と、生のスケールモーメント比に基づくグレディオーダー処理を統合する。
合成対数線形データの実験は、競合精度とリコールを示す。
論文 参考訳(メタデータ) (2026-04-10T04:04:26Z) - Observationally Informed Adaptive Causal Experimental Design [55.998153710215654]
本稿では,観測モデルを基礎的先行として活用する新たなパラダイムであるアクティブ残留学習を提案する。
このアプローチは、実験的な焦点を、目標因果量の学習から、観察バイアスの補正に必要な残差を効率的に推定するへとシフトさせる。
合成および半合成ベンチマークの実験は、R-Designがベースラインを大幅に上回ることを示した。
論文 参考訳(メタデータ) (2026-03-04T06:52:37Z) - NAIPv2: Debiased Pairwise Learning for Efficient Paper Quality Estimation [58.30936615525824]
本稿では,紙の品質評価のための非バイアスで効率的なフレームワークであるNAIPv2を提案する。
NAIPv2は、レビューアレーティングの不整合を低減するために、ドメイン年グループ内でペアワイズ学習を採用している。
これはペアワイズ比較に基づいてトレーニングされるが、デプロイ時に効率的なポイントワイズ予測を可能にする。
論文 参考訳(メタデータ) (2025-09-29T17:59:23Z) - Calibration Strategies for Robust Causal Estimation: Theoretical and Empirical Insights on Propensity Score-Based Estimators [0.6562256987706128]
推定と校正のためのデータの分割は、確率スコアに基づく推定器の性能に重大な影響を及ぼす。
提案手法は,確率スコア推定のためのキャリブレーション手法の最近の進歩を延長し,挑戦的な設定における確率スコアの堅牢性を向上させる。
論文 参考訳(メタデータ) (2025-03-21T16:41:10Z) - A Note on Doubly Robust Estimator in Regression Discontinuity Designs [10.470114319701576]
回帰不連続性(RD)設計のための二重頑健性(DR)推定器を提案する。
DR-RD推定器はRD設計における処理効果推定器のロバスト性を高める。
論文 参考訳(メタデータ) (2024-11-12T17:58:34Z) - Doubly Robust Distributionally Robust Off-Policy Evaluation and Learning [59.02006924867438]
オフ政治評価と学習(OPE/L)は、オフラインの観察データを使用してより良い意思決定を行う。
近年の研究では、分散ロバストなOPE/L (DROPE/L) が提案されているが、この提案は逆正則重み付けに依存している。
KL分散不確実性集合を用いたDROPE/Lの最初のDRアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-19T20:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。