論文の概要: Calibrated Inference for the Conditional Average Treatment Effect in the Few-Placebo Regime via Gaussian Processes
- arxiv url: http://arxiv.org/abs/2605.27473v1
- Date: Tue, 26 May 2026 11:18:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.356456
- Title: Calibrated Inference for the Conditional Average Treatment Effect in the Few-Placebo Regime via Gaussian Processes
- Title(参考訳): ガウス過程によるFew-Placeboレジームにおける条件平均処理効果の校正推論
- Authors: Eichi Uehara,
- Abstract要約: 片方の治療用アームが他方よりもはるかに小さい,少数のプラセボ系について検討した。
それらは、その名目レベルよりも、真の効果をほとんど含まない。
本稿では,各アームの結果面をガウス過程でモデル化するGP-CATEを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating how much an intervention helps a given individual the conditional average treatment effect (CATE) is increasingly central to decision-making in medicine, economics, and policy, where an estimate is most useful when accompanied by a calibrated uncertainty interval. We study the few-placebo regime, in which one treatment arm is much smaller than the other, as arises in unequal-allocation trials and small-holdout $A/B$ tests. The standard estimator in this setting is the X-Learner, and a natural way to obtain credible intervals is to make its second stage Bayesian. We show that these intervals under-cover: they contain the true effect less often than their nominal level. We trace this to a structural cause the X-Learner's regression target inherits the bias of a nuisance model fitted to the small arm, so the posterior is centered away from the true effect and we find that the standard remedy, regressing an orthogonal doubly-robust score, is also unreliable here, since the regime's limited overlap leaves the estimator either highly variable or, once stabilized, biased once more. Both consequences reflect a pattern that extends beyond causal inference: a separately estimated variance is attached to a point estimate of a hard-to-learn quantity, and the point estimate's bias is not captured by that variance. We propose GP-CATE, which models each arm's outcome surface with a Gaussian process, so the scarce arm's uncertainty enters the posterior directly rather than as an unmodelled bias. Across synthetic and semi-synthetic benchmarks, GP-CATE attains calibrated coverage where the estimators we compare against including Causal Forest and BART do not, at the cost of intervals that are appropriately wide when the data are uninformative.
- Abstract(参考訳): 介入が特定の個人の条件平均治療効果(CATE)にどの程度役立つかを評価することは、医療、経済、政策における意思決定においてますます中心的な役割を担っている。
不平等な転位試験や小額のA/B$試験で生じるように、片方の治療アームが他方よりもはるかに小さい少数のプラセボ体制について検討した。
この設定における標準的な推定子はX-ラーナーであり、信頼できる区間を得る自然な方法は、その第2段階ベイズ的となることである。
これらの間隔は、真の効果を名目上のレベルよりも少ない頻度で含んでいることを示す。
我々は、X-Learnerの回帰目標が小腕に装着されたニュアンスモデルのバイアスを継承する構造的原因を辿ったので、後肢は真の効果から遠ざかっており、直交2倍のロバストスコアを回帰する標準的な治療も信頼性が低いことが判明した。
どちらの結果も因果推論を超えて広がるパターンを反映している: 個別に推定された分散は、ハード・トゥ・ラーン量の点推定にアタッチされ、点推定のバイアスは、その分散によって捕捉されない。
GP-CATEは各アームの結果表面をガウス過程でモデル化するので、不足アームの不確実性は非モデル化バイアスとしてではなく、直接後部に入る。
GP-CATEは、合成および半合成のベンチマーク全体にわたって、不定形データの場合、適切な間隔のコストで、因果フォレストやBARTなどと比較した推定値が存在しないような、キャリブレーションされたカバレッジを達成します。
関連論文リスト
- Cross-World Assumption and Refining Prediction Intervals for Individual Treatment Effects [6.083038976289835]
高い意思決定のためには、個々の治療効果の推定には有効な予測間隔が伴わなければならない。
高い意思決定のためには、個々の治療効果の推定には有効な予測間隔が伴わなければならない。
論文 参考訳(メタデータ) (2025-07-16T18:58:18Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - A Stable and Efficient Covariate-Balancing Estimator for Causal Survival Effects [33.62020029799266]
本研究では、条件に依存しない検閲データにおける生存因果効果の推定の問題に対処する。
これは、小さな推定確率の逆数の使用と、その結果の推定誤差の増幅に対処する。
合成および半合成データに関する実験において理論的結果を検証する。
論文 参考訳(メタデータ) (2023-10-01T00:04:29Z) - Double Robust Bayesian Inference on Average Treatment Effects [2.458652618559425]
不整合下での平均処理効果(ATE)に対する二重頑健なベイズ推定法を提案する。
新しいベイズ的アプローチでは、まず条件付き平均関数の事前分布を調整し、得られた ATE の後方分布を補正する。
論文 参考訳(メタデータ) (2022-11-29T15:32:25Z) - Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。
本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。
いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文 参考訳(メタデータ) (2022-01-15T17:21:26Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - The Counterfactual $\chi$-GAN [20.42556178617068]
因果推論は、しばしば、治療の割り当てが結果から独立していることを要求する反ファクト的枠組みに依存する。
本研究は,CGAN(Counterfactual $chi$-GAN)と呼ばれるGAN(Generative Adversarial Network)に基づくモデルを提案する。
論文 参考訳(メタデータ) (2020-01-09T17:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。