論文の概要: Detecting and Mitigating Group Bias in Heterogeneous Treatment Effects
- arxiv url: http://arxiv.org/abs/2602.20383v1
- Date: Mon, 23 Feb 2026 21:47:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.537233
- Title: Detecting and Mitigating Group Bias in Heterogeneous Treatment Effects
- Title(参考訳): 不均一処理効果におけるグループバイアスの検出と緩和
- Authors: Joel Persson, Jurriën Bakker, Dennis Bohle, Stefan Feuerriegel, Florian von Wangenheim,
- Abstract要約: ランダム化実験における群バイアスの検出と緩和のための統計的枠組みを開発する。
緩和のために、縮退に基づくバイアス補正を提案し、理論的に最適で実証可能な解が閉形式表現を持つことを示す。
利益を最大化するパーソナライズターゲティングのための検出されたグループバイアスを緩和することの経済的意味を分析する。
- 参考スコア(独自算出の注目度): 28.4891545570248
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heterogeneous treatment effects (HTEs) are increasingly estimated using machine learning models that produce highly personalized predictions of treatment effects. In practice, however, predicted treatment effects are rarely interpreted, reported, or audited at the individual level but, instead, are often aggregated to broader subgroups, such as demographic segments, risk strata, or markets. We show that such aggregation can induce systematic bias of the group-level causal effect: even when models for predicting the individual-level conditional average treatment effect (CATE) are correctly specified and trained on data from randomized experiments, aggregating the predicted CATEs up to the group level does not, in general, recover the corresponding group average treatment effect (GATE). We develop a unified statistical framework to detect and mitigate this form of group bias in randomized experiments. We first define group bias as the discrepancy between the model-implied and experimentally identified GATEs, derive an asymptotically normal estimator, and then provide a simple-to-implement statistical test. For mitigation, we propose a shrinkage-based bias-correction, and show that the theoretically optimal and empirically feasible solutions have closed-form expressions. The framework is fully general, imposes minimal assumptions, and only requires computing sample moments. We analyze the economic implications of mitigating detected group bias for profit-maximizing personalized targeting, thereby characterizing when bias correction alters targeting decisions and profits, and the trade-offs involved. Applications to large-scale experimental data at major digital platforms validate our theoretical results and demonstrate empirical performance.
- Abstract(参考訳): 不均一な治療効果(HTE)は、治療効果の高度にパーソナライズされた予測を生成する機械学習モデルを用いて、ますます推定される。
しかし実際には、予測された治療効果は、個々のレベルで解釈、報告、監査されることは稀であるが、代わりに、人口層、リスク層、市場といったより広範なサブグループに集約されることがしばしばある。
個人レベルの条件平均処理効果(CATE)を予測するモデルが、ランダム化実験のデータに基づいて正しく特定され、訓練されたとしても、予測されたCATEをグループレベルまで集約することは、一般的には、対応するグループ平均処理効果(GATE)を回復しない。
ランダム化実験において,このようなグループバイアスを検出・緩和するための統一統計フレームワークを開発する。
まず、群バイアスをモデルにより実装されたGATEと実験的に同定されたGATEの相違点として定義し、漸近的に正規な推定器を導出し、簡単な統計的検査を行う。
緩和のために、縮退に基づくバイアス補正を提案し、理論的に最適で実証可能な解が閉形式表現を持つことを示す。
フレームワークは完全に汎用的で、最小限の仮定を課し、計算サンプルモーメントのみを必要とする。
本研究では,検出されたグループバイアスを軽減し,個人化目標を最大化することによる経済的影響を分析し,偏見補正がターゲット決定や利益を変化させた際の特徴付けと関連するトレードオフについて分析する。
大規模デジタルプラットフォームにおける実験データへの応用は、我々の理論結果を検証し、経験的性能を実証する。
関連論文リスト
- Measuring Model Performance in the Presence of an Intervention [11.381587523287495]
社会的影響アプリケーションのための多くのAIでは、結果に影響を与える介入の存在は評価に偏っている。
RCTはランダムに介入を割り当て、制御グループからのデータをバイアスのないモデル評価に使用できる。
本研究では, 治療群からのデータを重み付けし, 結果が得られないサンプルの分布を再現する非バイアスモデル評価手法であるニュアンスパラメータ重み付け(NPW)を提案する。
論文 参考訳(メタデータ) (2025-11-08T02:24:16Z) - Robust estimation of heterogeneous treatment effects in randomized trials leveraging external data [4.777323087050061]
本研究では,条件付き平均治療効果(CATE)を推定するモデル非依存学習者QR-learnerを提案する。
これにより、トライアルのみのCATE学習者に対して平均2乗誤差を低減でき、外部データがトライアルに一致していない場合でも真のCATEを復元することが保証される。
論文 参考訳(メタデータ) (2025-07-04T16:01:05Z) - Prediction-Powered Causal Inferences [59.98498488132307]
予測型因果推論(PPCI)に焦点をあてる
まず, 条件付きキャリブレーションにより, 人口レベルでの有効なPPCIが保証されることを示す。
次に、実験間での十分な表現制約伝達の妥当性を導入する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Causality and Independence Enhancement for Biased Node Classification [56.38828085943763]
各種グラフニューラルネットワーク(GNN)に適用可能な新しい因果性・独立性向上(CIE)フレームワークを提案する。
提案手法は,ノード表現レベルでの因果的特徴と突発的特徴を推定し,突発的相関の影響を緩和する。
我々のアプローチCIEは、GNNの性能を大幅に向上するだけでなく、最先端の debiased ノード分類法よりも優れています。
論文 参考訳(メタデータ) (2023-10-14T13:56:24Z) - Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。
本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T21:47:23Z) - Robust and Agnostic Learning of Conditional Distributional Treatment Effects [44.31792000298105]
問題クラスに対する条件付きDTE(Conditional DTE)を学習するための、新しい堅牢でモデルに依存しない方法論を提供する。
本手法は回帰モデルクラスにCDTEの最良のプロジェクションを提供することができるため,モデルに依存しない。
シミュレーションにおける提案手法の挙動と,富に対する401(k)の適格性の影響を事例として検討した。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Two-Stage TMLE to Reduce Bias and Improve Efficiency in Cluster
Randomized Trials [0.0]
クラスタランダム化トライアル(CRT)は、ランダムに個人グループへの介入を割り当て、それらのグループ内の個人に対する結果を測定する。
クラスタ内の一部の個人には発見が欠落することが多い。
CRTは、しばしば限られた数のクラスターをランダムにし、その結果、腕間のベースライン結果予測器に不均衡をもたらす。
論文 参考訳(メタデータ) (2021-06-29T21:47:30Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Double machine learning for sample selection models [0.12891210250935145]
本稿では,サンプル選択や帰属によるサブポピュレーションに対してのみ結果が観察される場合の個別分散処理の評価について考察する。
a)Neyman-orthogonal, Duubly robust, and efficient score function, which suggests the robustness of treatment effect Estimation to moderate regularization biases in the machine learning based Estimation of the outcome, treatment, or sample selection model and (b) sample splitting ( or cross-fitting) to prevent overfitting bias。
論文 参考訳(メタデータ) (2020-11-30T19:40:21Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。