論文の概要: Statistical Performance Guarantee for Subgroup Identification with
Generic Machine Learning
- arxiv url: http://arxiv.org/abs/2310.07973v2
- Date: Wed, 20 Dec 2023 13:16:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 21:50:33.955971
- Title: Statistical Performance Guarantee for Subgroup Identification with
Generic Machine Learning
- Title(参考訳): 汎用機械学習を用いたサブグループ識別のための統計的性能保証
- Authors: Michael Lingzhi Li, Kosuke Imai
- Abstract要約: 我々は、ジェネリックMLアルゴリズム(GATES)によりソートされたグループ平均処理効果を推定するための一様信頼バンドを開発する。
我々は,後期前立腺癌の臨床試験を解析し,例外的反応の比率が比較的高いことを見出した。
- 参考スコア(独自算出の注目度): 1.0878040851638
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Across a wide array of disciplines, many researchers use machine learning
(ML) algorithms to identify a subgroup of individuals who are likely to benefit
from a treatment the most (``exceptional responders'') or those who are harmed
by it. A common approach to this subgroup identification problem consists of
two steps. First, researchers estimate the conditional average treatment effect
(CATE) using an ML algorithm. Next, they use the estimated CATE to select those
individuals who are predicted to be most affected by the treatment, either
positively or negatively. Unfortunately, CATE estimates are often biased and
noisy. In addition, utilizing the same data to both identify a subgroup and
estimate its group average treatment effect results in a multiple testing
problem. To address these challenges, we develop uniform confidence bands for
estimation of the group average treatment effect sorted by generic ML algorithm
(GATES). Using these uniform confidence bands, researchers can identify, with a
statistical guarantee, a subgroup whose GATES exceeds a certain effect size,
regardless of how this effect size is chosen. The validity of the proposed
methodology depends solely on randomization of treatment and random sampling of
units. Importantly, our method does not require modeling assumptions and avoids
a computationally intensive resampling procedure. A simulation study shows that
the proposed uniform confidence bands are reasonably informative and have an
appropriate empirical coverage even when the sample size is as small as 100. We
analyze a clinical trial of late-stage prostate cancer and find a relatively
large proportion of exceptional responders.
- Abstract(参考訳): 幅広い分野にまたがって、多くの研究者は機械学習(ML)アルゴリズムを使用して、治療の恩恵を受ける可能性が最も高いサブグループ( ``Exceptionional responseers'')や、その影響を受けているサブグループを特定する。
この部分群識別問題に対する一般的なアプローチは2つのステップからなる。
まず,条件付き平均治療効果(cate)をmlアルゴリズムを用いて推定する。
次に、推定CATEを使用して、治療によって最も影響を受けやすいと予測された個人を選択する。
残念なことに、CATEの見積もりはバイアスがありうる。
さらに、同じデータを使用してサブグループを特定し、グループ平均治療効果を見積もることで、複数のテスト問題が発生する。
これらの課題に対処するために、ジェネリックMLアルゴリズム(GATES)によってソートされたグループ平均処理効果を推定するための統一信頼バンドを開発する。
これらの一様信頼帯を用いて、研究者は、この効果の大きさがどう選択されるかに関わらず、ゲートが特定の効果サイズを超える部分群を統計的に保証して特定することができる。
提案手法の有効性は, 処理のランダム化と単位のランダムサンプリングにのみ依存する。
重要なことに、本手法は仮定のモデル化を必要とせず、計算集約的な再サンプリング手順を回避できる。
シミュレーション実験により,サンプルサイズが100以下であっても,一様信頼帯は合理的に情報的であり,適切な経験的カバレッジを有することが示された。
晩期前立腺癌の臨床試験を解析し,稀な患者の割合が比較的多いことを発見した。
関連論文リスト
- Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.18828236350544]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文 参考訳(メタデータ) (2024-07-20T12:42:24Z) - Multi-CATE: Multi-Accurate Conditional Average Treatment Effect Estimation Robust to Unknown Covariate Shifts [12.289361708127876]
我々は、CATE T-learnerを後処理するために、マルチ精度の予測子を学習するために方法論を使用する。
このアプローチは、(より大きな)確立された観測データと(より小さな)ランダム化されたデータセットを組み合わせることができることを示す。
論文 参考訳(メタデータ) (2024-05-28T14:12:25Z) - Causal K-Means Clustering [5.087519744951637]
Causal k-Means Clusteringは、広く使われているk-means Clusteringアルゴリズムを利用して、未知の部分群構造を明らかにする。
既成のアルゴリズムを用いて簡易かつ容易に実装可能なプラグイン推定器を提案する。
提案手法は,複数の治療レベルを有する近代的な結果研究に特に有用である。
論文 参考訳(メタデータ) (2024-05-05T23:59:51Z) - Sample Constrained Treatment Effect Estimation [28.156207324508706]
我々は,効率的なランダム化制御試験を設計することに集中し,治療の効果を正確に見積もる。
特に, サンプル制約による治療効果の推定について検討し, 実験を行うには, 集団から$s ll n$のサブセットを選択する必要がある。
論文 参考訳(メタデータ) (2022-10-12T21:13:47Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Statistical Inference for Heterogeneous Treatment Effects Discovered by Generic Machine Learning in Randomized Experiments [0.9208007322096533]
汎用MLアルゴリズムにより検出された不均一な処理効果の統計的推測に対する一般的なアプローチを開発する。
各グループの平均治療効果を推定し,有効信頼区間を構築する方法について述べる。
論文 参考訳(メタデータ) (2022-03-28T05:43:46Z) - Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。
本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。
いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文 参考訳(メタデータ) (2022-01-15T17:21:26Z) - Robust Recursive Partitioning for Heterogeneous Treatment Effects with
Uncertainty Quantification [84.53697297858146]
治療効果のサブグループ分析は、医療から公共政策、レコメンデーターシステムへの応用において重要な役割を担っている。
サブグループ分析の現在の手法のほとんどは、個別化処理効果(ITE)を推定するための特定のアルゴリズムから始まる。
本稿では、これらの弱点に対処する新しい部分群解析法R2Pを開発する。
論文 参考訳(メタデータ) (2020-06-14T14:50:02Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。