論文の概要: Personalized Assignment to One of Many Treatment Arms via Regularized
and Clustered Joint Assignment Forests
- arxiv url: http://arxiv.org/abs/2311.00577v1
- Date: Wed, 1 Nov 2023 15:18:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 13:19:08.850890
- Title: Personalized Assignment to One of Many Treatment Arms via Regularized
and Clustered Joint Assignment Forests
- Title(参考訳): 正規化・群集分割林による多数の治療腕の1つへのパーソナライズド・アサイン
- Authors: Rahul Ladhania, Jann Spiess, Lyle Ungar, Wenbo Wu
- Abstract要約: ランダム化試験から多数の治療用アームの1つにパーソナライズされた課題を学習することを検討する。
各腕に対して別々に不均一な治療効果を推定する標準的な方法は、性能が劣る可能性がある。
我々は治療用アームにまたがって情報をプールする方法を提案する。
- 参考スコア(独自算出の注目度): 1.9662978733004601
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider learning personalized assignments to one of many treatment arms
from a randomized controlled trial. Standard methods that estimate
heterogeneous treatment effects separately for each arm may perform poorly in
this case due to excess variance. We instead propose methods that pool
information across treatment arms: First, we consider a regularized
forest-based assignment algorithm based on greedy recursive partitioning that
shrinks effect estimates across arms. Second, we augment our algorithm by a
clustering scheme that combines treatment arms with consistently similar
outcomes. In a simulation study, we compare the performance of these approaches
to predicting arm-wise outcomes separately, and document gains of directly
optimizing the treatment assignment with regularization and clustering. In a
theoretical model, we illustrate how a high number of treatment arms makes
finding the best arm hard, while we can achieve sizable utility gains from
personalization by regularized optimization.
- Abstract(参考訳): ランダム化試験から多数の治療用アームの1つにパーソナライズされた課題を学習することを検討する。
この場合、各腕の異種処理効果を別々に推定する標準的な方法は、過剰なばらつきのために性能が低下する可能性がある。
代わりに、治療用アームにまたがって情報をプールする方法を提案する: まず、グリーディーな再帰的パーティショニングに基づく正規化森林ベースの割当てアルゴリズムを考える。
第2に,治療アームと一貫した類似結果を組み合わせたクラスタリング手法によってアルゴリズムを補強する。
シミュレーション研究では,これらの手法の腕回りの結果を別々に予測するための性能と,正規化とクラスタリングによる処理割り当てを直接最適化する文書ゲインを比較した。
理論的モデルでは、多くの治療用アームが最適な腕を見つけるのを難しくする一方で、正規化された最適化によってパーソナライズから大きなユーティリティーゲインを達成することができる。
関連論文リスト
- Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Covariance Adaptive Best Arm Identification [0.0]
ゴールは、腕のプル数を最小化しながら、最低でも1-$delta$の確率で腕を最も平均的な報酬で識別することである。
武器を頼りにでき、報酬を同時にサンプリングできる、より柔軟なシナリオを提案する。
この枠組みは、患者と薬物の類似性から根底にある相関関係が示唆される臨床試験など、様々な応用に関係している。
論文 参考訳(メタデータ) (2023-06-05T06:57:09Z) - Sample Constrained Treatment Effect Estimation [28.156207324508706]
我々は,効率的なランダム化制御試験を設計することに集中し,治療の効果を正確に見積もる。
特に, サンプル制約による治療効果の推定について検討し, 実験を行うには, 集団から$s ll n$のサブセットを選択する必要がある。
論文 参考訳(メタデータ) (2022-10-12T21:13:47Z) - Finding Optimal Arms in Non-stochastic Combinatorial Bandits with
Semi-bandit Feedback and Finite Budget [6.759124697337311]
有限サンプリング予算制約の下では,半帯域フィードバックによる帯域幅問題を考える。
アクションは、一組のアームを選択し、選択されたセット内の各アームに対するフィードバックが受信される。
本稿では,アーム除去戦略の全スペクトルをカバーするのに適した汎用アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-09T14:36:05Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Generalized Causal Tree for Uplift Modeling [7.614863322262727]
昇降モデリングは、マーケティングやポリシー作成からパーソナライズされたレコメンデーションまで、様々なアプリケーションにおいて重要である。
主な目的は、異種集団に対する最適な治療割り当てを学習することである。
複数の離散的かつ連続的な処理に対処するためのツリーベースアプローチの一般化を提案する。
論文 参考訳(メタデータ) (2022-02-04T22:27:49Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Efficient Pure Exploration for Combinatorial Bandits with Semi-Bandit
Feedback [51.21673420940346]
コンビナーシャルバンディットはマルチアームバンディットを一般化し、エージェントが腕のセットを選択し、選択したセットに含まれる各腕の騒々しい報酬を観察します。
我々は, 最善の腕を一定の信頼度で識別する純粋爆発問題と, 応答集合の構造が動作集合の1つと異なるような, より一般的な設定に注目する。
有限多面体に対するプロジェクションフリーオンライン学習アルゴリズムに基づいて、凸的に最適であり、競争力のある経験的性能を持つ最初の計算効率の良いアルゴリズムである。
論文 参考訳(メタデータ) (2021-01-21T10:35:09Z) - Weighting-Based Treatment Effect Estimation via Distribution Learning [14.438302755258547]
本研究では,処理効果推定のための分布学習に基づく重み付け手法を開発した。
提案手法は,最先端の重み付けのみのベンチマーク手法よりも優れている。
2倍のロス率推定フレームワークの下では、その優位性を維持している。
論文 参考訳(メタデータ) (2020-12-26T20:15:44Z) - Optimal Best-arm Identification in Linear Bandits [79.3239137440876]
サンプルの複雑さが既知のインスタンス固有の下界と一致する単純なアルゴリズムを考案する。
既存のベストアーム識別戦略とは異なり、我々のアルゴリズムは武器の数に依存しない停止規則を用いる。
論文 参考訳(メタデータ) (2020-06-29T14:25:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。