論文の概要: Learning to Personalize Treatments When Agents Are Strategic
- arxiv url: http://arxiv.org/abs/2011.06528v4
- Date: Thu, 17 Mar 2022 20:44:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 08:00:24.691928
- Title: Learning to Personalize Treatments When Agents Are Strategic
- Title(参考訳): エージェントが戦略的な場合、治療をパーソナライズする学習
- Authors: Evan Munro
- Abstract要約: 本研究では, 条件平均処理効果(CATE)に対する新たな定義を提案する。
最適規則は、その規則によって誘導される正のCATEであっても、100%未満の確率で治療を割り当て、ランダム化を伴う可能性があることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is increasing interest in allocating treatments based on observed
individual data: examples include targeted marketing, individualized credit
offers, and heterogenous pricing. Treatment personalization introduces
incentives for individuals to modify their behavior to obtain a better
treatment. This shifts the distribution of covariates, requiring a new
definition for the Conditional Average Treatment Effect (CATE) that makes
explicit its dependence on how treatments are allocated. We provide necessary
conditions that treatment rules under strategic behavior must meet. The optimal
rule without strategic behavior allocates treatments only to those with a
positive CATE. With strategic behavior, we show that the optimal rule can
involve randomization, allocating treatments with less than 100\% probability
even to those with a positive CATE induced by that rule. We propose a dynamic
experiment based on Bayesian Optimization that converges to the optimal
treatment allocation function without parametric assumptions on individual
strategic behavior.
- Abstract(参考訳): 個々のデータに基づいて治療を割り当てることへの関心が高まっている。例えば、ターゲットマーケティング、個別クレジットオファー、異種価格などである。
治療のパーソナライゼーションは、個人がより良い治療を得るために行動を変えるインセンティブをもたらす。
これは共変量分布をシフトさせ、条件平均処理効果(Conditional Average Treatment Effect, CATE)の新たな定義を必要とする。
戦略的行動下における治療規則を満たさなければならない必要条件を提供する。
戦略的行動のない最適規則は、正のCATEを持つ者にのみ治療を割り当てる。
戦略的行動においては、最適規則はランダム化を伴い、その規則によって誘導される正のCATEであっても100倍の確率で治療を割り当てる。
本研究では,ベイズ最適化に基づく動的実験を提案し,個別の戦略行動に対するパラメトリックな仮定を伴わない最適処理割り当て関数に収束する。
関連論文リスト
- Ranking of Multi-Response Experiment Treatments [0.4711628883579317]
複数応答実験における最適処理を推定するための確率的ランキングモデルを提案する。
この枠組みでは、治療ランクの点から、まず全体的な最適性を定式化する。
我々は、最適から最小限の最適な理想的な特性から治療を報告できる潜在ランクを推測する。
論文 参考訳(メタデータ) (2024-10-23T07:00:35Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0]
本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文 参考訳(メタデータ) (2024-03-30T02:33:39Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Stage-Aware Learning for Dynamic Treatments [3.6923632650826486]
動的治療体制のための新しい個別化学習法を提案する。
観測軌道が最適処理と完全に一致しなければならないという制約を緩和することにより,本手法はIPWE法における試料効率と安定性を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-30T06:35:31Z) - Safe and Interpretable Estimation of Optimal Treatment Regimes [54.257304443780434]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。
本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文 参考訳(メタデータ) (2023-10-23T19:59:10Z) - Optimal and Fair Encouragement Policy Evaluation and Learning [11.712023983596914]
本研究は, 陽性の潜在的な違反を含む最適治療規則の因果同定とロバストな評価について検討した。
一般制約下でのパラメタライズされたポリシークラスを解くための2段階のアルゴリズムを開発し、分散感応的後悔境界を求める。
本研究は, SNAP給付のリマインダーデータ, 保険申請の無作為化促進, および電子監視による事前管理リリースに基づく3つのケーススタディである。
論文 参考訳(メタデータ) (2023-09-12T20:45:30Z) - Understanding the Effect of Stochasticity in Policy Optimization [86.7574122154668]
最適化手法の優位性は、正確な勾配が用いられるかどうかに大きく依存することを示す。
次に,政策最適化におけるコミット率の概念を紹介する。
第三に、外部のオラクル情報がない場合には、収束を加速するために幾何を利用することと、最適性をほぼ確実に達成することとの間に本質的にトレードオフがあることが示される。
論文 参考訳(メタデータ) (2021-10-29T06:35:44Z) - On Inductive Biases for Heterogeneous Treatment Effect Estimation [91.3755431537592]
我々は、異なる治療下で、個人の潜在的成果(PO)の構造的類似性を利用する方法について検討する。
この問題を克服するために、エンドツーエンドの学習戦略を3つ比較する。
論文 参考訳(メタデータ) (2021-06-07T16:30:46Z) - Median Optimal Treatment Regimes [7.241149193573696]
コンディショナーが治療中よりも高い個人を治療する新しいメディアン最適治療体制を提案します。
これにより、同じグループの個人に対する最適な決定が、グループのごく一部に過度に影響されないことが保証される。
本稿では,政策の全体的中央値処理結果を要約した新しい評価尺度ACME(Average Conditional Median Effect)を紹介する。
論文 参考訳(メタデータ) (2021-03-02T15:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。