論文の概要: Treatment Allocation with Strategic Agents
- arxiv url: http://arxiv.org/abs/2011.06528v5
- Date: Tue, 4 Apr 2023 21:44:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 17:10:33.786570
- Title: Treatment Allocation with Strategic Agents
- Title(参考訳): 戦略エージェントによる治療割り当て
- Authors: Evan Munro
- Abstract要約: 最適規則はランダム化を伴い,100%未満の確率で治療をアロケートし,治療に対して平均的に正の反応を示した者に対しても有効であることを示す。
本研究では,ベイズ最適化に基づく逐次的実験を提案し,個別の戦略行動に関するパラメトリックな仮定を伴わない最適処理規則に収束する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is increasing interest in allocating treatments based on observed
individual characteristics: examples include targeted marketing, individualized
credit offers, and heterogeneous pricing. Treatment personalization introduces
incentives for individuals to modify their behavior to obtain a better
treatment. Strategic behavior shifts the joint distribution of covariates and
potential outcomes. The optimal rule without strategic behavior allocates
treatments only to those with a positive Conditional Average Treatment Effect.
With strategic behavior, we show that the optimal rule can involve
randomization, allocating treatments with less than 100% probability even to
those who respond positively on average to the treatment. We propose a
sequential experiment based on Bayesian Optimization that converges to the
optimal treatment rule without parametric assumptions on individual strategic
behavior.
- Abstract(参考訳): 例えば、ターゲットマーケティング、個別のクレジットオファー、異種価格などである。
治療のパーソナライゼーションは、個人がより良い治療を得るために行動を変えるインセンティブをもたらす。
戦略行動は共変量と潜在的な結果の同時分布をシフトさせる。
戦略的行動のない最適規則は、前向きな条件平均治療効果を有する者にのみ治療を割り当てる。
戦略行動において, 最適ルールはランダム化を伴い, 平均的に正の反応を示した者でも100%未満の確率で治療を割り当てることができることを示した。
本研究では,ベイズ最適化に基づく逐次実験を提案し,個別の戦略行動に関するパラメトリックな仮定を伴わない最適処理規則に収束する。
関連論文リスト
- Ranking of Multi-Response Experiment Treatments [0.4711628883579317]
複数応答実験における最適処理を推定するための確率的ランキングモデルを提案する。
この枠組みでは、治療ランクの点から、まず全体的な最適性を定式化する。
我々は、最適から最小限の最適な理想的な特性から治療を報告できる潜在ランクを推測する。
論文 参考訳(メタデータ) (2024-10-23T07:00:35Z) - Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。
政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。
本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T08:16:30Z) - Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0]
本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文 参考訳(メタデータ) (2024-03-30T02:33:39Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Stage-Aware Learning for Dynamic Treatments [3.6923632650826486]
動的治療体制のための新しい個別化学習法を提案する。
観測軌道が最適処理と完全に一致しなければならないという制約を緩和することにより,本手法はIPWE法における試料効率と安定性を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-30T06:35:31Z) - Safe and Interpretable Estimation of Optimal Treatment Regimes [54.257304443780434]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。
本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文 参考訳(メタデータ) (2023-10-23T19:59:10Z) - Optimal and Fair Encouragement Policy Evaluation and Learning [11.712023983596914]
本研究は, 陽性の潜在的な違反を含む最適治療規則の因果同定とロバストな評価について検討した。
一般制約下でのパラメタライズされたポリシークラスを解くための2段階のアルゴリズムを開発し、分散感応的後悔境界を求める。
本研究は, SNAP給付のリマインダーデータ, 保険申請の無作為化促進, および電子監視による事前管理リリースに基づく3つのケーススタディである。
論文 参考訳(メタデータ) (2023-09-12T20:45:30Z) - Understanding the Effect of Stochasticity in Policy Optimization [86.7574122154668]
最適化手法の優位性は、正確な勾配が用いられるかどうかに大きく依存することを示す。
次に,政策最適化におけるコミット率の概念を紹介する。
第三に、外部のオラクル情報がない場合には、収束を加速するために幾何を利用することと、最適性をほぼ確実に達成することとの間に本質的にトレードオフがあることが示される。
論文 参考訳(メタデータ) (2021-10-29T06:35:44Z) - On Inductive Biases for Heterogeneous Treatment Effect Estimation [91.3755431537592]
我々は、異なる治療下で、個人の潜在的成果(PO)の構造的類似性を利用する方法について検討する。
この問題を克服するために、エンドツーエンドの学習戦略を3つ比較する。
論文 参考訳(メタデータ) (2021-06-07T16:30:46Z) - Median Optimal Treatment Regimes [7.241149193573696]
コンディショナーが治療中よりも高い個人を治療する新しいメディアン最適治療体制を提案します。
これにより、同じグループの個人に対する最適な決定が、グループのごく一部に過度に影響されないことが保証される。
本稿では,政策の全体的中央値処理結果を要約した新しい評価尺度ACME(Average Conditional Median Effect)を紹介する。
論文 参考訳(メタデータ) (2021-03-02T15:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。