Fugu-MT 論文翻訳(概要): Treatment Allocation with Strategic Agents

論文の概要: Treatment Allocation with Strategic Agents

arxiv url: http://arxiv.org/abs/2011.06528v5
Date: Tue, 4 Apr 2023 21:44:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-06 17:10:33.786570
Title: Treatment Allocation with Strategic Agents
Title（参考訳）: 戦略エージェントによる治療割り当て
Authors: Evan Munro
Abstract要約: 最適規則はランダム化を伴い,100%未満の確率で治療をアロケートし,治療に対して平均的に正の反応を示した者に対しても有効であることを示す。本研究では,ベイズ最適化に基づく逐次的実験を提案し,個別の戦略行動に関するパラメトリックな仮定を伴わない最適処理規則に収束する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: There is increasing interest in allocating treatments based on observed individual characteristics: examples include targeted marketing, individualized credit offers, and heterogeneous pricing. Treatment personalization introduces incentives for individuals to modify their behavior to obtain a better treatment. Strategic behavior shifts the joint distribution of covariates and potential outcomes. The optimal rule without strategic behavior allocates treatments only to those with a positive Conditional Average Treatment Effect. With strategic behavior, we show that the optimal rule can involve randomization, allocating treatments with less than 100% probability even to those who respond positively on average to the treatment. We propose a sequential experiment based on Bayesian Optimization that converges to the optimal treatment rule without parametric assumptions on individual strategic behavior.
Abstract（参考訳）: 例えば、ターゲットマーケティング、個別のクレジットオファー、異種価格などである。治療のパーソナライゼーションは、個人がより良い治療を得るために行動を変えるインセンティブをもたらす。戦略行動は共変量と潜在的な結果の同時分布をシフトさせる。戦略的行動のない最適規則は、前向きな条件平均治療効果を有する者にのみ治療を割り当てる。戦略行動において, 最適ルールはランダム化を伴い, 平均的に正の反応を示した者でも100%未満の確率で治療を割り当てることができることを示した。本研究では,ベイズ最適化に基づく逐次実験を提案し,個別の戦略行動に関するパラメトリックな仮定を伴わない最適処理規則に収束する。

関連論文リスト

Indefinite causal order strategy nor adaptive strategy does not improve the estimation of group action [53.64687146666141]
可能ユニタリ演算の集合がコンパクト群の射影ユニタリ表現によって与えられるとき、未知ユニタリ演算の推定を考える。誤差関数が群共分散を満たす場合,不確定因果順序戦略や適応戦略は,この推定性能を向上しないことを示す。
論文参考訳（メタデータ） (2025-01-16T06:00:57Z)
When Is Heterogeneity Actionable for Personalization? [0.0]
パーソナライゼーションは、A/Bテストにおける最高のパフォーマンスの処置を全員に割り当てる統一的なポリシーを超えて、結果を改善するために使用することができる。我々は「作用可能な不均一性」を定量化する統計モデルを開発する。
論文参考訳（メタデータ） (2024-11-25T16:37:17Z)
Ranking of Multi-Response Experiment Treatments [0.4711628883579317]
複数応答実験における最適処理を推定するための確率的ランキングモデルを提案する。この枠組みでは、治療ランクの点から、まず全体的な最適性を定式化する。我々は、最適から最小限の最適な理想的な特性から治療を報告できる潜在ランクを推測する。
論文参考訳（メタデータ） (2024-10-23T07:00:35Z)
Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文参考訳（メタデータ） (2024-05-26T05:38:50Z)
Reduced-Rank Multi-objective Policy Learning and Optimization [57.978477569678844]
実際には、因果研究者は先験を念頭において1つの結果を持っていない。政府支援の社会福祉プログラムでは、政策立案者は貧困の多次元的性質を理解するために多くの成果を集めている。本稿では、最適政策学習の文脈において、複数の結果に対するデータ駆動型次元性推論手法を提案する。
論文参考訳（メタデータ） (2024-04-29T08:16:30Z)
Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0]
本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文参考訳（メタデータ） (2024-03-30T02:33:39Z)
Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。本手法は, 精度の高い問題に特に適している。提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文参考訳（メタデータ） (2023-11-08T00:10:21Z)
Stage-Aware Learning for Dynamic Treatments [3.6923632650826486]
動的治療体制のための新しい個別化学習法を提案する。観測軌道が最適処理と完全に一致しなければならないという制約を緩和することにより,本手法はIPWE法における試料効率と安定性を大幅に改善する。
論文参考訳（メタデータ） (2023-10-30T06:35:31Z)
Safe and Interpretable Estimation of Optimal Treatment Regimes [54.257304443780434]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文参考訳（メタデータ） (2023-10-23T19:59:10Z)
Optimal and Fair Encouragement Policy Evaluation and Learning [11.712023983596914]
本研究は, 陽性の潜在的な違反を含む最適治療規則の因果同定とロバストな評価について検討した。一般制約下でのパラメタライズされたポリシークラスを解くための2段階のアルゴリズムを開発し、分散感応的後悔境界を求める。本研究は, SNAP給付のリマインダーデータ, 保険申請の無作為化促進, および電子監視による事前管理リリースに基づく3つのケーススタディである。
論文参考訳（メタデータ） (2023-09-12T20:45:30Z)
Understanding the Effect of Stochasticity in Policy Optimization [86.7574122154668]
最適化手法の優位性は、正確な勾配が用いられるかどうかに大きく依存することを示す。次に,政策最適化におけるコミット率の概念を紹介する。第三に、外部のオラクル情報がない場合には、収束を加速するために幾何を利用することと、最適性をほぼ確実に達成することとの間に本質的にトレードオフがあることが示される。
論文参考訳（メタデータ） (2021-10-29T06:35:44Z)
On Inductive Biases for Heterogeneous Treatment Effect Estimation [91.3755431537592]
我々は、異なる治療下で、個人の潜在的成果(PO)の構造的類似性を利用する方法について検討する。この問題を克服するために、エンドツーエンドの学習戦略を3つ比較する。
論文参考訳（メタデータ） (2021-06-07T16:30:46Z)
Median Optimal Treatment Regimes [7.241149193573696]
コンディショナーが治療中よりも高い個人を治療する新しいメディアン最適治療体制を提案します。これにより、同じグループの個人に対する最適な決定が、グループのごく一部に過度に影響されないことが保証される。本稿では,政策の全体的中央値処理結果を要約した新しい評価尺度ACME(Average Conditional Median Effect)を紹介する。
論文参考訳（メタデータ） (2021-03-02T15:26:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。