論文の概要: Learning Optimal Distributionally Robust Individualized Treatment Rules
- arxiv url: http://arxiv.org/abs/2006.15121v1
- Date: Fri, 26 Jun 2020 17:24:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 21:13:52.956207
- Title: Learning Optimal Distributionally Robust Individualized Treatment Rules
- Title(参考訳): 最適分布ロバスト個別処理規則の学習
- Authors: Weibin Mo, Zhengling Qi, Yufeng Liu
- Abstract要約: 政策立案者は、期待される結果、すなわち値関数を最大化する、最も個別化された待遇規則(ITR)を策定する。
既存の方法は、トレーニングとテストの分布が同じであると仮定する。
本稿では,最悪の値関数を最大化する分散ロバストなITRフレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.872376323711463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent development in the data-driven decision science has seen great
advances in individualized decision making. Given data with individual
covariates, treatment assignments and outcomes, policy makers best
individualized treatment rule (ITR) that maximizes the expected outcome, known
as the value function. Many existing methods assume that the training and
testing distributions are the same. However, the estimated optimal ITR may have
poor generalizability when the training and testing distributions are not
identical. In this paper, we consider the problem of finding an optimal ITR
from a restricted ITR class where there is some unknown covariate changes
between the training and testing distributions. We propose a novel
distributionally robust ITR (DR-ITR) framework that maximizes the worst-case
value function across the values under a set of underlying distributions that
are "close" to the training distribution. The resulting DR-ITR can guarantee
the performance among all such distributions reasonably well. We further
propose a calibrating procedure that tunes the DR-ITR adaptively to a small
amount of calibration data from a target population. In this way, the
calibrated DR-ITR can be shown to enjoy better generalizability than the
standard ITR based on our numerical studies.
- Abstract(参考訳): データ駆動型意思決定科学の最近の発展は、個別化意思決定において大きな進歩を遂げている。
個々の共変量、治療課題、成果を含むデータを与えられた政策立案者は、期待される結果、すなわち値関数を最大化する最も個人化された治療規則(ITR)を策定する。
既存の方法の多くは、トレーニングとテストの分布が同じであると仮定している。
しかし、推定最適ITRは、トレーニングとテストの分布が同一でない場合、一般化性が低い可能性がある。
本稿では、トレーニング分布とテスト分布の間に未知の共変量変化が存在する制限付きitrクラスから最適なitrを求める問題を考える。
本稿では,トレーニング分布に"近接"する基礎分布の集合の下で,各値の最悪の値関数を最大化する,新しい分散ロバストなITR(DR-ITR)フレームワークを提案する。
結果のDR-ITRは、これらの分布間の性能を合理的に保証することができる。
さらに,ターゲット集団からの少量の校正データに対してdr-itrを適応的に調整する校正手順を提案する。
このように、校正された dr-itr は、我々の数値研究に基づいて標準の itr よりも優れた一般化性を示すことができる。
関連論文リスト
- DRAUC: An Instance-wise Distributionally Robust AUC Optimization
Framework [133.26230331320963]
ROC曲線のエリア(AUC)は、長い尾の分類のシナリオにおいて広く用いられている指標である。
本研究では,分散ロバストAUC(DRAUC)のインスタンスワイドサロゲート損失を提案し,その上に最適化フレームワークを構築した。
論文 参考訳(メタデータ) (2023-11-06T12:15:57Z) - Safe Deployment for Counterfactual Learning to Rank with Exposure-Based
Risk Minimization [63.93275508300137]
本稿では,安全な配置を理論的に保証する新たなリスク認識型対実学習ランク法を提案する。
提案手法の有効性を実験的に検証し,データが少ない場合の動作不良の早期回避に有効であることを示す。
論文 参考訳(メタデータ) (2023-04-26T15:54:23Z) - Policy Evaluation in Distributional LQR [70.63903506291383]
ランダムリターンの分布を閉形式で表現する。
この分布は有限個の確率変数で近似できることを示す。
近似回帰分布を用いて,リスク・アバースLQRに対するゼロ階ポリシー勾配アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-23T20:27:40Z) - Efficient and robust transfer learning of optimal individualized
treatment regimes with right-censored survival data [7.308241944759317]
個別治療体制(英: individualized treatment regime、ITR)は、患者の特徴に基づいて治療を割り当てる決定規則である。
本稿では、値関数の2倍頑健な推定器を提案し、その最適ITRは、予め指定されたIRRのクラス内の値関数を最大化することにより学習する。
重篤なメタボリックアシダ血症に対するバイカーボネートナトリウム療法のシミュレーションおよび実データによる評価を行った。
論文 参考訳(メタデータ) (2023-01-13T11:47:10Z) - Normality-Guided Distributional Reinforcement Learning for Continuous
Control [16.324313304691426]
平均戻り値の予測モデル、すなわち値関数の学習は多くの強化学習アルゴリズムにおいて重要な役割を果たす。
本研究では,複数の連続制御タスクにおける値分布について検討し,学習した値分布が正規に非常に近いことを示す。
本稿では,標準値関数に存在しない値分布の構造的特性によって測定された正当性に基づくポリシー更新戦略を提案する。
論文 参考訳(メタデータ) (2022-08-28T02:52:10Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Minimax Regret Optimization for Robust Machine Learning under
Distribution Shift [38.30154154957721]
未知のテスト分布下で学習モデルを評価した場合の学習シナリオを考察する。
DROの定式化は分布シフト時の一様に小さな後悔を保証しないことを示す。
ミニマックス回帰最適化 (Minimax Regret Optimization, MRO) という代替手法を提案する。
論文 参考訳(メタデータ) (2022-02-11T04:17:22Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Distributionally Robust Multi-Output Regression Ranking [3.9318191265352196]
DRMRR(Distributedally Robust Multi-output Regression Ranking)と呼ばれるリストワイズ学習ランクモデルを導入する。
DRMRRは分散ロバスト最適化フレームワークを使用して、経験的データ分布の近傍で最も有害な分布の下でのマルチ出力損失関数を最小化する。
本実験は,医用文書検索と薬物反応予測の2つの実世界の応用について行った。
論文 参考訳(メタデータ) (2021-09-27T05:19:27Z) - Learning Calibrated Uncertainties for Domain Shift: A Distributionally
Robust Learning Approach [150.8920602230832]
ドメインシフトの下で校正された不確実性を学習するためのフレームワークを提案する。
特に、密度比推定は、ターゲット(テスト)サンプルの近さをソース(トレーニング)分布に反映する。
提案手法は下流タスクに有利な校正不確実性を生成する。
論文 参考訳(メタデータ) (2020-10-08T02:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。