論文の概要: Relative Sparsity for Medical Decision Problems
- arxiv url: http://arxiv.org/abs/2211.16566v1
- Date: Tue, 29 Nov 2022 20:00:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 18:09:54.301878
- Title: Relative Sparsity for Medical Decision Problems
- Title(参考訳): 医学的意思決定問題に対する相対的スパーシティ
- Authors: Samuel J. Weisenthal, Sally W. Thurston, Ashkan Ertefaie
- Abstract要約: 医療提供者や患者に対して、新しい方針が現在のケアの基準とどのように異なるかを説明することが重要であることが多い。
この目的は、ケアの標準から、提案された新しいポリシーに移行する際に最も変化するポリシーの側面(すなわちパラメータ)を特定できれば促進される。
しかし,本研究では,提案方針とケア基準の相違は軽視され,解釈可能性に寄与することが求められている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing statistical methods can be used to estimate a policy, or a mapping
from covariates to decisions, which can then instruct decision makers. There is
great interest in using such data-driven policies in healthcare. In healthcare,
however, it is often important to explain to the healthcare provider, and to
the patient, how a new policy differs from the current standard of care. This
end is facilitated if one can pinpoint the aspects (i.e., parameters) of the
policy that change most when moving from the standard of care to the new,
suggested policy. To this end, we adapt ideas from Trust Region Policy
Optimization. In our work, however, unlike in Trust Region Policy Optimization,
the difference between the suggested policy and standard of care is required to
be sparse, aiding with interpretability. In particular, we trade off between
maximizing expected reward and minimizing the $L_1$ norm divergence between the
parameters of the two policies. This yields "relative sparsity," where, as a
function of a tuning parameter, $\lambda$, we can approximately control the
number of parameters in our suggested policy that differ from their
counterparts in the standard of care. We develop our methodology for the
observational data setting. We propose a problem-specific criterion for
selecting $\lambda$, perform simulations, and illustrate our method with a
real, observational healthcare dataset, deriving a policy that is easy to
explain in the context of the current standard of care. Our work promotes the
adoption of data-driven decision aids, which have great potential to improve
health outcomes.
- Abstract(参考訳): 既存の統計手法は、政策を推定したり、共変量から意思決定へのマッピングに利用することができる。
医療においてこのようなデータ駆動ポリシーを使うことには大きな関心がある。
しかし、医療においては、医療提供者や患者に対して、新しいポリシーが現在のケアの標準とどのように異なるかを説明することがしばしば重要である。
この目的は、ケアの標準から、提案された新しいポリシーに移行する際に最も変化するポリシーの側面(すなわちパラメータ)を特定できれば促進される。
この目的のために、信頼地域政策最適化の考え方を適用します。
しかし,信頼領域の政策最適化とは異なり,提案する政策とケアの標準との差異は,解釈可能性に資する一方でスパースである必要がある。
特に、期待される報酬の最大化と、2つのポリシーのパラメータ間の標準偏差の最小化をトレードオフする。
これは「相対的スパーシティ」となり、チューニングパラメータの関数である$\lambda$として、ケアの標準において、提案するポリシーのパラメータ数と異なるパラメータの数を概ね制御できる。
我々は観測データ設定のための方法論を開発した。
我々は,$\lambda$を選択し,シミュレーションを行い,実際の観察的医療データセットを用いて,現在のケア標準の文脈で説明しやすいポリシーを導出して,その方法を説明するための問題固有の基準を提案する。
我々の研究は、データ駆動型意思決定支援の導入を促進し、健康的な結果を改善する大きな可能性を秘めている。
関連論文リスト
- Policy Learning with Distributional Welfare [1.0742675209112622]
治療選択に関する文献の多くは、条件平均治療効果(ATE)に基づく実用的福祉を考慮したものである。
本稿では,個別処理効果(QoTE)の条件量子化に基づく処理を最適に割り当てる政策を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:51:30Z) - Inference for relative sparsity [0.0]
医学応用においては,不確実性の特徴付けが不可欠であるため,相対的疎度目的関数の推論が重要である。
相対的な空間的目的は不安定で二項作用の場合において無限に推定される不注意な値関数に依存するため、推論は困難である。
これらの課題に対処するため、相対的疎度目標内に重み付けされた信頼地域政策最適化機能を組み込み、適応的相対的疎度ペナルティを実装し、選択後推論のためのサンプル分割フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-25T17:14:45Z) - Conformal Off-Policy Evaluation in Markov Decision Processes [53.786439742572995]
強化学習は、データから効率的な制御ポリシーを特定し評価することを目的としている。
この学習タスクのほとんどの方法は、Off-Policy Evaluation (OPE)と呼ばれ、正確さと確実性を保証するものではない。
本稿では,目標方針の真報を含む区間を所定の確信度で出力するコンフォーマル予測に基づく新しいOPE手法を提案する。
論文 参考訳(メタデータ) (2023-04-05T16:45:11Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Policy Learning with Asymmetric Counterfactual Utilities [0.6138671548064356]
非対称対実効関数を用いた最適政策学習について検討する。
最大電力損失を最小にすることで、最小限の決定ルールを導出する。
中間分類問題を解くことにより、観測データから最小損失決定ルールを学習できることが示される。
論文 参考訳(メタデータ) (2022-06-21T15:44:49Z) - Identification of Subgroups With Similar Benefits in Off-Policy Policy
Evaluation [60.71312668265873]
我々は,パーソナライズの必要性と自信ある予測とのバランスをとる方法を開発した。
本手法は不均一な治療効果の正確な予測に有効であることを示す。
論文 参考訳(メタデータ) (2021-11-28T23:19:12Z) - Privacy-Constrained Policies via Mutual Information Regularized Policy Gradients [54.98496284653234]
報酬を最大化しつつ、行動を通じて特定の機密状態変数の開示を最小限に抑えながら、報酬を最大化する政策を訓練する課題を考察する。
本稿では, 感性状態と行動の相互情報に基づく正則化器を導入することで, この問題を解決する。
プライバシ制約のあるポリシーを最適化するためのモデルベース推定器を開発した。
論文 参考訳(メタデータ) (2020-12-30T03:22:35Z) - Offline Policy Selection under Uncertainty [113.57441913299868]
我々は、オフラインポリシーの選択を、一定の経験データセットを与えられた政策予測のセットよりも学習の選好とみなす。
政策価値に対する信念に対する完全な分布へのアクセスは、より幅広い下流評価指標の下でより柔軟な選択アルゴリズムを可能にする。
BayesDICEが任意の下流ポリシー選択メトリックに関してポリシーのランク付けにどのように使用されるかを示します。
論文 参考訳(メタデータ) (2020-12-12T23:09:21Z) - Doubly Robust Off-Policy Value and Gradient Estimation for Deterministic
Policies [80.42316902296832]
本研究では,行動継続時の非政治データから決定論的政策の政策値と勾配を推定する。
この設定では、密度比が存在しないため、標準重要度サンプリングとポリシー値と勾配の2倍の頑健な推定が失敗する。
異なるカーネル化アプローチに基づく2つの新しい頑健な推定器を提案する。
論文 参考訳(メタデータ) (2020-06-06T15:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。