論文の概要: Relative Sparsity for Medical Decision Problems
- arxiv url: http://arxiv.org/abs/2211.16566v3
- Date: Fri, 31 Mar 2023 13:31:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 20:34:43.550937
- Title: Relative Sparsity for Medical Decision Problems
- Title(参考訳): 医学的意思決定問題に対する相対的スパーシティ
- Authors: Samuel J. Weisenthal, Sally W. Thurston, Ashkan Ertefaie
- Abstract要約: 医療提供者や患者に対して、新しい方針が現在のケアの基準とどのように異なるかを説明することが重要であることが多い。
我々は,lambda$を選択し,シミュレーションを行い,実際の医療データセットを用いて本手法を説明するための基準を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing statistical methods can estimate a policy, or a mapping from
covariates to decisions, which can then instruct decision makers (e.g., whether
to administer hypotension treatment based on covariates blood pressure and
heart rate). There is great interest in using such data-driven policies in
healthcare. However, it is often important to explain to the healthcare
provider, and to the patient, how a new policy differs from the current
standard of care. This end is facilitated if one can pinpoint the aspects of
the policy (i.e., the parameters for blood pressure and heart rate) that change
when moving from the standard of care to the new, suggested policy. To this
end, we adapt ideas from Trust Region Policy Optimization (TRPO). In our work,
however, unlike in TRPO, the difference between the suggested policy and
standard of care is required to be sparse, aiding with interpretability. This
yields ``relative sparsity," where, as a function of a tuning parameter,
$\lambda$, we can approximately control the number of parameters in our
suggested policy that differ from their counterparts in the standard of care
(e.g., heart rate only). We propose a criterion for selecting $\lambda$,
perform simulations, and illustrate our method with a real, observational
healthcare dataset, deriving a policy that is easy to explain in the context of
the current standard of care. Our work promotes the adoption of data-driven
decision aids, which have great potential to improve health outcomes.
- Abstract(参考訳): 既存の統計手法では、政策や、共変量から意思決定へのマッピングを推定することができ、意思決定者(例えば、血圧と心拍率に基づいて低血圧治療を行うか)を指示することができる。
医療においてこのようなデータ駆動ポリシーを使うことには大きな関心がある。
しかし、医療提供者や患者に対して、新しいポリシーが現在のケアの標準とどのように異なるかを説明することは、しばしば重要である。
この目的は、ケアの基準から新しいポリシーに移行する際に変化するポリシー(すなわち血圧と心拍率のパラメータ)の側面を特定することができれば促進される。
この目的のために,信頼地域政策最適化(TRPO)の考え方を適用した。
しかし,我々の研究では,trpoと異なり,提案する方針とケアの標準との差異は,解釈可能性とともにスパースすることが求められている。
これにより `relative sparsity" が得られ、チューニングパラメータの関数である $\lambda$ として、ケアの標準(例えば心拍数のみ)において、推奨ポリシーのパラメータ数と異なるパラメータの数を概ね制御できる。
我々は,現在のケア標準の文脈で説明が容易なポリシーを導出し,$\lambda$を選択し,シミュレーションを行い,実際の医療データセットを用いて我々の方法を記述するための基準を提案する。
我々の研究は、データ駆動型意思決定支援の導入を促進し、健康的な結果を改善する大きな可能性を秘めている。
関連論文リスト
- Policy Learning with Distributional Welfare [1.0742675209112622]
治療選択に関する文献の多くは、条件平均治療効果(ATE)に基づく実用的福祉を考慮したものである。
本稿では,個別処理効果(QoTE)の条件量子化に基づく処理を最適に割り当てる政策を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:51:30Z) - Inference for relative sparsity [0.0]
医学応用においては,不確実性の特徴付けが不可欠であるため,相対的疎度目的関数の推論が重要である。
相対的な空間的目的は不安定で二項作用の場合において無限に推定される不注意な値関数に依存するため、推論は困難である。
これらの課題に対処するため、相対的疎度目標内に重み付けされた信頼地域政策最適化機能を組み込み、適応的相対的疎度ペナルティを実装し、選択後推論のためのサンプル分割フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-25T17:14:45Z) - Conformal Off-Policy Evaluation in Markov Decision Processes [53.786439742572995]
強化学習は、データから効率的な制御ポリシーを特定し評価することを目的としている。
この学習タスクのほとんどの方法は、Off-Policy Evaluation (OPE)と呼ばれ、正確さと確実性を保証するものではない。
本稿では,目標方針の真報を含む区間を所定の確信度で出力するコンフォーマル予測に基づく新しいOPE手法を提案する。
論文 参考訳(メタデータ) (2023-04-05T16:45:11Z) - Evaluating COVID-19 vaccine allocation policies using Bayesian $m$-top
exploration [53.122045119395594]
マルチアーム・バンディット・フレームワークを用いてワクチンのアロケーション戦略を評価する新しい手法を提案する。
$m$-top Exploringにより、アルゴリズムは最高のユーティリティを期待する$m$ポリシーを学ぶことができる。
ベルギーのCOVID-19流行を個人モデルSTRIDEを用いて検討し、予防接種方針のセットを学習する。
論文 参考訳(メタデータ) (2023-01-30T12:22:30Z) - Policy Learning with Asymmetric Counterfactual Utilities [0.6138671548064356]
非対称対実効関数を用いた最適政策学習について検討する。
最大電力損失を最小にすることで、最小限の決定ルールを導出する。
中間分類問題を解くことにより、観測データから最小損失決定ルールを学習できることが示される。
論文 参考訳(メタデータ) (2022-06-21T15:44:49Z) - Identification of Subgroups With Similar Benefits in Off-Policy Policy
Evaluation [60.71312668265873]
我々は,パーソナライズの必要性と自信ある予測とのバランスをとる方法を開発した。
本手法は不均一な治療効果の正確な予測に有効であることを示す。
論文 参考訳(メタデータ) (2021-11-28T23:19:12Z) - Privacy-Constrained Policies via Mutual Information Regularized Policy Gradients [54.98496284653234]
報酬を最大化しつつ、行動を通じて特定の機密状態変数の開示を最小限に抑えながら、報酬を最大化する政策を訓練する課題を考察する。
本稿では, 感性状態と行動の相互情報に基づく正則化器を導入することで, この問題を解決する。
プライバシ制約のあるポリシーを最適化するためのモデルベース推定器を開発した。
論文 参考訳(メタデータ) (2020-12-30T03:22:35Z) - Offline Policy Selection under Uncertainty [113.57441913299868]
我々は、オフラインポリシーの選択を、一定の経験データセットを与えられた政策予測のセットよりも学習の選好とみなす。
政策価値に対する信念に対する完全な分布へのアクセスは、より幅広い下流評価指標の下でより柔軟な選択アルゴリズムを可能にする。
BayesDICEが任意の下流ポリシー選択メトリックに関してポリシーのランク付けにどのように使用されるかを示します。
論文 参考訳(メタデータ) (2020-12-12T23:09:21Z) - Doubly Robust Off-Policy Value and Gradient Estimation for Deterministic
Policies [80.42316902296832]
本研究では,行動継続時の非政治データから決定論的政策の政策値と勾配を推定する。
この設定では、密度比が存在しないため、標準重要度サンプリングとポリシー値と勾配の2倍の頑健な推定が失敗する。
異なるカーネル化アプローチに基づく2つの新しい頑健な推定器を提案する。
論文 参考訳(メタデータ) (2020-06-06T15:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。