論文の概要: POETREE: Interpretable Policy Learning with Adaptive Decision Trees
- arxiv url: http://arxiv.org/abs/2203.08057v1
- Date: Tue, 15 Mar 2022 16:50:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 18:27:49.243320
- Title: POETREE: Interpretable Policy Learning with Adaptive Decision Trees
- Title(参考訳): POETREE: 適応決定木を用いた解釈可能な政策学習
- Authors: Aliz\'ee Pace, Alex J. Chan, Mihaela van der Schaar
- Abstract要約: POETREEは、ポリシー学習を解釈するための新しいフレームワークである。
患者の観察と医療史に基づいて、医師の行動を決定する確率的ツリーポリシーを構築する。
これは、リアルおよび合成医療データセットの最先端を上回ります。
- 参考スコア(独自算出の注目度): 78.6363825307044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building models of human decision-making from observed behaviour is critical
to better understand, diagnose and support real-world policies such as clinical
care. As established policy learning approaches remain focused on imitation
performance, they fall short of explaining the demonstrated decision-making
process. Policy Extraction through decision Trees (POETREE) is a novel
framework for interpretable policy learning, compatible with fully-offline and
partially-observable clinical decision environments -- and builds probabilistic
tree policies determining physician actions based on patients' observations and
medical history. Fully-differentiable tree architectures are grown
incrementally during optimization to adapt their complexity to the modelling
task, and learn a representation of patient history through recurrence,
resulting in decision tree policies that adapt over time with patient
information. This policy learning method outperforms the state-of-the-art on
real and synthetic medical datasets, both in terms of understanding,
quantifying and evaluating observed behaviour as well as in accurately
replicating it -- with potential to improve future decision support systems.
- Abstract(参考訳): 観察された行動から人間の意思決定モデルを構築することは、臨床ケアのような現実世界の政策をよりよく理解し、診断し、支援するために重要である。
確立された政策学習アプローチは依然として模倣のパフォーマンスに重点を置いているため、実証された意思決定プロセスの説明には至らない。
意思決定木による政策抽出(PoETREE)は、患者の観察と医療史に基づいて医師の行動を決定する確率的ツリーポリシーを構築し、完全オフラインかつ部分的に観察可能な臨床決定環境と互換性のある、ポリシー学習を解釈可能な新しいフレームワークである。
完全微分可能なツリーアーキテクチャは、最適化の間に徐々に成長し、その複雑さをモデリングタスクに適応させ、再発を通じて患者の履歴の表現を学習し、患者の情報に時間とともに適応する決定木ポリシーをもたらす。
このポリシー学習手法は、観察された行動の理解、定量化、正確に再現することだけでなく、将来の意思決定支援システムを改善する可能性についても、現実および合成医療データセットの最先端を上回っている。
関連論文リスト
- Explaining by Imitating: Understanding Decisions by Interpretable Policy
Learning [72.80902932543474]
観察されたデータから人間の行動を理解することは、意思決定における透明性と説明責任にとって重要である。
意思決定者の方針をモデル化することが困難である医療などの現実的な設定を考えてみましょう。
本稿では, 設計による透明性の向上, 部分観測可能性の確保, 完全にオフラインで動作可能なデータ駆動型意思決定行動の表現を提案する。
論文 参考訳(メタデータ) (2023-10-28T13:06:14Z) - Contextualized Policy Recovery: Modeling and Interpreting Medical Decisions with Adaptive Imitation Learning [39.093299601701474]
解釈可能な政策学習は、観察された行動から無知な決定ポリシーを推定しようとする。
既存のアプローチは、基本的な決定プロセスを普遍的なポリシーとして表現するため、このトレードオフによって負担される。
我々は,複雑な意思決定プロセスのモデリング問題をマルチタスク学習問題として再構成する,文脈対応型政策回復(CPR)を開発する。
論文 参考訳(メタデータ) (2023-10-11T22:17:37Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Assisting clinical practice with fuzzy probabilistic decision trees [2.0999441362198907]
本研究では,確率木とファジィ論理を組み合わせて臨床実習を支援する新しい手法であるFPTを提案する。
FPTとその予測は、この目的のために特別に設計されたユーザフレンドリーなインターフェースを用いて、直感的に臨床実践を支援することができることを示す。
論文 参考訳(メタデータ) (2023-04-16T14:05:16Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - What Do You See in this Patient? Behavioral Testing of Clinical NLP
Models [69.09570726777817]
本稿では,入力の変化に関する臨床結果モデルの振る舞いを評価する拡張可能なテストフレームワークを提案する。
私たちは、同じデータを微調整しても、モデル行動は劇的に変化し、最高のパフォーマンスのモデルが常に最も医学的に可能なパターンを学習していないことを示しています。
論文 参考訳(メタデータ) (2021-11-30T15:52:04Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - An Empirical Study of Representation Learning for Reinforcement Learning
in Healthcare [19.50370829781689]
我々はMIMIC-IIIデータセットにおける敗血症患者のデータを用いて患者の状態を表現した。
逐次的に形成された状態表現は、バッチ設定において効果的なポリシー学習を促進する。
論文 参考訳(メタデータ) (2020-11-23T06:37:08Z) - Optimizing Medical Treatment for Sepsis in Intensive Care: from
Reinforcement Learning to Pre-Trial Evaluation [2.908482270923597]
本研究の目的は, 介入を最適化する強化学習(RL)が, 学習方針の治験に対する規制に適合する経路を遡及的に得る枠組みを確立することである。
我々は,死の主な原因の一つであり,複雑で不透明な患者動態のため治療が困難である集中治療室の感染症に焦点を当てた。
論文 参考訳(メタデータ) (2020-03-13T20:31:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。