論文の概要: Deep Attention Q-Network for Personalized Treatment Recommendation
- arxiv url: http://arxiv.org/abs/2307.01519v1
- Date: Tue, 4 Jul 2023 07:00:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 17:56:51.484064
- Title: Deep Attention Q-Network for Personalized Treatment Recommendation
- Title(参考訳): パーソナライズされた治療推薦のための深層注意qネットワーク
- Authors: Simin Ma, Junghwan Lee, Nicoleta Serban, Shihao Yang
- Abstract要約: パーソナライズされた治療レコメンデーションのためのDeep Attention Q-Networkを提案する。
深い強化学習フレームワーク内のTransformerアーキテクチャは、過去のすべての患者の観察を効率的に取り入れている。
実世界の敗血症と急性低血圧コホートにおけるモデルの評価を行い、最先端モデルよりも優れていることを示した。
- 参考スコア(独自算出の注目度): 1.6631602844999724
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Tailoring treatment for individual patients is crucial yet challenging in
order to achieve optimal healthcare outcomes. Recent advances in reinforcement
learning offer promising personalized treatment recommendations; however, they
rely solely on current patient observations (vital signs, demographics) as the
patient's state, which may not accurately represent the true health status of
the patient. This limitation hampers policy learning and evaluation, ultimately
limiting treatment effectiveness. In this study, we propose the Deep Attention
Q-Network for personalized treatment recommendations, utilizing the Transformer
architecture within a deep reinforcement learning framework to efficiently
incorporate all past patient observations. We evaluated the model on real-world
sepsis and acute hypotension cohorts, demonstrating its superiority to
state-of-the-art models. The source code for our model is available at
https://github.com/stevenmsm/RL-ICU-DAQN.
- Abstract(参考訳): 個別の患者に対する治療の調整は、最適な医療成果を得るためには極めて困難である。
強化学習の最近の進歩は、有望なパーソナライズされた治療レコメンデーションを提供するが、それらは患者の状態として、患者の真の健康状態を正確に表現しない現在の患者観察(視覚標識、人口統計)にのみ依存している。
この制限は政策学習と評価を妨げ、最終的に治療効果を制限する。
本研究では,過去の患者観察を効率的に取り入れるために,深層強化学習フレームワーク内のトランスフォーマーアーキテクチャを活用して,パーソナライズされた治療推奨のための深層注意qネットワークを提案する。
実世界の敗血症と急性低血圧コホートに関するモデルを評価し,最新モデルよりも優れていることを示した。
私たちのモデルのソースコードはhttps://github.com/stevenmsm/RL-ICU-DAQNで公開されています。
関連論文リスト
- Safe and Interpretable Estimation of Optimal Treatment Regimes [54.257304443780434]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。
本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文 参考訳(メタデータ) (2023-10-23T19:59:10Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Learning Optimal Treatment Strategies for Sepsis Using Offline
Reinforcement Learning in Continuous Space [4.031538204818658]
本稿では,臨床医がリアルタイム治療に最適な基準選択を推奨するのに役立つ,歴史的データに基づく新しい医療決定モデルを提案する。
本モデルでは, オフライン強化学習と深層強化学習を組み合わせることで, 医療における従来の強化学習が環境と相互作用できない問題に対処する。
論文 参考訳(メタデータ) (2022-06-22T16:17:21Z) - Optimal discharge of patients from intensive care via a data-driven
policy learning framework [58.720142291102135]
退院課題は、退院期間の短縮と退院決定後の退院や死亡のリスクとの不確実なトレードオフに対処することが重要である。
本研究は、このトレードオフを捉えるためのエンドツーエンドの汎用フレームワークを導入し、最適放電タイミング決定を推奨する。
データ駆動型アプローチは、患者の生理的状態を捉えた同種で離散的な状態空間表現を導出するために用いられる。
論文 参考訳(メタデータ) (2021-12-17T04:39:33Z) - Development of patients triage algorithm from nationwide COVID-19
registry data based on machine learning [1.0323063834827415]
本稿では,機械学習技術を用いた重症度評価モデルの開発過程について述べる。
モデルは基本的な患者の基本的個人データのみを必要とするため、患者は自身の重症度を判断できる。
本研究の目的は、患者が自身の重症度をチェックできる医療システムを構築し、同様の重症度を持つ他の患者の過去の治療内容に基づいて、適切な診療所への訪問を通知することである。
論文 参考訳(メタデータ) (2021-09-18T19:56:27Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - An Empirical Study of Representation Learning for Reinforcement Learning
in Healthcare [19.50370829781689]
我々はMIMIC-IIIデータセットにおける敗血症患者のデータを用いて患者の状態を表現した。
逐次的に形成された状態表現は、バッチ設定において効果的なポリシー学習を促進する。
論文 参考訳(メタデータ) (2020-11-23T06:37:08Z) - Optimizing Medical Treatment for Sepsis in Intensive Care: from
Reinforcement Learning to Pre-Trial Evaluation [2.908482270923597]
本研究の目的は, 介入を最適化する強化学習(RL)が, 学習方針の治験に対する規制に適合する経路を遡及的に得る枠組みを確立することである。
我々は,死の主な原因の一つであり,複雑で不透明な患者動態のため治療が困難である集中治療室の感染症に焦点を当てた。
論文 参考訳(メタデータ) (2020-03-13T20:31:47Z) - Estimating Counterfactual Treatment Outcomes over Time Through
Adversarially Balanced Representations [114.16762407465427]
時間とともに治療効果を推定するためにCRN(Counterfactual Recurrent Network)を導入する。
CRNは、患者履歴のバランスの取れた表現を構築するために、ドメイン敵のトレーニングを使用する。
本モデルでは, 正解率の予測と適切な治療時期の選択において, 誤差の低減を図っている。
論文 参考訳(メタデータ) (2020-02-10T20:47:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。