論文の概要: Deconfounding Actor-Critic Network with Policy Adaptation for Dynamic
Treatment Regimes
- arxiv url: http://arxiv.org/abs/2205.09852v1
- Date: Thu, 19 May 2022 20:53:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-23 13:38:25.217784
- Title: Deconfounding Actor-Critic Network with Policy Adaptation for Dynamic
Treatment Regimes
- Title(参考訳): 動的処理規則のポリシー適応によるアクター・クリティカルネットワークの分離
- Authors: Changchang Yin, Ruoqi Liu, Jeffrey Caterino, Ping Zhang
- Abstract要約: 我々は,患者に対する最適な治療方針を学習するために,新たにDAC(deconfounding actor-critic Network)を開発した。
非生存者に対する効果的な治療行為の処罰を避けるため,患者の即時健康状態の変化を捉えるための短期報酬を設計する。
1つの半合成と2つの異なる実世界のデータセットの実験結果は、提案したモデルが最先端のモデルより優れていることを示している。
- 参考スコア(独自算出の注目度): 8.705574459727202
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Despite intense efforts in basic and clinical research, an individualized
ventilation strategy for critically ill patients remains a major challenge.
Recently, dynamic treatment regime (DTR) with reinforcement learning (RL) on
electronic health records (EHR) has attracted interest from both the healthcare
industry and machine learning research community. However, most learned DTR
policies might be biased due to the existence of confounders. Although some
treatment actions non-survivors received may be helpful, if confounders cause
the mortality, the training of RL models guided by long-term outcomes (e.g.,
90-day mortality) would punish those treatment actions causing the learned DTR
policies to be suboptimal. In this study, we develop a new deconfounding
actor-critic network (DAC) to learn optimal DTR policies for patients. To
alleviate confounding issues, we incorporate a patient resampling module and a
confounding balance module into our actor-critic framework. To avoid punishing
the effective treatment actions non-survivors received, we design a short-term
reward to capture patients' immediate health state changes. Combining
short-term with long-term rewards could further improve the model performance.
Moreover, we introduce a policy adaptation method to successfully transfer the
learned model to new-source small-scale datasets. The experimental results on
one semi-synthetic and two different real-world datasets show the proposed
model outperforms the state-of-the-art models. The proposed model provides
individualized treatment decisions for mechanical ventilation that could
improve patient outcomes.
- Abstract(参考訳): 基礎研究や臨床研究の激しい取り組みにもかかわらず、重症患者に対する個別換気戦略は依然として大きな課題である。
近年、電子健康記録(EHR)に関する強化学習(RL)を伴う動的治療体制(DTR)が、医療産業と機械学習研究コミュニティの両方から関心を集めている。
しかし、ほとんどの学習されたDTRポリシーは、共同設立者の存在によってバイアスを受ける可能性がある。
もし共同設立者が死亡の原因となった場合、長期的結果(例えば90日間の死亡)によって導かれるRLモデルの訓練は、学習したDTRポリシーを最適にするためにこれらの治療行為を罰する。
本研究では,患者に対して最適なDTRポリシーを学習するための,DAC (Deconfounding actor-critic Network) を開発した。
コンファウンディングの問題を軽減するため,患者再サンプリングモジュールとコンファウンディングバランスモジュールをアクター批判フレームワークに組み込んだ。
非生存者の効果的な治療行為の処罰を避けるため,患者の即時健康状態の変化を捉えるための短期報酬を設計する。
短期報酬と長期報酬を組み合わせることで、モデルの性能がさらに向上する可能性がある。
さらに,学習モデルを新たな小規模データセットにうまく移行させるポリシ適応手法を提案する。
1つの半合成データと2つの異なる実世界のデータセットの実験結果は、提案されたモデルが最先端モデルを上回ることを示している。
提案モデルでは, 人工呼吸器の個別的治療決定を行うことで, 患者の予後を改善できる。
関連論文リスト
- Assessing Reusability of Deep Learning-Based Monotherapy Drug Response Prediction Models Trained with Omics Data [43.57729817547386]
がん薬物応答予測モデルは、精度オンコロジーへの有望なアプローチを示す。
深層学習(DL)法はこの分野で大きな可能性を秘めている。
これは、より広い科学コミュニティによって改善され、テストされる、再利用可能で適応可能なモデルの必要性を強調している。
論文 参考訳(メタデータ) (2024-09-18T16:08:28Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Deep Attention Q-Network for Personalized Treatment Recommendation [1.6631602844999724]
パーソナライズされた治療レコメンデーションのためのDeep Attention Q-Networkを提案する。
深い強化学習フレームワーク内のTransformerアーキテクチャは、過去のすべての患者の観察を効率的に取り入れている。
実世界の敗血症と急性低血圧コホートにおけるモデルの評価を行い、最先端モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2023-07-04T07:00:19Z) - Policy Optimization for Personalized Interventions in Behavioral Health [8.10897203067601]
デジタルプラットフォームを通じて提供される行動的健康介入は、健康結果を大幅に改善する可能性がある。
患者に対するパーソナライズされた介入を最適化して長期的効果を最大化する問題について検討した。
患者システムの状態空間を個別のレベルに分解するDecompPIをダブする新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-21T21:42:03Z) - Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach [0.0]
動的処理レジーム(DTR)は、このプロセスの形式化のために広く研究されている。
最適な治療体制を効率的に学習するための強化学習法を開発した。
論文 参考訳(メタデータ) (2021-12-08T20:22:04Z) - Deep Bayesian Estimation for Dynamic Treatment Regimes with a Long
Follow-up Time [28.11470886127216]
動的治療体制(DTR)の因果効果推定は、シーケンシャルな意思決定に寄与する。
結果回帰モデルと高次元特徴に対する治療モデルを組み合わせる。
また、開発されたディープベイズモデルでは、不確実性をモデル化し、自動運転車や医療設計など、安全に配慮したアプリケーションに不可欠な予測分散を出力することができる。
論文 参考訳(メタデータ) (2021-09-20T13:21:39Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - MIA-Prognosis: A Deep Learning Framework to Predict Therapy Response [58.0291320452122]
本稿では,患者の予後と治療反応を予測するための統合型深層学習手法を提案する。
我々は,マルチモーダル非同期時系列分類タスクとして,確率モデリングを定式化する。
我々の予測モデルは、長期生存の観点から、低リスク、高リスクの患者をさらに階層化する可能性がある。
論文 参考訳(メタデータ) (2020-10-08T15:30:17Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。