論文の概要: An Empirical Study of Representation Learning for Reinforcement Learning
in Healthcare
- arxiv url: http://arxiv.org/abs/2011.11235v1
- Date: Mon, 23 Nov 2020 06:37:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 02:46:20.012384
- Title: An Empirical Study of Representation Learning for Reinforcement Learning
in Healthcare
- Title(参考訳): 医療における強化学習のための表現学習の実証的研究
- Authors: Taylor W. Killian, Haoran Zhang, Jayakumar Subramanian, Mehdi Fatemi,
Marzyeh Ghassemi
- Abstract要約: 我々はMIMIC-IIIデータセットにおける敗血症患者のデータを用いて患者の状態を表現した。
逐次的に形成された状態表現は、バッチ設定において効果的なポリシー学習を促進する。
- 参考スコア(独自算出の注目度): 19.50370829781689
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement Learning (RL) has recently been applied to sequential
estimation and prediction problems identifying and developing hypothetical
treatment strategies for septic patients, with a particular focus on offline
learning with observational data. In practice, successful RL relies on
informative latent states derived from sequential observations to develop
optimal treatment strategies. To date, how best to construct such states in a
healthcare setting is an open question. In this paper, we perform an empirical
study of several information encoding architectures using data from septic
patients in the MIMIC-III dataset to form representations of a patient state.
We evaluate the impact of representation dimension, correlations with
established acuity scores, and the treatment policies derived from them. We
find that sequentially formed state representations facilitate effective policy
learning in batch settings, validating a more thoughtful approach to
representation learning that remains faithful to the sequential and partial
nature of healthcare data.
- Abstract(参考訳): 強化学習(rl)は敗血症患者に対する仮説的治療戦略の同定と開発、特に観察データを用いたオフライン学習に焦点を当てた逐次的推定と予測問題に最近適用されている。
実際には、成功したRLは、適切な治療戦略を開発するために、シーケンシャルな観測から得られた情報的潜在状態に依存している。
現在、医療現場でそのような状態を構築するのがいかに最適かは、オープンな疑問である。
本稿では,MIMIC-IIIデータセットの敗血症患者のデータを用いて,複数の情報符号化アーキテクチャを実証研究し,患者の状態を表現した。
我々は,表現次元の影響,確立された明度スコアとの相関,およびそれらから派生した治療方針を評価する。
逐次的に形成された状態表現は、バッチ設定における効果的なポリシー学習を促進し、医療データのシーケンシャルかつ部分的な性質に忠実な表現学習に対するより思慮深いアプローチを検証する。
関連論文リスト
- Addressing Data Heterogeneity in Federated Learning of Cox Proportional Hazards Models [8.798959872821962]
本稿では,フェデレーションサバイバル分析の分野,特にCox Proportional Hazards(CoxPH)モデルについて概説する。
本稿では,合成データセットと実世界のアプリケーション間のモデル精度を向上させるために,特徴ベースのクラスタリングを用いたFLアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-20T18:34:20Z) - Safe and Interpretable Estimation of Optimal Treatment Regimes [54.257304443780434]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。
本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文 参考訳(メタデータ) (2023-10-23T19:59:10Z) - Deep Attention Q-Network for Personalized Treatment Recommendation [1.6631602844999724]
パーソナライズされた治療レコメンデーションのためのDeep Attention Q-Networkを提案する。
深い強化学習フレームワーク内のTransformerアーキテクチャは、過去のすべての患者の観察を効率的に取り入れている。
実世界の敗血症と急性低血圧コホートにおけるモデルの評価を行い、最先端モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2023-07-04T07:00:19Z) - Federated Cycling (FedCy): Semi-supervised Federated Learning of
Surgical Phases [57.90226879210227]
FedCyは、FLと自己教師付き学習を組み合わせた半教師付き学習(FSSL)手法で、ラベル付きビデオとラベルなしビデオの両方の分散データセットを利用する。
外科的段階の自動認識作業において,最先端のFSSL法よりも顕著な性能向上を示した。
論文 参考訳(メタデータ) (2022-03-14T17:44:53Z) - Disentangled Counterfactual Recurrent Networks for Treatment Effect
Inference over Time [71.30985926640659]
本稿では,DCRN(Disentangled Counterfactual Recurrent Network)を提案する。
時間とともに治療効果の因果構造に完全にインスパイアされたアーキテクチャでは、予測精度と疾患理解が向上する。
実データとシミュレーションデータの両方において,DCRNが処理応答予測の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-12-07T16:40:28Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z) - Sample-Efficient Reinforcement Learning via Counterfactual-Based Data
Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。
構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。
本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文 参考訳(メタデータ) (2020-12-16T17:21:13Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Optimizing Medical Treatment for Sepsis in Intensive Care: from
Reinforcement Learning to Pre-Trial Evaluation [2.908482270923597]
本研究の目的は, 介入を最適化する強化学習(RL)が, 学習方針の治験に対する規制に適合する経路を遡及的に得る枠組みを確立することである。
我々は,死の主な原因の一つであり,複雑で不透明な患者動態のため治療が困難である集中治療室の感染症に焦点を当てた。
論文 参考訳(メタデータ) (2020-03-13T20:31:47Z) - Generalization Bounds and Representation Learning for Estimation of
Potential Outcomes and Causal Effects [61.03579766573421]
代替薬に対する患者一人の反応など,個人レベルの因果効果の推定について検討した。
我々は,表現の誘導的処理群距離を正規化することにより,境界を最小化する表現学習アルゴリズムを考案した。
これらのアルゴリズムを拡張して、重み付き表現を同時に学習し、治療群距離をさらに削減する。
論文 参考訳(メタデータ) (2020-01-21T10:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。