論文の概要: Exploring Optimal Control With Observations at a Cost
- arxiv url: http://arxiv.org/abs/2006.15757v1
- Date: Mon, 29 Jun 2020 00:42:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 13:27:15.366227
- Title: Exploring Optimal Control With Observations at a Cost
- Title(参考訳): コストによる観測による最適制御の探索
- Authors: Rui Aguiar, Nikka Mofid, Hyunji Alex Nam
- Abstract要約: LOCF(Last-observation-carried-forward)の値は、これらの値がどのようにインプットされたかの情報を正確に保持することなく、あいまいさをもたらす。
われわれのアプローチは,OpenAI GymのMountain Carを用いてこの問題をモデル化し,患者の生理状態をいつ観察するかを考察する。
その結果, 前回の観測以降の時間を追跡する状態変数のカウンタによる状態の増大により, エージェントの予測性能が向上することが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There has been a current trend in reinforcement learning for healthcare
literature, where in order to prepare clinical datasets, researchers will carry
forward the last results of the non-administered test known as the
last-observation-carried-forward (LOCF) value to fill in gaps, assuming that it
is still an accurate indicator of the patient's current state. These values are
carried forward without maintaining information about exactly how these values
were imputed, leading to ambiguity. Our approach models this problem using
OpenAI Gym's Mountain Car and aims to address when to observe the patient's
physiological state and partly how to intervene, as we have assumed we can only
act after following an observation. So far, we have found that for a
last-observation-carried-forward implementation of the state space, augmenting
the state with counters for each state variable tracking the time since last
observation was made, improves the predictive performance of an agent,
supporting the notion of "informative missingness", and using a neural network
based Dynamics Model to predict the most probable next state value of
non-observed state variables instead of carrying forward the last observed
value through LOCF further improves the agent's performance, leading to faster
convergence and reduced variance.
- Abstract(参考訳): 医療文献の強化学習では、臨床データセットを作成するために、研究者は、患者の現在の状態の正確な指標であるとして、ギャップを埋めるために last-observation-carried-forward (locf) と呼ばれる非アドベラルテストの最終結果を実行する。
これらの値は、どのようにインプットされたかの情報を正確に保持することなく前進し、あいまいさにつながる。
当社のアプローチは,OpenAI GymのMountain Carを用いてこの問題をモデル化し,患者の生理状態をいつ観察するか,また,観察後にのみ行動できると仮定して介入するかを考察する。
So far, we have found that for a last-observation-carried-forward implementation of the state space, augmenting the state with counters for each state variable tracking the time since last observation was made, improves the predictive performance of an agent, supporting the notion of "informative missingness", and using a neural network based Dynamics Model to predict the most probable next state value of non-observed state variables instead of carrying forward the last observed value through LOCF further improves the agent's performance, leading to faster convergence and reduced variance.
関連論文リスト
- SurvCORN: Survival Analysis with Conditional Ordinal Ranking Neural Network [4.772480981435387]
本稿では,条件付き順序付きランキングネットワークを用いた生存曲線の予測手法であるSurvCORNを提案する。
また,モデル予測の精度を評価するための指標であるSurvMAEを導入する。
論文 参考訳(メタデータ) (2024-09-30T03:01:25Z) - Deep State-Space Generative Model For Correlated Time-to-Event Predictions [54.3637600983898]
そこで本研究では,様々な種類の臨床イベント間の相互作用を捉えるために,潜伏状態空間生成モデルを提案する。
また,死亡率と臓器不全の関連性について有意な知見が得られた。
論文 参考訳(メタデータ) (2024-07-28T02:42:36Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - Vital Sign Forecasting for Sepsis Patients in ICUs [5.543372375499915]
本稿では,最先端のディープラーニング(DL)アーキテクチャを用いて,多段階予測システムを提案する。
我々は,過去6時間のデータから,今後3時間分のバイタルサインを予測できるDLベースのバイタルサイン予測システムを導入する。
平均二乗誤差 (MSE) と動的時間歪み (DTW) 測定値を用いて, モデルの性能評価を行った。
論文 参考訳(メタデータ) (2023-11-08T15:47:58Z) - Forecasting Patient Flows with Pandemic Induced Concept Drift using
Explainable Machine Learning [0.0]
本研究では,患者フローの予測モデルを改善する新しい準リアルタイム変数群について検討した。
新型コロナウイルス(COVID-19)のアラートレベル(Alert Level)機能は、Googleの検索語や歩行者のトラフィックとともに、一般的な予測を生成するのに効果的だった。
論文 参考訳(メタデータ) (2022-11-01T20:42:26Z) - Scalable Sensitivity and Uncertainty Analysis for Causal-Effect
Estimates of Continuous-Valued Interventions [34.19821413853115]
観測データから継続的に評価された介入の効果を推定することは、気候科学、医療、経済学などの分野において極めて重要である。
我々は, 連続処理効果限界感度モデル(CMSM)を開発し, 観測データと研究者が定義した隠れ共役レベルの両方に適合する境界を導出する。
本研究では,これらの境界を高次元・大局的な観測データに対して効率的に推定するために,境界と不確実性を考慮した深部モデルを導出するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-04-21T11:15:10Z) - On the Practicality of Deterministic Epistemic Uncertainty [106.06571981780591]
決定論的不確実性法(DUM)は,分布外データの検出において高い性能を達成する。
DUMが十分に校正されており、現実のアプリケーションにシームレスにスケールできるかどうかは不明だ。
論文 参考訳(メタデータ) (2021-07-01T17:59:07Z) - Approximate Bayesian Computation for an Explicit-Duration Hidden Markov
Model of COVID-19 Hospital Trajectories [55.786207368853084]
新型コロナウイルス(COVID-19)のパンデミックの中、病院の資源をモデル化する問題に取り組んでいます。
幅広い適用性のために、関心のある領域の患者レベルデータが利用できない、一般的なが困難なシナリオに注目します。
本稿では,ACED-HMM(ACED-HMM)と呼ばれる集合数正規化隠れマルコフモデルを提案する。
論文 参考訳(メタデータ) (2021-04-28T15:32:42Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Improving Recurrent Neural Network Responsiveness to Acute Clinical
Events [0.5118560450410778]
リカレントニューラルネットワーク(Recurrent Neural Network, RNN)は、臨床決定支援モデルのトレーニングとデプロイに一般的である。
新しい情報はRNNの細胞状態記憶を介して伝播し、その影響はモデルの予測に反映される。
本研究は、RNNモデルのトレーニングおよび展開方法として、入力データの持続性を示し、その予測を新たに取得した情報に応答させる。
論文 参考訳(メタデータ) (2020-07-28T23:10:46Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。