論文の概要: Deep Reinforcement Learning for Cost-Effective Medical Diagnosis
- arxiv url: http://arxiv.org/abs/2302.10261v1
- Date: Mon, 20 Feb 2023 19:47:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 17:21:03.621339
- Title: Deep Reinforcement Learning for Cost-Effective Medical Diagnosis
- Title(参考訳): 費用対効果医療診断のための深層強化学習
- Authors: Zheng Yu, Yikuan Li, Joseph Kim, Kaixuan Huang, Yuan Luo, Mengdi Wang
- Abstract要約: 強化学習を用いて、以前の観測結果に基づいて順次実験室のテストパネルを選択する動的ポリシーを探索する。
エンド・ツー・エンドのトレーニングやオンライン学習と互換性のあるセミモデルに基づく深層診断ポリシー最適化フレームワークを提案する。
SM-DDPOは、フェリチン異常検出、敗血症死亡予測、急性腎障害の診断など、様々な臨床的タスクでテストされている。
- 参考スコア(独自算出の注目度): 41.10546022107126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dynamic diagnosis is desirable when medical tests are costly or
time-consuming. In this work, we use reinforcement learning (RL) to find a
dynamic policy that selects lab test panels sequentially based on previous
observations, ensuring accurate testing at a low cost. Clinical diagnostic data
are often highly imbalanced; therefore, we aim to maximize the $F_1$ score
instead of the error rate. However, optimizing the non-concave $F_1$ score is
not a classic RL problem, thus invalidates standard RL methods. To remedy this
issue, we develop a reward shaping approach, leveraging properties of the $F_1$
score and duality of policy optimization, to provably find the set of all
Pareto-optimal policies for budget-constrained $F_1$ score maximization. To
handle the combinatorially complex state space, we propose a Semi-Model-based
Deep Diagnosis Policy Optimization (SM-DDPO) framework that is compatible with
end-to-end training and online learning. SM-DDPO is tested on diverse clinical
tasks: ferritin abnormality detection, sepsis mortality prediction, and acute
kidney injury diagnosis. Experiments with real-world data validate that SM-DDPO
trains efficiently and identifies all Pareto-front solutions. Across all tasks,
SM-DDPO is able to achieve state-of-the-art diagnosis accuracy (in some cases
higher than conventional methods) with up to $85\%$ reduction in testing cost.
The code is available at [https://github.com/Zheng321/Blood_Panel].
- Abstract(参考訳): 医療検査の費用や時間を要する場合には、動的診断が望ましい。
本研究では,強化学習(rl)を用いて,過去の観測に基づいて連続的にラボテストパネルを選択し,低コストで正確なテストを実現する動的ポリシを提案する。
臨床診断データは非常に不均衡な場合が多いため,誤差率の代わりにF_1$スコアを最大化することを目指している。
しかし、$F_1$スコアを最適化することは古典的なRL問題ではなく、標準のRLメソッドを無効にする。
この問題を改善するため,我々は,予算制約付き$f_1$スコアの属性と政策最適化の二重性を活用した報酬形成手法を開発し,予算制約付き$f_1$スコア最大化のためのパレート最適政策のセットを確実に見つける。
複合的な状態空間を扱うために,エンド・ツー・エンドのトレーニングやオンライン学習と互換性のあるセミモデルに基づく深層診断ポリシー最適化(SM-DDPO)フレームワークを提案する。
SM-DDPOは、フェリチン異常検出、敗血症死亡予測、急性腎障害の診断など、様々な臨床的タスクでテストされている。
実世界のデータを用いた実験では、SM-DDPOは効率よくトレーニングし、全てのPareto-frontソリューションを識別する。
全てのタスクにおいて、SM-DDPOは最先端の診断精度(場合によっては従来の方法よりも高い場合)を最大8,5\%のコストで達成することができる。
コードは[https://github.com/Zheng321/Blood_Panel]で入手できる。
関連論文リスト
- DDxT: Deep Generative Transformer Models for Differential Diagnosis [51.25660111437394]
より単純な教師付き学習信号と自己教師付き学習信号で訓練した生成的アプローチが,現在のベンチマークにおいて優れた結果が得られることを示す。
The proposed Transformer-based generative network, named DDxT, autoregressive produce a set of possible pathology,, i. DDx, and predicts the real pathology using a neural network。
論文 参考訳(メタデータ) (2023-12-02T22:57:25Z) - Scalable Online Disease Diagnosis via Multi-Model-Fused Actor-Critic
Reinforcement Learning [9.274138493400436]
医療のアドバイスをオンラインで求めている人にとっては、患者と対話して自動的に疾患を診断できるAIベースの対話エージェントが有効な選択肢だ。
これは、強化学習(RL)アプローチを自然解として提案した逐次的特徴(症状)選択と分類の問題として定式化することができる。
生成的アクターネットワークと診断批評家ネットワークから構成されるMMF-AC(Multi-Model-Fused Actor-Critic)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-08T03:06:16Z) - DLTTA: Dynamic Learning Rate for Test-time Adaptation on Cross-domain
Medical Images [56.72015587067494]
DLTTAと呼ばれるテスト時間適応のための新しい動的学習率調整法を提案する。
本手法は,現在最先端のテスト時間適応法よりも一貫した性能向上を図り,有効かつ高速なテスト時間適応を実現する。
論文 参考訳(メタデータ) (2022-05-27T02:34:32Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z) - FIT: a Fast and Accurate Framework for Solving Medical Inquiring and
Diagnosing Tasks [10.687562550605739]
自己診断(Self-diagnosis)は、患者をクエリーし、疾患の予測を行うエージェントを介して、低コストでアクセス可能な医療を提供する。
我々は、次に収集するデータを決定するために情報理論の報酬を使用するFITと呼ばれる競合フレームワークを提案する。
シミュレーションした2つのデータセットから、FITは大規模な検索空間問題に効果的に対処でき、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-02T10:12:49Z) - COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital
Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。
1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文 参考訳(メタデータ) (2020-10-30T00:47:01Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z) - Semixup: In- and Out-of-Manifold Regularization for Deep Semi-Supervised
Knee Osteoarthritis Severity Grading from Plain Radiographs [3.0969191504482247]
変形性膝関節症(OA)は世界有数の障害因子の一つである。
深層学習法は金の標準Kelgren-Lawrence(KL)グレーディングシステムに従ってOA重症度評価を確実に行うことができる。
ラベルのないデータを活用するための半教師付き学習(SSL)手法であるSemixupアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-04T08:33:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。