論文の概要: Kernel-Based Distributed Q-Learning: A Scalable Reinforcement Learning
Approach for Dynamic Treatment Regimes
- arxiv url: http://arxiv.org/abs/2302.10434v1
- Date: Tue, 21 Feb 2023 04:15:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 16:25:07.199363
- Title: Kernel-Based Distributed Q-Learning: A Scalable Reinforcement Learning
Approach for Dynamic Treatment Regimes
- Title(参考訳): カーネルベース分散q-learning:動的治療体制のためのスケーラブル強化学習手法
- Authors: Di Wang, Yao Wang, Shaojie Tang, Shao-Bo Lin
- Abstract要約: 本稿では,動的処理系を生成するための分散Q-ラーニングアルゴリズムを提案する。
提案アルゴリズムは従来の線形Q-ラーニングよりも優れており,予測精度と計算コストの両方でよく使用される深層Q-ラーニングよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 37.06048335758881
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, large amounts of electronic health records (EHRs) concerning
chronic diseases, such as cancer, diabetes, and mental disease, have been
collected to facilitate medical diagnosis. Modeling the dynamic properties of
EHRs related to chronic diseases can be efficiently done using dynamic
treatment regimes (DTRs), which are a set of sequential decision rules. While
Reinforcement learning (RL) is a widely used method for creating DTRs, there is
ongoing research in developing RL algorithms that can effectively handle large
amounts of data. In this paper, we present a novel approach, a distributed
Q-learning algorithm, for generating DTRs. The novelties of our research are as
follows: 1) From a methodological perspective, we present a novel and scalable
approach for generating DTRs by combining distributed learning with Q-learning.
The proposed approach is specifically designed to handle large amounts of data
and effectively generate DTRs. 2) From a theoretical standpoint, we provide
generalization error bounds for the proposed distributed Q-learning algorithm,
which are derived within the framework of statistical learning theory. These
bounds quantify the relationships between sample size, prediction accuracy, and
computational burden, providing insights into the performance of the algorithm.
3) From an applied perspective, we demonstrate the effectiveness of our
proposed distributed Q-learning algorithm for DTRs by applying it to clinical
cancer treatments. The results show that our algorithm outperforms both
traditional linear Q-learning and commonly used deep Q-learning in terms of
both prediction accuracy and computation cost.
- Abstract(参考訳): 近年, がん, 糖尿病, 精神疾患などの慢性疾患に関する電子的健康記録が大量に収集され, 診断が容易になっている。
慢性疾患に関連するERHの動的特性のモデリングは、逐次決定規則のセットである動的治療規則(DTR)を用いて効率的に行うことができる。
強化学習(Reinforcement Learning, RL)はDTRの作成に広く用いられている手法であるが, 大量のデータを効果的に扱えるRLアルゴリズムの開発が進行中である。
本稿では,DTRを生成するための分散Q-ラーニングアルゴリズムを提案する。
我々の研究の新規性は以下の通りである。
1) 方法論的観点から,分散学習とQ-ラーニングを組み合わせることで,DTRを生成する新しい,スケーラブルなアプローチを提案する。
提案手法は、大量のデータを処理し、効果的にDTRを生成するように設計されている。
2)理論的な観点から,統計的学習理論の枠組みの中で導出される分散Q-ラーニングアルゴリズムに対して,一般化誤差境界を提供する。
これらの境界はサンプルサイズ、予測精度、計算負荷の関係を定量化し、アルゴリズムの性能に関する洞察を与える。
3) 本研究は, DTRに対する分散Q-ラーニングアルゴリズムの有効性を臨床的癌治療に適用することにより実証する。
その結果,本アルゴリズムは従来の線形q-learningと,予測精度と計算コストの両面で深層q-learningの両方に勝ることがわかった。
関連論文リスト
- DTR-Bench: An in silico Environment and Benchmark Platform for Reinforcement Learning Based Dynamic Treatment Regime [18.443316087890324]
強化学習(Reinforcement Learning, RL)は、個人化医療における動的治療体制(DTR)を最適化する可能性の認知度を高めている。
多様な医療シナリオをシミュレートするベンチマークプラットフォームであるtextitDTR-Benchを紹介した。
我々はこれらの設定の様々な最先端のRLアルゴリズムを評価し、特に実世界の課題の中でその性能を強調した。
論文 参考訳(メタデータ) (2024-05-28T21:40:00Z) - Evolutionary Optimization of 1D-CNN for Non-contact Respiration Pattern Classification [0.19999259391104385]
時系列呼吸データ分類のための深層学習に基づくアプローチを提案する。
分類のために1次元畳み込みニューラルネットワーク(1D-CNN)を用いた。
遺伝的アルゴリズムを用いて分類精度を最大化するために1D-CNNアーキテクチャを最適化した。
論文 参考訳(メタデータ) (2023-12-20T13:59:43Z) - Learning Optimal Dynamic Treatment Regimes Using Causal Tree Methods in
Medicine [20.401805132360654]
最適動的治療体制(DTR)を学習するための2つの新しい方法を開発した。
本手法は,原因木法を用いて不均一な処理効果をデータ駆動で推定する手法である。
提案手法を合成データを用いて評価し,それらを集中治療室からの実世界データに適用する。
論文 参考訳(メタデータ) (2022-04-14T17:27:08Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Efficient training of lightweight neural networks using Online
Self-Acquired Knowledge Distillation [51.66271681532262]
オンライン自己獲得知識蒸留(OSAKD)は、ディープニューラルネットワークの性能をオンライン的に向上することを目的としている。
出力特徴空間におけるデータサンプルの未知確率分布を推定するために、k-nnノンパラメトリック密度推定手法を用いる。
論文 参考訳(メタデータ) (2021-08-26T14:01:04Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Sample-Efficient Reinforcement Learning via Counterfactual-Based Data
Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。
構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。
本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文 参考訳(メタデータ) (2020-12-16T17:21:13Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Deep Learning Algorithms for Rotating Machinery Intelligent Diagnosis:
An Open Source Benchmark Study [0.8497188292342053]
本稿では,機械知能診断を回転させる深層学習アルゴリズムのベンチマーク研究を行う。
評価コード全体をコードライブラリに統合し、このフィールドの開発を改善するために、このコードライブラリを一般公開します。
これらの作業により、モデルを公平かつ迅速に比較、テストするための統一されたコードフレームワークをリリースし、オープンソースコードの重要さを強調し、無駄な改善を避けるためのベースライン精度(下限)を提供し、この分野の将来的な方向性について議論する。
論文 参考訳(メタデータ) (2020-03-06T17:24:43Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。