Fugu-MT 論文翻訳(概要): Kernel-Based Distributed Q-Learning: A Scalable Reinforcement Learning Approach for Dynamic Treatment Regimes

論文の概要: Kernel-Based Distributed Q-Learning: A Scalable Reinforcement Learning Approach for Dynamic Treatment Regimes

arxiv url: http://arxiv.org/abs/2302.10434v2
Date: Mon, 17 Feb 2025 13:07:21 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-19 07:11:43.244271
Title: Kernel-Based Distributed Q-Learning: A Scalable Reinforcement Learning Approach for Dynamic Treatment Regimes
Title（参考訳）: カーネルに基づく分散Q-Learning:動的処理規則に対するスケーラブル強化学習アプローチ
Authors: Di Wang, Yao Wang, Shao-Bo Lin,
Abstract要約: 動的処理規則(DTR)を生成するためのスケーラブルなカーネルベースの分散Q-ラーニングアルゴリズムを提案する。その結果,本アルゴリズムは,最先端の深層強化学習手法に関連する計算複雑性を著しく低減することを示した。
参考スコア（独自算出の注目度）: 20.62850899223748
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In recent years, large amounts of electronic health records (EHRs) concerning chronic diseases have been collected to facilitate medical diagnosis. Modeling the dynamic properties of EHRs related to chronic diseases can be efficiently done using dynamic treatment regimes (DTRs). While reinforcement learning (RL) is a widely used method for creating DTRs, there is ongoing research in developing RL algorithms that can effectively handle large amounts of data. In this paper, we present a scalable kernel-based distributed Q-learning algorithm for generating DTRs. We perform both theoretical assessments and numerical analysis for the proposed approach. The results demonstrate that our algorithm significantly reduces the computational complexity associated with the state-of-the-art deep reinforcement learning methods, while maintaining comparable generalization performance in terms of accumulated rewards across stages, such as survival time or cumulative survival probability.
Abstract（参考訳）: 近年,慢性疾患に関する電子的健康記録(EHR)が大量に収集され,診断が容易になっている。慢性疾患に関連するERHの動的特性のモデリングは、動的治療レジーム(DTR)を用いて効率的に行うことができる。強化学習(RL)はDTRを作成するために広く用いられている手法であるが、大量のデータを効果的に扱えるRLアルゴリズムの開発が進行中である。本稿では、DTRを生成するためのスケーラブルなカーネルベースの分散Q-ラーニングアルゴリズムを提案する。提案手法の理論的評価と数値解析を行う。以上の結果から,本アルゴリズムは,生存時間や累積生存確率などのステージにまたがる累積報酬と同等の一般化性能を維持しつつ,最先端の深層強化学習手法に関連する計算複雑性を著しく低減することを示した。

関連論文リスト

Exploring Training and Inference Scaling Laws in Generative Retrieval [50.82554729023865]
モデルサイズ,トレーニングデータスケール,推論時間計算が生成的検索性能にどのように影響するかを検討する。実験の結果,n-gram-based method はトレーニング法と推論法の両方と強く一致していることがわかった。 LLaMAモデルはT5モデルより一貫して優れており、生成検索におけるデコーダのみの大きなモデルに対して特に有利であることが示唆された。
論文参考訳（メタデータ） (2025-03-24T17:59:03Z)
Censoring-Aware Tree-Based Reinforcement Learning for Estimating Dynamic Treatment Regimes with Censored Outcomes [4.877686100899469]
Censoring-Aware Tree-Based Reinforcement Learning (CA-TRL)は、検閲データに関連する複雑さに対処する新しいフレームワークである。本稿では,SANADエピレプシー・データセットを用いた広範囲なシミュレーションと実世界の応用を通して,その効果を実証する。
論文参考訳（メタデータ） (2025-03-09T16:53:09Z)
Fine-tuning -- a Transfer Learning approach [0.22344294014777952]
電子健康記録(EHR)の欠落は、この貴重な資源に欠落するデータが豊富にあるため、しばしば妨げられる。既存の深い計算手法は、計算処理とダウンストリーム解析の両方を組み込んだエンドツーエンドのパイプラインに依存している。本稿では,モジュール型深層学習型計算・分類パイプラインの開発について検討する。
論文参考訳（メタデータ） (2024-11-06T14:18:23Z)
DTR-Bench: An in silico Environment and Benchmark Platform for Reinforcement Learning Based Dynamic Treatment Regime [18.443316087890324]
強化学習(Reinforcement Learning, RL)は、個人化医療における動的治療体制(DTR)を最適化する可能性の認知度を高めている。多様な医療シナリオをシミュレートするベンチマークプラットフォームであるtextitDTR-Benchを紹介した。我々はこれらの設定の様々な最先端のRLアルゴリズムを評価し、特に実世界の課題の中でその性能を強調した。
論文参考訳（メタデータ） (2024-05-28T21:40:00Z)
Self-STORM: Deep Unrolled Self-Supervised Learning for Super-Resolution Microscopy [55.2480439325792]
我々は、シーケンス固有のモデルベースのオートエンコーダをトレーニングすることで、そのようなデータの必要性を軽減する、深層無学習の自己教師付き学習を導入する。提案手法は, 監視対象の性能を超過する。
論文参考訳（メタデータ） (2024-03-25T17:40:32Z)
Fast Cerebral Blood Flow Analysis via Extreme Learning Machine [4.373558495838564]
拡散相関分光法(DCS)を用いた高速かつ高精度な脳血流解析手法を提案する。半無限層モデルと多層モデルの両方に対する合成データセットを用いて既存のアルゴリズムを評価する。その結果、ELMは様々なノイズレベルや光学パラメータにわたって高い忠実度を連続的に達成し、堅牢な一般化能力を示し、反復整合アルゴリズムより優れることを示した。
論文参考訳（メタデータ） (2024-01-10T23:01:35Z)
Evolutionary Optimization of 1D-CNN for Non-contact Respiration Pattern Classification [0.19999259391104385]
時系列呼吸データ分類のための深層学習に基づくアプローチを提案する。分類のために1次元畳み込みニューラルネットワーク(1D-CNN)を用いた。遺伝的アルゴリズムを用いて分類精度を最大化するために1D-CNNアーキテクチャを最適化した。
論文参考訳（メタデータ） (2023-12-20T13:59:43Z)
Learning Optimal Dynamic Treatment Regimes Using Causal Tree Methods in Medicine [20.401805132360654]
最適動的治療体制(DTR)を学習するための2つの新しい方法を開発した。本手法は,原因木法を用いて不均一な処理効果をデータ駆動で推定する手法である。提案手法を合成データを用いて評価し,それらを集中治療室からの実世界データに適用する。
論文参考訳（メタデータ） (2022-04-14T17:27:08Z)
Auto-FedRL: Federated Hyperparameter Optimization for Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文参考訳（メタデータ） (2022-03-12T04:11:42Z)
Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文参考訳（メタデータ） (2021-10-27T19:28:36Z)
Efficient training of lightweight neural networks using Online Self-Acquired Knowledge Distillation [51.66271681532262]
オンライン自己獲得知識蒸留(OSAKD)は、ディープニューラルネットワークの性能をオンライン的に向上することを目的としている。出力特徴空間におけるデータサンプルの未知確率分布を推定するために、k-nnノンパラメトリック密度推定手法を用いる。
論文参考訳（メタデータ） (2021-08-26T14:01:04Z)
Dynamic Mode Decomposition in Adaptive Mesh Refinement and Coarsening Simulations [58.720142291102135]
動的モード分解(DMD)はコヒーレントなスキームを抽出する強力なデータ駆動方式である。本稿では,異なるメッシュトポロジと次元の観測からDMDを抽出する戦略を提案する。
論文参考訳（メタデータ） (2021-04-28T22:14:25Z)
A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文参考訳（メタデータ） (2021-02-26T17:49:58Z)
Sample-Efficient Reinforcement Learning via Counterfactual-Based Data Augmentation [15.451690870640295]
医療などのいくつかのシナリオでは、通常、各患者に利用可能なレコードはごくわずかであり、現在の強化学習アルゴリズムの適用を妨げる。構造因果モデル(SCM)を利用して状態ダイナミクスをモデル化する,データ効率の高いRLアルゴリズムを提案する。本研究は, 軽度条件下では反実結果が識別可能であり, 反実に基づく拡張データセット上のq学習が最適値関数に収束することを示す。
論文参考訳（メタデータ） (2020-12-16T17:21:13Z)
Deep Reinforcement Learning using Cyclical Learning Rates [62.19441737665902]
勾配降下(SGD)に基づく最適化手順における最も影響力のあるパラメータの1つは、学習率である。循環学習について検討し,様々なDRL問題に対する一般循環学習率の定義法を提案する。本実験により, 循環学習は, 高度に調整された固定学習率よりも, 類似あるいは良好な結果が得られることがわかった。
論文参考訳（メタデータ） (2020-07-31T10:06:02Z)
A Systematic Approach to Featurization for Cancer Drug Sensitivity Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。 RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文参考訳（メタデータ） (2020-04-30T20:42:17Z)
Deep Learning Algorithms for Rotating Machinery Intelligent Diagnosis: An Open Source Benchmark Study [0.8497188292342053]
本稿では,機械知能診断を回転させる深層学習アルゴリズムのベンチマーク研究を行う。評価コード全体をコードライブラリに統合し、このフィールドの開発を改善するために、このコードライブラリを一般公開します。これらの作業により、モデルを公平かつ迅速に比較、テストするための統一されたコードフレームワークをリリースし、オープンソースコードの重要さを強調し、無駄な改善を避けるためのベースライン精度(下限)を提供し、この分野の将来的な方向性について議論する。
論文参考訳（メタデータ） (2020-03-06T17:24:43Z)
Distributed Training of Deep Neural Network Acoustic Models for Automatic Speech Recognition [33.032361181388886]
ASRのためのディープニューラルネットワーク音響モデルのための分散トレーニング手法の概要について述べる。提案手法の収束, 高速化, 認識性能を調べるために, 一般のベンチマークで実験を行った。
論文参考訳（メタデータ） (2020-02-24T19:31:50Z)
Opportunities and Challenges of Deep Learning Methods for Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文参考訳（メタデータ） (2019-12-28T02:44:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。