論文の概要: Resource-Conscious RL Algorithms for Deep Brain Stimulation
- arxiv url: http://arxiv.org/abs/2601.12699v1
- Date: Mon, 19 Jan 2026 03:45:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.747279
- Title: Resource-Conscious RL Algorithms for Deep Brain Stimulation
- Title(参考訳): 深部脳刺激のための資源調和型RLアルゴリズム
- Authors: Arkaprava Gupta, Nicholas Carter, William Zellers, Prateek Ganguli, Benedikt Dietrich, Vibhor Krishna, Parasara Sridhar Duggirala, Samarjit Chakraborty,
- Abstract要約: Deep Brain Stimulation (DBS) はパーキンソン病(PD)の有望な治療であることが示された。
DBSは、脳の基底ガングリア(BG)の特定の領域を電気的刺激で刺激することで、震動、剛性、ブレジキネジアなどのPDの症状を緩和する。
現在、ほとんどの臨床用DBSアプローチでは、一定の周波数と振幅を使い、副作用(発声のスラリー化など)とインプラントのバッテリー寿命の短縮に悩まされている。
我々は,DBSに対するT3P MAB(Time & Threshold-Triggered Multi-Armed Bandit)RLアプローチを提案する。
- 参考スコア(独自算出の注目度): 1.1242503819703258
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Brain Stimulation (DBS) has proven to be a promising treatment of Parkinson's Disease (PD). DBS involves stimulating specific regions of the brain's Basal Ganglia (BG) using electric impulses to alleviate symptoms of PD such as tremors, rigidity, and bradykinesia. Although most clinical DBS approaches today use a fixed frequency and amplitude, they suffer from side effects (such as slurring of speech) and shortened battery life of the implant. Reinforcement learning (RL) approaches have been used in recent research to perform DBS in a more adaptive manner to improve overall patient outcome. These RL algorithms are, however, too complex to be trained in vivo due to their long convergence time and requirement of high computational resources. We propose a new Time & Threshold-Triggered Multi-Armed Bandit (T3P MAB) RL approach for DBS that is more effective than existing algorithms. Further, our T3P agent is lightweight enough to be deployed in the implant, unlike current deep-RL strategies, and even forgoes the need for an offline training phase. Additionally, most existing RL approaches have focused on modulating only frequency or amplitude, and the possibility of tuning them together remains greatly unexplored in the literature. Our RL agent can tune both frequency and amplitude of DBS signals to the brain with better sample efficiency and requires minimal time to converge. We implement an MAB agent for DBS for the first time on hardware to report energy measurements and prove its suitability for resource-constrained platforms. Our T3P MAB algorithm is deployed on a variety of microcontroller unit (MCU) setups to show its efficiency in terms of power consumption as opposed to other existing RL approaches used in recent work.
- Abstract(参考訳): 深部脳刺激(DBS)はパーキンソン病(PD)の有望な治療である。
DBSは、脳の基底ガングリア(BG)の特定の領域を電気的刺激で刺激することで、震動、剛性、ブレジキネジアなどのPDの症状を緩和する。
現在、ほとんどの臨床用DBSアプローチでは周波数と振幅が固定されているが、副作用(発声のスラリー化など)とインプラントのバッテリー寿命の短縮に悩まされている。
強化学習(Reinforcement Learning, RL)アプローチは, 患者全体の成績を改善するために, より適応的な方法でDBSを実行するために近年研究されている。
しかし、これらのRLアルゴリズムは、長い収束時間と高い計算資源の要求のために、生体内で訓練するには複雑すぎる。
我々は,既存のアルゴリズムよりも効果的であるDBSに対して,T3P MAB(Time & Threshold-Triggered Multi-Armed Bandit) RLアプローチを提案する。
さらに、当社のT3Pエージェントは、現在のディープRL戦略とは異なり、インプラントに展開できるほど軽量であり、オフライントレーニングフェーズの必要性さえ捨てています。
さらに、既存のほとんどのRLアプローチは周波数や振幅だけを調節することに重点を置いており、これらを一緒に調整する可能性については文献では明らかにされていない。
我々のRLエージェントは、より優れたサンプル効率でDBS信号の周波数と振幅を脳に調整することができ、収束するのに最小限の時間を要する。
我々はDBSのためのMABエージェントをハードウェア上で初めて実装し、エネルギー測定を報告し、資源制約のあるプラットフォームにその適合性を証明した。
我々のT3P MABアルゴリズムは、様々なマイクロコントローラユニット(MCU)にデプロイされ、最近の研究で使われている他のRLアプローチとは対照的に、消費電力の観点から効率を示す。
関連論文リスト
- In-Vivo Training for Deep Brain Stimulation [0.9543943371833464]
パーキンソン病(PD)に対する深部脳刺激療法(DBS)の有用性
最近の研究は、RLエージェントが刺激周波数と振幅を調節するDBSに強化学習(RL)を使用している。
生体内で測定可能な脳活動に応じてこれらの刺激パラメータを適応するRLベースのDBSアプローチを提案する。
論文 参考訳(メタデータ) (2025-10-04T03:14:34Z) - Multi-Agent Reinforcement Learning for Sample-Efficient Deep Neural Network Mapping [54.65536245955678]
本稿では,サンプル非効率性の課題を克服するために,分散型マルチエージェント強化学習(MARL)フレームワークを提案する。
相関解析に基づいて類似のマッピングパラメータを同一エージェントに割り当てるエージェントクラスタリングアルゴリズムを提案する。
実験の結果,MARL法は標準単エージェントRLよりも30~300倍効率が向上した。
論文 参考訳(メタデータ) (2025-07-22T05:51:07Z) - Deep Learning Model Predictive Control for Deep Brain Stimulation in Parkinson's Disease [0.17188280334580194]
パーキンソン病(PD)に対する深部脳刺激(DBS)のための非線形データ駆動型モデル予測制御(MPC)アルゴリズムを提案する。
既存のCLDBSアルゴリズムと比較して、トラッキングエラーと制御アクティビティの両方で20%以上の削減を実現している。
提案した制御戦略は、CLDBSを標的としたPDや他の疾患の治療に応用可能な、一般化可能なデータ駆動技術を提供する。
論文 参考訳(メタデータ) (2025-04-01T10:16:49Z) - Adaptive Data Exploitation in Deep Reinforcement Learning [50.53705050673944]
深層強化学習(RL)における**データ効率**と**一般化**を強化する強力なフレームワークであるADEPTを紹介する。
具体的には、ADEPTはマルチアーム・バンディット(MAB)アルゴリズムを用いて、異なる学習段階にわたるサンプルデータの使用を適応的に管理する。
Procgen、MiniGrid、PyBulletなどのベンチマークでADEPTをテストする。
論文 参考訳(メタデータ) (2025-01-22T04:01:17Z) - Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning [68.63990729719369]
無線スペクトルは乏しくなり、D2D通信のスペクトル効率は低い。
本稿では, 周囲RF信号の後方散乱を可能にするために, 環境後方散乱通信技術をD2Dデバイスに統合することを目的とする。
我々は、より少ないトレーニングパラメータでより高速な収束率を達成することができる新しい量子強化学習(RL)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-10-23T15:36:43Z) - {\epsilon}-Neural Thompson Sampling of Deep Brain Stimulation for
Parkinson Disease Treatment [15.303196613362099]
本稿では,Deep Brain Stimulation (DBS) デバイスのためのコンテキスト型マルチアームバンディット (CMAB) ソリューションを提案する。
本研究は,基底神経節(BG)領域における不規則ニューロンの発射活動を捉える信号としてコンテキストを定義した。
エプシロン探索戦略は、古典的なトンプソンサンプリング法の上に導入され、エプシロンニューラルツと呼ばれるアルゴリズムが導かれる。
論文 参考訳(メタデータ) (2024-03-11T15:33:40Z) - Compressing Deep Reinforcement Learning Networks with a Dynamic
Structured Pruning Method for Autonomous Driving [63.155562267383864]
深部強化学習(DRL)は複雑な自律運転シナリオにおいて顕著な成功を収めている。
DRLモデルは、必然的に高いメモリ消費と計算をもたらし、リソース限定の自動運転デバイスへの広範な展開を妨げる。
そこで本研究では,DRLモデルの非重要なニューロンを段階的に除去する,新しい動的構造化プルーニング手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T09:00:30Z) - Offline Learning of Closed-Loop Deep Brain Stimulation Controllers for
Parkinson Disease Treatment [6.576864734526406]
パーキンソン病(PD)による運動負荷に対する脳深部刺激(DBS)の期待
米国食品医薬品局(FDA)が承認したDBSデバイスは、一定の振幅で連続DBS(cDBS)刺激を届けることができる。
このエネルギー非効率な操作は、デバイスのバッテリ寿命を短縮し、動的に活動に適応できず、重大な副作用を引き起こす可能性がある。
論文 参考訳(メタデータ) (2023-02-05T20:29:53Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。