論文の概要: Sample-Efficient Reinforcement Learning Controller for Deep Brain Stimulation in Parkinson's Disease
- arxiv url: http://arxiv.org/abs/2507.06326v1
- Date: Tue, 08 Jul 2025 18:30:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.358113
- Title: Sample-Efficient Reinforcement Learning Controller for Deep Brain Stimulation in Parkinson's Disease
- Title(参考訳): パーキンソン病における深部脳刺激のためのサンプル高能率強化学習制御
- Authors: Harsh Ravivarapu, Gaurav Bagwe, Xiaoyong Yuan, Chunxiu Yu, Lan Zhang,
- Abstract要約: 本稿では,RLをベースとした適応神経刺激のための,サンプル効率のよいアクター批判フレームワークSEA-DBSを提案する。
SEA-DBSは予測報酬モデルを統合し、リアルタイムフィードバックへの依存を減らすとともに、Gumbel Softmaxベースの探索を安定的で差別化可能なポリシー更新に利用している。
以上の結果から,SEA-DBSは実効的かつ効果的なRLベースのaDBSフレームワークであり,リアルタイムな資源拘束型神経調節を実現することが示唆された。
- 参考スコア(独自算出の注目度): 6.443133356814665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep brain stimulation (DBS) is an established intervention for Parkinson's disease (PD), but conventional open-loop systems lack adaptability, are energy-inefficient due to continuous stimulation, and provide limited personalization to individual neural dynamics. Adaptive DBS (aDBS) offers a closed-loop alternative, using biomarkers such as beta-band oscillations to dynamically modulate stimulation. While reinforcement learning (RL) holds promise for personalized aDBS control, existing methods suffer from high sample complexity, unstable exploration in binary action spaces, and limited deployability on resource-constrained hardware. We propose SEA-DBS, a sample-efficient actor-critic framework that addresses the core challenges of RL-based adaptive neurostimulation. SEA-DBS integrates a predictive reward model to reduce reliance on real-time feedback and employs Gumbel Softmax-based exploration for stable, differentiable policy updates in binary action spaces. Together, these components improve sample efficiency, exploration robustness, and compatibility with resource-constrained neuromodulatory hardware. We evaluate SEA-DBS on a biologically realistic simulation of Parkinsonian basal ganglia activity, demonstrating faster convergence, stronger suppression of pathological beta-band power, and resilience to post-training FP16 quantization. Our results show that SEA-DBS offers a practical and effective RL-based aDBS framework for real-time, resource-constrained neuromodulation.
- Abstract(参考訳): ディープ脳刺激(DBS)はパーキンソン病(PD)に対する確立された介入であるが、従来のオープンループシステムは適応性に欠け、継続的な刺激によるエネルギー非効率であり、個々の神経力学に限定的なパーソナライズを提供する。
アダプティブDBS(aDBS)は、ベータバンド発振などのバイオマーカーを使って動的に刺激を変調するクローズドループの代替手段を提供する。
強化学習(RL)は、パーソナライズされたaDBS制御を約束する一方で、既存のメソッドは、高いサンプルの複雑さ、バイナリアクション空間の不安定な探索、リソース制約のあるハードウェアへのデプロイ可能性の制限に悩まされている。
本稿では,RLに基づく適応神経刺激のコア課題に対処する,サンプル効率のよいアクター批判フレームワークSEA-DBSを提案する。
SEA-DBSは、リアルタイムフィードバックへの依存を減らすために予測報酬モデルを統合し、Gumbel Softmaxベースの探索を用いてバイナリアクション空間における安定かつ微分可能なポリシー更新を行う。
これらのコンポーネントは、サンプル効率を改善し、堅牢性を探究し、リソース制約された神経調節ハードウェアとの互換性を高める。
我々は,パーキンソン基底神経節活動の生物学的現実的なシミュレーションに基づいてSEA-DBSを評価し,より高速な収束,病的ベータバンドパワーの抑制,FP16量子化後のレジリエンスについて検討した。
以上の結果から,SEA-DBSは実効的かつ効果的なRLベースのaDBSフレームワークであり,リアルタイムな資源拘束型神経調節を実現することが示唆された。
関連論文リスト
- Neurophysiologically Realistic Environment for Comparing Adaptive Deep Brain Stimulation Algorithms in Parkinson Disease [1.45543311565555]
aDBSでは、外科的に配置された電極が神経生理学的フィードバックに基づいて動的に変化した刺激を脳に送る。
我々は,そのモデルを比較するために,最初の神経生理学的に現実的なベンチマークを導入する。
我々は,ディープラーニング(RL)アルゴリズムを学習し,評価するための構造化環境として,我々のフレームワークを構築した。
論文 参考訳(メタデータ) (2025-04-26T09:44:44Z) - Deep Learning Model Predictive Control for Deep Brain Stimulation in Parkinson's Disease [0.552480439325792]
パーキンソン病(PD)に対するDBSのためのデータ駆動計算アルゴリズムを提案する。
ベータバンド・アクティビティ・レスポンスのシミュレーションモデルを用いたテストでは、トラッキングエラーと制御アクティビティの両方で20%以上を達成する。
提案した制御戦略は、CLDBSを標的としたPDや他の疾患の治療に応用可能な、一般化可能なデータ駆動技術を提供する。
論文 参考訳(メタデータ) (2025-04-01T10:16:49Z) - Online Pseudo-Zeroth-Order Training of Neuromorphic Spiking Neural Networks [69.2642802272367]
スパイクニューラルネットワーク(SNN)を用いた脳誘発ニューロモルフィックコンピューティングは、有望なエネルギー効率の計算手法である。
最近の手法では、空間的および時間的バックプロパゲーション(BP)を利用しており、ニューロモルフィックの性質に固執していない。
オンライン擬似ゼロオーダートレーニング(OPZO)を提案する。
論文 参考訳(メタデータ) (2024-07-17T12:09:00Z) - Towards Understanding the Robustness of Diffusion-Based Purification: A Stochastic Perspective [65.10019978876863]
拡散性浄化(DBP)は、敵の攻撃に対する効果的な防御機構として出現している。
本稿では,DBPプロセスの本質性がロバスト性を駆動する主要な要因であることを示す。
論文 参考訳(メタデータ) (2024-04-22T16:10:38Z) - {\epsilon}-Neural Thompson Sampling of Deep Brain Stimulation for
Parkinson Disease Treatment [15.303196613362099]
本稿では,Deep Brain Stimulation (DBS) デバイスのためのコンテキスト型マルチアームバンディット (CMAB) ソリューションを提案する。
本研究は,基底神経節(BG)領域における不規則ニューロンの発射活動を捉える信号としてコンテキストを定義した。
エプシロン探索戦略は、古典的なトンプソンサンプリング法の上に導入され、エプシロンニューラルツと呼ばれるアルゴリズムが導かれる。
論文 参考訳(メタデータ) (2024-03-11T15:33:40Z) - Offline Learning of Closed-Loop Deep Brain Stimulation Controllers for
Parkinson Disease Treatment [6.576864734526406]
パーキンソン病(PD)による運動負荷に対する脳深部刺激(DBS)の期待
米国食品医薬品局(FDA)が承認したDBSデバイスは、一定の振幅で連続DBS(cDBS)刺激を届けることができる。
このエネルギー非効率な操作は、デバイスのバッテリ寿命を短縮し、動的に活動に適応できず、重大な副作用を引き起こす可能性がある。
論文 参考訳(メタデータ) (2023-02-05T20:29:53Z) - PulseImpute: A Novel Benchmark Task for Pulsative Physiological Signal
Imputation [54.839600943189915]
モバイルヘルス(英語: Mobile Health、mHealth)は、ウェアラブルセンサーを使用して、日常生活中の参加者の生理状態を高頻度で監視し、時間的に精度の高い健康介入を可能にする能力である。
豊富な計算文学にもかかわらず、既存の技術は多くのmHealthアプリケーションを構成する脈動信号には効果がない。
このギャップに対処するPulseImputeは、現実的なmHealth欠損モデル、幅広いベースラインセット、臨床関連下流タスクを含む、最初の大規模パルス信号計算チャレンジである。
論文 参考訳(メタデータ) (2022-12-14T21:39:15Z) - Minimizing Control for Credit Assignment with Strong Feedback [65.59995261310529]
ディープニューラルネットワークにおける勾配に基づくクレジット割り当ての現在の手法は、無限小のフィードバック信号を必要とする。
我々は、神経活動に対する強いフィードバックと勾配に基づく学習を組み合わせることで、ニューラルネットワークの最適化に関する新たな視点を自然に導き出すことを示す。
DFCにおける強いフィードバックを用いることで、空間と時間において完全に局所的な学習規則を用いることで、前向きとフィードバックの接続を同時に学習できることを示す。
論文 参考訳(メタデータ) (2022-04-14T22:06:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。