Fugu-MT 論文翻訳(概要): Coprocessor Actor Critic: A Model-Based Reinforcement Learning Approach For Adaptive Brain Stimulation

論文の概要: Coprocessor Actor Critic: A Model-Based Reinforcement Learning Approach For Adaptive Brain Stimulation

arxiv url: http://arxiv.org/abs/2406.06714v2
Date: Mon, 07 Oct 2024 21:07:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 16:49:30.019058
Title: Coprocessor Actor Critic: A Model-Based Reinforcement Learning Approach For Adaptive Brain Stimulation
Title（参考訳）: コプロセッサアクター批判:適応的脳刺激のためのモデルに基づく強化学習アプローチ
Authors: Michelle Pan, Mariah Schrum, Vivek Myers, Erdem Bıyık, Anca Dragan,
Abstract要約: Coprocessor Actor Criticは、脳刺激のためのニューラルコプロセッサポリシーを学ぶための、新しいモデルベース強化学習(MBRL)アプローチである。提案手法は,従来のMFRL手法の限界を,サンプル効率とタスク成功の観点から克服することを示す。
参考スコア（独自算出の注目度）: 5.734832905595746
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Adaptive brain stimulation can treat neurological conditions such as Parkinson's disease and post-stroke motor deficits by influencing abnormal neural activity. Because of patient heterogeneity, each patient requires a unique stimulation policy to achieve optimal neural responses. Model-free reinforcement learning (MFRL) holds promise in learning effective policies for a variety of similar control tasks, but is limited in domains like brain stimulation by a need for numerous costly environment interactions. In this work we introduce Coprocessor Actor Critic, a novel, model-based reinforcement learning (MBRL) approach for learning neural coprocessor policies for brain stimulation. Our key insight is that coprocessor policy learning is a combination of learning how to act optimally in the world and learning how to induce optimal actions in the world through stimulation of an injured brain. We show that our approach overcomes the limitations of traditional MFRL methods in terms of sample efficiency and task success and outperforms baseline MBRL approaches in a neurologically realistic model of an injured brain.
Abstract（参考訳）: 適応的な脳刺激は、パーキンソン病やストローク後の運動障害などの神経疾患を、異常な神経活動に影響を与えることによって治療することができる。患者の不均一性のため、各患者は最適な神経反応を達成するために独自の刺激ポリシーを必要とする。モデルフリー強化学習(MFRL)は、様々な類似した制御タスクの効果的なポリシーを学ぶことを約束するが、多くのコストのかかる環境相互作用の必要性により、脳刺激のような領域で制限される。本稿では,脳刺激のためのニューラルコプロセッサポリシーを学習するための,新しいモデルベース強化学習(MBRL)アプローチであるCoprocessor Actor Criticを紹介する。私たちの重要な洞察は、コプロセッサのポリシー学習は、世界において最適な行動の仕方を学ぶことと、負傷した脳の刺激を通じて世界の最適な行動の仕方を学ぶことの組み合わせであるということです。我々は,従来のMFRL手法の限界を,標本効率とタスク成功の観点から克服し,神経学的に現実的な損傷脳モデルにおいてベースラインMBRLアプローチより優れていることを示す。

関連論文リスト

Neurophysiologically Realistic Environment for Comparing Adaptive Deep Brain Stimulation Algorithms in Parkinson Disease [1.45543311565555]
aDBSでは、外科的に配置された電極が神経生理学的フィードバックに基づいて動的に変化した刺激を脳に送る。我々は,そのモデルを比較するために,最初の神経生理学的に現実的なベンチマークを導入する。我々は,ディープラーニング(RL)アルゴリズムを学習し,評価するための構造化環境として,我々のフレームワークを構築した。
論文参考訳（メタデータ） (2025-04-26T09:44:44Z)
Brain-like Functional Organization within Large Language Models [58.93629121400745]
人間の脳は長い間人工知能(AI)の追求にインスピレーションを与えてきた最近のニューロイメージング研究は、人工ニューラルネットワーク(ANN)の計算的表現と、人間の脳の刺激に対する神経反応との整合性の説得力のある証拠を提供する。本研究では、人工ニューロンのサブグループと機能的脳ネットワーク(FBN)を直接結合することで、このギャップを埋める。このフレームワークはANサブグループをFBNにリンクし、大きな言語モデル(LLM)内で脳に似た機能的組織を記述できる。
論文参考訳（メタデータ） (2024-10-25T13:15:17Z)
Growing Deep Neural Network Considering with Similarity between Neurons [4.32776344138537]
我々は、訓練段階におけるコンパクトモデルにおいて、ニューロン数を漸進的に増加させる新しいアプローチを探求する。本稿では,ニューロン類似性分布に基づく制約を導入することにより,特徴抽出バイアスと神経冗長性を低減する手法を提案する。 CIFAR-10とCIFAR-100データセットの結果、精度が向上した。
論文参考訳（メタデータ） (2024-08-23T11:16:37Z)
Lifelong Reinforcement Learning via Neuromodulation [13.765526492965853]
進化は、高度に効果的な適応学習機能と意思決定戦略を持つ動物や人間に影響を与えた。これらの理論の中心であり、神経科学の証拠を学習に組み込むことが神経調節システムである。
論文参考訳（メタデータ） (2024-08-15T22:53:35Z)
Enhancing learning in spiking neural networks through neuronal heterogeneity and neuromodulatory signaling [52.06722364186432]
人工ニューラルネットワーク(ANN)の強化のための生物学的インフォームドフレームワークを提案する。提案したデュアルフレームアプローチは、多様なスパイキング動作をエミュレートするためのスパイキングニューラルネットワーク(SNN)の可能性を強調している。提案手法は脳にインスパイアされたコンパートメントモデルとタスク駆動型SNN, バイオインスピレーション, 複雑性を統合している。
論文参考訳（メタデータ） (2024-07-05T14:11:28Z)
A Differentiable Approach to Multi-scale Brain Modeling [3.5874544981360987]
本稿では,脳シミュレータBrainPyを用いたマルチスケール微分脳モデリングワークフローを提案する。単一ニューロンレベルでは、微分可能なニューロンモデルを実装し、電気生理学的データへの適合を最適化するために勾配法を用いる。ネットワークレベルでは、生物学的に制約されたネットワークモデルを構築するためにコネクトロミックデータを組み込む。
論文参考訳（メタデータ） (2024-06-28T07:41:31Z)
MindBridge: A Cross-Subject Brain Decoding Framework [60.58552697067837]
脳の復号化は、獲得した脳信号から刺激を再構築することを目的としている。現在、脳の復号化はモデルごとのオブジェクトごとのパラダイムに限られている。我々は,1つのモデルのみを用いることで,オブジェクト間脳デコーディングを実現するMindBridgeを提案する。
論文参考訳（メタデータ） (2024-04-11T15:46:42Z)
Contrastive-Signal-Dependent Plasticity: Self-Supervised Learning in Spiking Neural Circuits [61.94533459151743]
この研究は、スパイキングネットワークのシナプスを調整するための神経生物学的に動機づけられたスキームを設計することの課題に対処する。我々の実験シミュレーションは、繰り返しスパイクネットワークを訓練する際、他の生物学的に証明可能なアプローチに対して一貫した優位性を示す。
論文参考訳（メタデータ） (2023-03-30T02:40:28Z)
Control of synaptic plasticity via the fusion of reinforcement learning and unsupervised learning in neural networks [0.0]
認知神経科学では、シナプスの可塑性が我々の驚くべき学習能力に不可欠な役割を担っていると広く受け入れられている。このインスピレーションにより、強化学習と教師なし学習の融合により、新しい学習規則が提案される。提案した計算モデルでは,非線形最適制御理論を誤差フィードバックループ系に類似させる。
論文参考訳（メタデータ） (2023-03-26T12:18:03Z)
Neural Co-Processors for Restoring Brain Function: Results from a Cortical Model of Grasping [0.0]
ニューラルネットワークとディープラーニングを用いて最適なクローズドループ刺激ポリシーを学習する「ニューラルコプロセッサ」を提案する。コプロセッサは、生体回路自体が刺激に適応するにつれて刺激ポリシーに適応し、脳-デバイス共適応の一形態を達成する。
論文参考訳（メタデータ） (2022-10-19T04:13:33Z)
Multimodal foundation models are better simulators of the human brain [65.10501322822881]
1500万の画像テキストペアを事前訓練した,新たに設計されたマルチモーダル基礎モデルを提案する。視覚的エンコーダも言語的エンコーダもマルチモーダルで訓練され,脳に近いことが判明した。
論文参考訳（メタデータ） (2022-08-17T12:36:26Z)
Neural Language Models are not Born Equal to Fit Brain Data, but Training Helps [75.84770193489639]
音声ブックを聴く被験者の機能的磁気共鳴イメージングの時間軸予測に及ぼすテスト損失,トレーニングコーパス,モデルアーキテクチャの影響について検討した。各モデルの訓練されていないバージョンは、同じ単語をまたいだ脳反応の類似性を捉えることで、脳内のかなりの量のシグナルをすでに説明していることがわかりました。ニューラル言語モデルを用いたヒューマン・ランゲージ・システムの説明を目的とした今後の研究の実践を提案する。
論文参考訳（メタデータ） (2022-07-07T15:37:17Z)
Backprop-Free Reinforcement Learning with Active Neural Generative Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文参考訳（メタデータ） (2021-07-10T19:02:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。