論文の概要: Embodied Synaptic Plasticity with Online Reinforcement learning
- arxiv url: http://arxiv.org/abs/2003.01431v1
- Date: Tue, 3 Mar 2020 10:29:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 21:42:29.704279
- Title: Embodied Synaptic Plasticity with Online Reinforcement learning
- Title(参考訳): オンライン強化学習による身体的シナプス塑性
- Authors: Jacques Kaiser, Michael Hoff, Andreas Konle, J. Camilo Vasquez Tieck,
David Kappel, Daniel Reichard, Anand Subramoney, Robert Legenstein, Arne
Roennau, Wolfgang Maass, Rudiger Dillmann
- Abstract要約: 本稿では,これら2つの分野からオープンソースソフトウェアコンポーネントを統合することにより,計算神経科学とロボティクスの分野を連携させることに寄与する。
本稿では, オンライン強化学習(SPORE)によるシナプス塑性評価の枠組みについて述べる。
- 参考スコア(独自算出の注目度): 5.6006805285925445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The endeavor to understand the brain involves multiple collaborating research
fields. Classically, synaptic plasticity rules derived by theoretical
neuroscientists are evaluated in isolation on pattern classification tasks.
This contrasts with the biological brain which purpose is to control a body in
closed-loop. This paper contributes to bringing the fields of computational
neuroscience and robotics closer together by integrating open-source software
components from these two fields. The resulting framework allows to evaluate
the validity of biologically-plausibe plasticity models in closed-loop robotics
environments. We demonstrate this framework to evaluate Synaptic Plasticity
with Online REinforcement learning (SPORE), a reward-learning rule based on
synaptic sampling, on two visuomotor tasks: reaching and lane following. We
show that SPORE is capable of learning to perform policies within the course of
simulated hours for both tasks. Provisional parameter explorations indicate
that the learning rate and the temperature driving the stochastic processes
that govern synaptic learning dynamics need to be regulated for performance
improvements to be retained. We conclude by discussing the recent deep
reinforcement learning techniques which would be beneficial to increase the
functionality of SPORE on visuomotor tasks.
- Abstract(参考訳): 脳を理解するための努力には、複数の共同研究分野が含まれる。
古典的に、理論神経科学者によって導かれるシナプス可塑性規則は、パターン分類タスクにおいて孤立的に評価される。
これは、クローズドループで身体を制御することを目的とした生物学的脳とは対照的である。
本稿では,これら2つの分野からオープンソースソフトウェアコンポーネントを統合することにより,計算神経科学とロボティクスの分野を連携させることに寄与する。
このフレームワークにより、クローズドループロボット環境における生物学的プラシブ可塑性モデルの妥当性を評価することができる。
本稿では,オンライン強化学習(SPORE)によるシナプス塑性評価の枠組みについて述べる。
両タスクのシミュレーション時間内にSPOREがポリシーを学習できることを示す。
仮パラメータ探索は、シナプス学習ダイナミクスを支配する確率過程を駆動する学習速度と温度は、パフォーマンス改善を維持するために調整される必要があることを示している。
最後に,visoomotorタスクにおけるsporeの機能向上に有効な最近の深層強化学習手法について考察した。
関連論文リスト
- Brain-inspired continual pre-trained learner via silent synaptic consolidation [2.872028467114491]
アーティは、成熟した脳で観察されるスパイク刺激依存性の可塑性を介してサイレントシナプスの活性化機構にインスパイアされている。
学習済みのネットワーク内で学習した知識のメモリ安定性を維持することで、成熟した脳のダイナミクスを模倣する。
推論中、人工的なサイレントと機能的なシナプスを使用して、事前訓練されたネットワークとサブネットワークとの間の正確な接続を確立する。
論文 参考訳(メタデータ) (2024-10-08T10:56:19Z) - Theories of synaptic memory consolidation and intelligent plasticity for continual learning [7.573586022424398]
シナプスの可塑性機構は 内部状態を維持し 進化させなければならない
可塑性アルゴリズムは 内部の状態を利用して 個々のシナプスで 可塑性をインテリジェントに制御する必要がある
論文 参考訳(メタデータ) (2024-05-27T08:13:39Z) - Single Neuromorphic Memristor closely Emulates Multiple Synaptic
Mechanisms for Energy Efficient Neural Networks [71.79257685917058]
我々はこれらのシナプス機能を本質的にエミュレートするSrTiO3に基づく膜状ナノデバイスを実証する。
これらのメムリスタは、安定かつエネルギー効率の良い運転を可能にする非定常低導電系で機能する。
論文 参考訳(メタデータ) (2024-02-26T15:01:54Z) - Brain-Inspired Machine Intelligence: A Survey of
Neurobiologically-Plausible Credit Assignment [65.268245109828]
本稿では,神経生物学にインスパイアされた,あるいは動機付けられた人工ニューラルネットワークにおける信用割当を行うアルゴリズムについて検討する。
我々は、脳にインスパイアされた学習スキームを6つの一般的なファミリーにまとめ、これらを誤りのバックプロパゲーションの文脈で検討する。
本研究の成果は,神経ミメティックシステムとその構成的学習プロセスの今後の発展を促進することを目的としている。
論文 参考訳(メタデータ) (2023-12-01T05:20:57Z) - Learning with Chemical versus Electrical Synapses -- Does it Make a
Difference? [61.85704286298537]
バイオインスパイアされたニューラルネットワークは、ニューラルネットワークの理解を深め、AIシステムの最先端を改善する可能性がある。
我々は,光リアルな自律走行シミュレータを用いて自律車線維持実験を行い,その性能を種々の条件下で評価する。
論文 参考訳(メタデータ) (2023-11-21T13:07:20Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Contrastive-Signal-Dependent Plasticity: Self-Supervised Learning in Spiking Neural Circuits [61.94533459151743]
この研究は、スパイキングネットワークのシナプスを調整するための神経生物学的に動機づけられたスキームを設計することの課題に対処する。
我々の実験シミュレーションは、繰り返しスパイクネットワークを訓練する際、他の生物学的に証明可能なアプローチに対して一貫した優位性を示す。
論文 参考訳(メタデータ) (2023-03-30T02:40:28Z) - Tuning Synaptic Connections instead of Weights by Genetic Algorithm in Spiking Policy Network [16.876474167808784]
現代の深層強化学習(DRL)は、相互作用から学ぶための計算的アプローチを探求している。
DRLの代替エネルギーとして遺伝的アルゴリズムを用いたスパイキングポリシーネットワーク(SPN)を最適化した。
生物学的研究によって、脳は新たなシナプス接続を創造することで記憶を形成することが示され、与えられたタスクを解決するためにSPNの重みの代わりにシナプス接続を調整した。
論文 参考訳(メタデータ) (2022-12-29T12:36:36Z) - A Spiking Neuron Synaptic Plasticity Model Optimized for Unsupervised
Learning [0.0]
スパイキングニューラルネットワーク(SNN)は、教師なし、教師なし、強化学習など、あらゆる種類の学習タスクを実行するための視点ベースとして考えられている。
SNNでの学習は、シナプス前およびシナプス後ニューロンの活動に依存するシナプス重みのダイナミクスを決定する規則であるシナプス可塑性によって実施される。
論文 参考訳(メタデータ) (2021-11-12T15:26:52Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Meta-Learning through Hebbian Plasticity in Random Networks [12.433600693422235]
生涯学習と適応性は生物学的エージェントの2つの決定的な側面である。
この生物学的メカニズムに着想を得て,シナプス固有のヘビアン学習規則のみを探索する探索法を提案する。
完全にランダムな重みから始めると、発見されたヘビーンの規則により、エージェントは動的2Dピクセル環境をナビゲートできる。
論文 参考訳(メタデータ) (2020-07-06T14:32:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。