論文の概要: Learning to Walk: Spike Based Reinforcement Learning for Hexapod Robot
Central Pattern Generation
- arxiv url: http://arxiv.org/abs/2003.10026v1
- Date: Sun, 22 Mar 2020 23:45:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 05:44:17.858619
- Title: Learning to Walk: Spike Based Reinforcement Learning for Hexapod Robot
Central Pattern Generation
- Title(参考訳): 歩行学習:六足歩行ロボット中央パターン生成のためのスパイクに基づく強化学習
- Authors: Ashwin Sanjay Lele, Yan Fang, Justin Ting, Arijit Raychowdhury
- Abstract要約: 2足歩行、四足歩行、六足歩行では勾配、深部強化学習(RL)などの手法が研究されている。
スパイクニューラルネットワーク(SNN)の最近の進歩は、神経のスパース発射による計算の大幅な削減を約束している。
スパイキングパターン生成器のトレーニングのための強化型重み更新手法を提案する。
- 参考スコア(独自算出の注目度): 2.4603302139672003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning to walk -- i.e., learning locomotion under performance and energy
constraints continues to be a challenge in legged robotics. Methods such as
stochastic gradient, deep reinforcement learning (RL) have been explored for
bipeds, quadrupeds and hexapods. These techniques are computationally intensive
and often prohibitive for edge applications. These methods rely on complex
sensors and pre-processing of data, which further increases energy and latency.
Recent advances in spiking neural networks (SNNs) promise a significant
reduction in computing owing to the sparse firing of neuros and has been shown
to integrate reinforcement learning mechanisms with biologically observed spike
time dependent plasticity (STDP). However, training a legged robot to walk by
learning the synchronization patterns of central pattern generators (CPG) in an
SNN framework has not been shown. This can marry the efficiency of SNNs with
synchronized locomotion of CPG based systems providing breakthrough end-to-end
learning in mobile robotics. In this paper, we propose a reinforcement based
stochastic weight update technique for training a spiking CPG. The whole system
is implemented on a lightweight raspberry pi platform with integrated sensors,
thus opening up exciting new possibilities.
- Abstract(参考訳): 歩行の学習 — すなわち、パフォーマンスとエネルギーの制約の下での移動を学ぶことは、脚のあるロボット工学における課題であり続けている。
2足歩行、四足歩行、六足歩行では、確率勾配、深部強化学習(RL)などの手法が研究されている。
これらの技術は計算集約的で、エッジアプリケーションではしばしば禁止される。
これらの手法は複雑なセンサーとデータの前処理に依存しており、エネルギーと遅延をさらに増加させる。
スパイクニューラルネットワーク(SNN)の最近の進歩は、神経のスパース発射による計算の大幅な削減を約束し、生物学的に観察されたスパイク時間依存性の可塑性(STDP)と強化学習機構を統合することが示されている。
しかし,snフレームワークにおける中央パターン生成器(cpg)の同期パターンを学習して歩行するロボットの訓練は行われていない。
これは、モバイルロボティクスにおける突破口学習を提供するCPGベースのシステムの同期ロコモーションとSNNの効率を結合することができる。
本稿では, スパイキングCPGのトレーニングのための強化型確率的重み更新手法を提案する。
システム全体が、センサーを内蔵した軽量のRaspberry piプラットフォーム上に実装され、エキサイティングな新しい可能性を開く。
関連論文リスト
- Adaptive Robotic Arm Control with a Spiking Recurrent Neural Network on a Digital Accelerator [41.60361484397962]
本稿では,システムの概要と,Pynq ZUプラットフォーム上で使用するPythonフレームワークについて述べる。
シミュレーションされた精度は,毎秒380万イベントのピーク性能で維持されていることを示す。
論文 参考訳(メタデータ) (2024-05-21T14:59:39Z) - Astrocyte Regulated Neuromorphic Central Pattern Generator Control of
Legged Robotic Locomotion [3.7814142008074954]
本稿では,四足歩行ロボットの移動歩行を学習するためのアストロサイト制御スパイキングニューラルネットワーク(SNN)を用いた CPG を提案する。
SNNベースのCPGは、多目的物理シミュレーションプラットフォーム上でシミュレーションされ、平地でロボットを走らせながらトロッティング歩行が出現する。
最先端の強化学習に基づくロボット制御アルゴリズムと比較して、23.3Times$計算パワーセーブが観測される。
論文 参考訳(メタデータ) (2023-12-25T20:33:16Z) - SpikingJelly: An open-source machine learning infrastructure platform
for spike-based intelligence [51.6943465041708]
スパイキングニューラルネットワーク(SNN)は、高エネルギー効率のニューロモルフィックチップに脳にインスパイアされたインテリジェンスを実現することを目的としている。
我々は、ニューロモルフィックデータセットの事前処理、深層SNNの構築、パラメータの最適化、およびニューロモルフィックチップへのSNNのデプロイのためのフルスタックツールキットをコントリビュートする。
論文 参考訳(メタデータ) (2023-10-25T13:15:17Z) - Neuromorphic analog circuits for robust on-chip always-on learning in
spiking neural networks [1.9809266426888898]
混合信号ニューロモルフィックシステムは、極端コンピューティングタスクを解決するための有望なソリューションである。
彼らのスパイクニューラルネットワーク回路は、連続的にセンサーデータをオンラインに処理するために最適化されている。
我々は,短期的アナログ力学と長期的三状態離散化機構を備えたオンチップ学習回路を設計する。
論文 参考訳(メタデータ) (2023-07-12T11:14:25Z) - Evolving Connectivity for Recurrent Spiking Neural Networks [8.80300633999542]
リカレントニューラルネットワーク(RSNN)は、人工知能の進歩に大きな可能性を秘めている。
本稿では、RSNNをトレーニングするための推論のみの手法である、進化的接続性(EC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-28T07:08:25Z) - SPIDE: A Purely Spike-based Method for Training Feedback Spiking Neural
Networks [56.35403810762512]
イベントベースの計算を伴うスパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェアにおけるエネルギー効率の高い応用のために、脳にインスパイアされたモデルを約束している。
本研究では,最近提案されたトレーニング手法を拡張した平衡状態(SPIDE)に対するスパイクに基づく暗黙差分法について検討した。
論文 参考訳(メタデータ) (2023-02-01T04:22:59Z) - Intelligence Processing Units Accelerate Neuromorphic Learning [52.952192990802345]
スパイキングニューラルネットワーク(SNN)は、エネルギー消費と遅延の観点から、桁違いに改善されている。
我々は、カスタムSNN PythonパッケージsnnTorchのIPU最適化リリースを提示する。
論文 参考訳(メタデータ) (2022-11-19T15:44:08Z) - Online Training Through Time for Spiking Neural Networks [66.7744060103562]
スパイキングニューラルネットワーク(SNN)は、脳にインスパイアされたエネルギー効率のモデルである。
近年のトレーニング手法の進歩により、レイテンシの低い大規模タスクにおいて、ディープSNNを成功させることができた。
本稿では,BPTT から派生した SNN の時間的学習(OTTT)によるオンライントレーニングを提案する。
論文 参考訳(メタデータ) (2022-10-09T07:47:56Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Indirect and Direct Training of Spiking Neural Networks for End-to-End
Control of a Lane-Keeping Vehicle [12.137685936113384]
生物学的シナプス可塑性に基づくスパイクニューラルネットワーク(SNN)の構築は、高速でエネルギー効率のよい計算を実現するための有望な可能性を秘めている。
本稿では,車線維持車両におけるSNNの間接的および直接的エンドツーエンドのトレーニング手法について紹介する。
論文 参考訳(メタデータ) (2020-03-10T09:35:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。