論文の概要: DeepCPG Policies for Robot Locomotion
- arxiv url: http://arxiv.org/abs/2302.13191v1
- Date: Sat, 25 Feb 2023 23:16:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 18:20:23.042375
- Title: DeepCPG Policies for Robot Locomotion
- Title(参考訳): ロボット移動のためのDeepCPGポリシー
- Authors: Aditya M. Deshpande and Eric Hurd and Ali A. Minai and Manish Kumar
- Abstract要約: より大きなニューラルネットワークのレイヤとしてCPGを組み込む新しいDeepCPGポリシー。
従来のアプローチと比較して、DeepCPGポリシーは効果的な移動戦略のサンプル効率のよいエンドツーエンド学習を可能にする。
以上の結果から,ロボットプラットフォーム上での非自明なセンサとモータの統合が実現できることが示唆された。
- 参考スコア(独自算出の注目度): 1.0057838324294686
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Central Pattern Generators (CPGs) form the neural basis of the observed
rhythmic behaviors for locomotion in legged animals. The CPG dynamics organized
into networks allow the emergence of complex locomotor behaviors. In this work,
we take this inspiration for developing walking behaviors in multi-legged
robots. We present novel DeepCPG policies that embed CPGs as a layer in a
larger neural network and facilitate end-to-end learning of locomotion
behaviors in deep reinforcement learning (DRL) setup. We demonstrate the
effectiveness of this approach on physics engine-based insectoid robots. We
show that, compared to traditional approaches, DeepCPG policies allow
sample-efficient end-to-end learning of effective locomotion strategies even in
the case of high-dimensional sensor spaces (vision). We scale the DeepCPG
policies using a modular robot configuration and multi-agent DRL. Our results
suggest that gradual complexification with embedded priors of these policies in
a modular fashion could achieve non-trivial sensor and motor integration on a
robot platform. These results also indicate the efficacy of bootstrapping more
complex intelligent systems from simpler ones based on biological principles.
Finally, we present the experimental results for a proof-of-concept insectoid
robot system for which DeepCPG learned policies initially using the simulation
engine and these were afterwards transferred to real-world robots without any
additional fine-tuning.
- Abstract(参考訳): 中枢パターン発生器(cpgs)は、足の動物の移動に対する観察されたリズム行動の神経基盤を形成する。
ネットワークに組織されたCPGダイナミクスは、複雑な移動行動の出現を可能にする。
本研究では,多足歩行ロボットにおける歩行行動の発達にインスピレーションを与える。
我々は,大規模ニューラルネットワークの層としてCPGを組み込んだ新しいDeepCPGポリシーを提案し,深層強化学習(DRL)における移動行動のエンドツーエンド学習を容易にする。
物理エンジンを用いた昆虫型ロボットにおける本手法の有効性を実証する。
従来のアプローチと比較して,高次元センサ空間 (ビジョン) においても,deepcpg ポリシーは効果的なロコモーション戦略のサンプル効率のよいエンドツーエンド学習を可能にする。
我々は,モジュール型ロボット構成とマルチエージェントdrlを用いて,deepcpgポリシーをスケールする。
以上の結果から,ロボットプラットフォーム上でのセンサやモータの統合は,これらのポリシーの組込み先をモジュール方式で段階的に複雑化する可能性が示唆された。
これらの結果は、生物学的原理に基づくより単純なシステムからより複雑なインテリジェントシステムをブートストラップする効果を示す。
最後に,DeepCPGが当初シミュレーションエンジンを用いてポリシーを学習し,その後,追加の微調整を行わずに現実のロボットに移行した概念実証昆虫型ロボットシステムの実験結果を示す。
関連論文リスト
- Astrocyte Regulated Neuromorphic Central Pattern Generator Control of
Legged Robotic Locomotion [3.7814142008074954]
本稿では,四足歩行ロボットの移動歩行を学習するためのアストロサイト制御スパイキングニューラルネットワーク(SNN)を用いた CPG を提案する。
SNNベースのCPGは、多目的物理シミュレーションプラットフォーム上でシミュレーションされ、平地でロボットを走らせながらトロッティング歩行が出現する。
最先端の強化学習に基づくロボット制御アルゴリズムと比較して、23.3Times$計算パワーセーブが観測される。
論文 参考訳(メタデータ) (2023-12-25T20:33:16Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Human-AI Shared Control via Frequency-based Policy Dissection [34.0399894373716]
人間-AI共有制御は、複雑な環境で制御タスクを達成するために、人間がAIと対話し、協力することを可能にする。
従来の強化学習(RL)手法は、人間の制御可能なポリシーを達成するために目標条件付き設計を試みる。
我々は、学習したニューラルコントローラの中間表現とエージェント動作の運動特性を整合させる、TextitPolicy Dissectionと呼ばれるシンプルで効果的な周波数ベースのアプローチを開発した。
論文 参考訳(メタデータ) (2022-05-31T23:57:55Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - An Energy-Saving Snake Locomotion Gait Policy Using Deep Reinforcement
Learning [0.0]
この研究では、エネルギー効率の高い制御のための深層強化学習(DRL)を介してヘビの移動歩行政策を開発する。
角速度でパラメータ化された各関節モータに近位政策最適化(ppo)を適用し,drlエージェントは各時間ステップで標準サーペノイド曲線を学習する。
従来の制御戦略と比較して、訓練されたppoエージェントによって制御されたスネークロボットは、より速く動き、よりエネルギー効率の良い歩行を実現できる。
論文 参考訳(メタデータ) (2021-03-08T02:06:44Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - An Astrocyte-Modulated Neuromorphic Central Pattern Generator for
Hexapod Robot Locomotion on Intel's Loihi [0.0]
移動は、自然界に豊富な生物学的ネットワークによって「不運に」対処される脚のあるロボットにとって重要な課題であり、中央パターンジェネレータ(CPG)と呼ばれる。
そこで本研究では,ヘキサポッドロボットの歩行パターンを2つ生成する網羅的スパイキング型ニューラル・アストロサイトティックネットワークに基づく脳型CPG制御器を提案する。
我々の研究結果は、自律移動ロボットにおいて、この方法や、Loihiが制御するロコモーションへのアプローチを拡大する道を開いた。
論文 参考訳(メタデータ) (2020-06-08T17:35:48Z) - Populations of Spiking Neurons for Reservoir Computing: Closed Loop
Control of a Compliant Quadruped [64.64924554743982]
本稿では,ニューラルネットワークを用いた中央パターン生成機構を実装し,閉ループロボット制御を実現するためのフレームワークを提案する。
本研究では,従順な四足歩行ロボットのシミュレーションモデル上で,予め定義された歩行パターン,速度制御,歩行遷移の学習を実演する。
論文 参考訳(メタデータ) (2020-04-09T14:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。