論文の概要: Learning fast and agile quadrupedal locomotion over complex terrain
- arxiv url: http://arxiv.org/abs/2207.00797v1
- Date: Sat, 2 Jul 2022 11:20:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 15:38:31.722926
- Title: Learning fast and agile quadrupedal locomotion over complex terrain
- Title(参考訳): 複雑な地形上での高速でアジャイルな四足歩行学習
- Authors: Xu Chang, Zhitong Zhang, Honglei An, Hongxu Ma, Qing Wei
- Abstract要約: 本研究は,視覚障害者用4足歩行ロボットにおいて,自然かつ安定に高速な移動を実現する頑健な制御器を提案する。
モデルレス強化学習によりシミュレーション環境で学習する。
我々の制御器は優れた反ゆらぎ性能を有し、学習したことのない移動速度に到達できる優れた一般化能力を有する。
- 参考スコア(独自算出の注目度): 0.3806109052869554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a robust controller that achieves natural and
stably fast locomotion on a real blind quadruped robot. With only
proprioceptive information, the quadruped robot can move at a maximum speed of
10 times its body length, and has the ability to pass through various complex
terrains. The controller is trained in the simulation environment by model-free
reinforcement learning. In this paper, the proposed loose neighborhood control
architecture not only guarantees the learning rate, but also obtains an action
network that is easy to transfer to a real quadruped robot. Our research finds
that there is a problem of data symmetry loss during training, which leads to
unbalanced performance of the learned controller on the left-right symmetric
quadruped robot structure, and proposes a mirror-world neural network to solve
the performance problem. The learned controller composed of the mirror-world
network can make the robot achieve excellent anti-disturbance ability. No
specific human knowledge such as a foot trajectory generator are used in the
training architecture. The learned controller can coordinate the robot's gait
frequency and locomotion speed, and the locomotion pattern is more natural and
reasonable than the artificially designed controller. Our controller has
excellent anti-disturbance performance, and has good generalization ability to
reach locomotion speeds it has never learned and traverse terrains it has never
seen before.
- Abstract(参考訳): 本稿では,実ブラインド四足ロボット上で自然かつ安定してロコモーションを実現するロバストな制御器を提案する。
知覚情報だけで、四足ロボットは体長の10倍の最大速度で動き、様々な複雑な地形を通り抜けることができる。
コントローラはモデルフリーの強化学習によりシミュレーション環境で訓練される。
本稿では,提案するゆるい近傍制御アーキテクチャは,学習速度を保証できるだけでなく,実四足ロボットへの移動が容易な行動ネットワークを得る。
本研究では,訓練中にデータ対称性の損失が問題となり,左右対称四足ロボット構造における学習制御器の性能が不均衡に陥り,性能問題を解決するためにミラーワールドニューラルネットワークを提案する。
ミラーワールドネットワークで構成された学習コントローラは、ロボットを優れた反ゆらぎ能力を達成することができる。
トレーニングアーキテクチャでは、足の軌跡生成器のような特定の人間知識は使用されません。
学習したコントローラはロボットの歩行周波数と移動速度を調整でき、移動パターンは人工的に設計されたコントローラよりも自然で合理的である。
我々のコントローラーは優れた耐震性能を有し、学習したことのない移動速度に到達し、これまで見たことのない地形を横断できる優れた一般化能力を有する。
関連論文リスト
- Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - Rapid Locomotion via Reinforcement Learning [15.373208553045416]
我々はMIT Mini Cheetahで記録的な俊敏性を実現するエンドツーエンドの学習コントローラを提案する。
このシステムは、草、氷、砂利などの自然の地形で速く動き、乱れに強く反応する。
論文 参考訳(メタデータ) (2022-05-05T17:55:11Z) - Fast and Efficient Locomotion via Learned Gait Transitions [35.86279693549959]
四足歩行ロボットのための効率的な制御器の開発に焦点をあてる。
特徴ある移動経路と自然な歩行遷移が自動的に現れる階層的学習フレームワークを考案する。
学習した階層型コントローラは,ベースラインコントローラよりも広い移動速度でエネルギーを消費することがわかった。
論文 参考訳(メタデータ) (2021-04-09T23:53:28Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。