論文の概要: Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2302.09450v2
- Date: Thu, 1 Jun 2023 03:03:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-03 00:13:57.992507
- Title: Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning
- Title(参考訳): 強化学習によるロバスト二足跳躍制御
- Authors: Zhongyu Li, Xue Bin Peng, Pieter Abbeel, Sergey Levine, Glen Berseth,
Koushil Sreenath
- Abstract要約: この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
- 参考スコア(独自算出の注目度): 141.56016556936865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work aims to push the limits of agility for bipedal robots by enabling a
torque-controlled bipedal robot to perform robust and versatile dynamic jumps
in the real world. We present a reinforcement learning framework for training a
robot to accomplish a large variety of jumping tasks, such as jumping to
different locations and directions. To improve performance on these challenging
tasks, we develop a new policy structure that encodes the robot's long-term
input/output (I/O) history while also providing direct access to a short-term
I/O history. In order to train a versatile jumping policy, we utilize a
multi-stage training scheme that includes different training stages for
different objectives. After multi-stage training, the policy can be directly
transferred to a real bipedal Cassie robot. Training on different tasks and
exploring more diverse scenarios lead to highly robust policies that can
exploit the diverse set of learned maneuvers to recover from perturbations or
poor landings during real-world deployment. Such robustness in the proposed
policy enables Cassie to succeed in completing a variety of challenging jump
tasks in the real world, such as standing long jumps, jumping onto elevated
platforms, and multi-axes jumps.
- Abstract(参考訳): この研究は、トルク制御二足歩行ロボットが現実世界でロバストで多用途な動的ジャンプを行えるようにすることで、二足歩行ロボットのアジリティの限界を押し上げることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
そこで我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを提供する新しいポリシー構造を開発した。
多様なジャンプポリシーを訓練するために,異なる目的のために異なるトレーニング段階を含む多段階のトレーニングスキームを利用する。
マルチステージトレーニングの後、ポリシーは本物の2足歩行のカシーロボットに直接転送できる。
さまざまなタスクのトレーニングと、より多様なシナリオの探索は、現実世界の展開中に摂動や低着陸から回復するために、多種多様な学習操作を活用できる非常に堅牢なポリシーにつながる。
提案されたポリシーのロバスト性により、カッシーは長いジャンプ、高架プラットフォームへのジャンプ、マルチアックスジャンプなど、現実世界での様々な挑戦的なジャンプタスクを完了することができる。
関連論文リスト
- Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Grow Your Limits: Continuous Improvement with Real-World RL for Robotic
Locomotion [66.69666636971922]
本稿では,ロボットの学習過程における探索を調節するポリシー正規化フレームワークであるAPRLを提案する。
APRLは四足歩行ロボットを、数分で完全に現実世界を歩けるように効率よく学習する。
論文 参考訳(メタデータ) (2023-10-26T17:51:46Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - Advanced Skills by Learning Locomotion and Local Navigation End-to-End [10.872193480485596]
本研究は, 深層強化学習によるエンドツーエンド政策の訓練により, 完全な問題を解決することを提案する。
実際の四足歩行ロボットにおけるポリシーの展開を実演する。
論文 参考訳(メタデータ) (2022-09-26T16:35:00Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。