論文の概要: Advanced Skills by Learning Locomotion and Local Navigation End-to-End
- arxiv url: http://arxiv.org/abs/2209.12827v1
- Date: Mon, 26 Sep 2022 16:35:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 18:10:43.288151
- Title: Advanced Skills by Learning Locomotion and Local Navigation End-to-End
- Title(参考訳): 移動学習とナビゲーションのエンド・ツー・エンドによる高度化
- Authors: Nikita Rudin, David Hoeller, Marko Bjelonic and Marco Hutter
- Abstract要約: 本研究は, 深層強化学習によるエンドツーエンド政策の訓練により, 完全な問題を解決することを提案する。
実際の四足歩行ロボットにおけるポリシーの展開を実演する。
- 参考スコア(独自算出の注目度): 10.872193480485596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The common approach for local navigation on challenging environments with
legged robots requires path planning, path following and locomotion, which
usually requires a locomotion control policy that accurately tracks a commanded
velocity. However, by breaking down the navigation problem into these
sub-tasks, we limit the robot's capabilities since the individual tasks do not
consider the full solution space. In this work, we propose to solve the
complete problem by training an end-to-end policy with deep reinforcement
learning. Instead of continuously tracking a precomputed path, the robot needs
to reach a target position within a provided time. The task's success is only
evaluated at the end of an episode, meaning that the policy does not need to
reach the target as fast as possible. It is free to select its path and the
locomotion gait. Training a policy in this way opens up a larger set of
possible solutions, which allows the robot to learn more complex behaviors. We
compare our approach to velocity tracking and additionally show that the time
dependence of the task reward is critical to successfully learn these new
behaviors. Finally, we demonstrate the successful deployment of policies on a
real quadrupedal robot. The robot is able to cross challenging terrains, which
were not possible previously, while using a more energy-efficient gait and
achieving a higher success rate.
- Abstract(参考訳): 脚のあるロボットによる挑戦的な環境のローカルナビゲーションには、経路計画、経路追従、移動が必要であり、通常は、指示された速度を正確に追跡する移動制御ポリシーが必要である。
しかし、ナビゲーション問題をこれらのサブタスクに分割することにより、個々のタスクが完全なソリューション空間を考慮しないため、ロボットの能力を制限する。
本研究は, 深層強化学習によるエンドツーエンド政策の訓練により, 完全な問題を解決することを提案する。
事前に計算された経路を継続的に追跡する代わりに、ロボットは所定の時間内に目標位置に到達する必要がある。
タスクの成功はエピソードの最後にのみ評価されるため、ポリシーができるだけ早くターゲットに到達する必要はない。
その経路とロコモーションの歩行は自由に選択できる。
この方法でポリシーをトレーニングすると、より多くの可能なソリューションセットが開き、ロボットはより複雑な振る舞いを学習できるようになる。
速度追跡に対する我々のアプローチを比較し、タスク報酬の時間依存がこれらの新しい振る舞いをうまく学習するのに重要であることを示す。
最後に、実際の四足ロボットに対するポリシーの展開の成功を実証する。
このロボットは、以前不可能だった挑戦的な地形を横断でき、よりエネルギー効率の良い歩行と高い成功率を達成できる。
関連論文リスト
- Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning [11.134855513221359]
本稿では,多ボット情報経路計画のための新しい深層強化学習手法を提案する。
我々は、集中的な訓練と分散実行パラダイムを通じて強化学習政策を訓練する。
提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。
論文 参考訳(メタデータ) (2024-09-25T14:27:37Z) - Learning Bipedal Walking for Humanoid Robots in Challenging Environments with Obstacle Avoidance [0.3481985817302898]
深層強化学習は、動的歩行を実現するためのヒューマノイドロボットの実装に成功している。
本稿では,政策に基づく強化学習を用いて,障害物が存在する環境下での2足歩行を実現することを目的とする。
論文 参考訳(メタデータ) (2024-09-25T07:02:04Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Legged Locomotion in Challenging Terrains using Egocentric Vision [70.37554680771322]
本稿では,階段,縁石,石段,隙間を横断できる最初のエンドツーエンド移動システムを提案する。
この結果を,1台の前面深度カメラを用いた中型四足歩行ロボットに示す。
論文 参考訳(メタデータ) (2022-11-14T18:59:58Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - Deep Hierarchical Planning from Pixels [86.14687388689204]
Directorは、学習された世界モデルの潜在空間内で計画し、ピクセルから直接階層的な振る舞いを学ぶ方法である。
潜在空間で運用されているにもかかわらず、世界モデルは視覚化のためにゴールを画像にデコードできるため、決定は解釈可能である。
Directorはまた、ビジュアルコントロール、Atariゲーム、DMLabレベルなど、幅広い環境で成功した行動を学ぶ。
論文 参考訳(メタデータ) (2022-06-08T18:20:15Z) - Coupling Vision and Proprioception for Navigation of Legged Robots [65.59559699815512]
我々は視覚と受容の相補的な強みを利用して、脚のあるロボットでポイントゴールナビゲーションを実現する。
車輪付きロボット(LoCoBot)のベースラインよりも優れた性能を示す。
また,センサーと計算能力を備えた四足歩行ロボットに,我々のシステムを実環境に展開することも示す。
論文 参考訳(メタデータ) (2021-12-03T18:59:59Z) - Real Robot Challenge using Deep Reinforcement Learning [6.332038240397164]
本稿では,2021年リアルロボットチャレンジの第1フェーズの優勝を詳述する。
課題は、3本指のロボットが特定の目標軌道に沿って立方体を運ばなければならないことだ。
我々は、ロボットシステムの知識を最小限にする必要のある、純粋な強化学習アプローチを使用している。
論文 参考訳(メタデータ) (2021-09-30T16:12:17Z) - Adaptation of Quadruped Robot Locomotion with Meta-Learning [64.71260357476602]
本研究では,多岐にわたる移動課題を解くロボットの訓練にメタ強化学習を用いることを実証する。
メタトレーニングロボットのパフォーマンスは、単一のタスクでトレーニングされたロボットと似ている。
論文 参考訳(メタデータ) (2021-07-08T10:37:18Z) - Passing Through Narrow Gaps with Deep Reinforcement Learning [2.299414848492227]
本稿では,小さな隙間を自律的に航行する深層強化学習手法を提案する。
我々はまず,ロボットとギャップとの接触が必要な小さなギャップを乗り越えるために,ギャップ行動ポリシーを学習する。
シミュレーション実験では,操作者が手動でギャップ動作を動作させると,93%の成功率が得られる。
実際のロボット実験では、手動アクティベーションで73%、自律的な行動選択で40%の成功率を達成した。
論文 参考訳(メタデータ) (2021-03-06T00:10:41Z) - LBGP: Learning Based Goal Planning for Autonomous Following in Front [16.13120109400351]
本稿では, 深部強化学習(RL)と古典的軌道計画を組み合わせたハイブリッド・ソリューションについて検討する。
自律ロボットは、人が自由に歩き回るとき、人の前に留まることを目的としています。
本システムは,シミュレーションと実世界実験の両方において,エンド・ツー・エンドの代替品と比較して,先行技術よりも信頼性が高い。
論文 参考訳(メタデータ) (2020-11-05T22:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。