論文の概要: Dyna-LfLH: Learning Agile Navigation in Dynamic Environments from Learned Hallucination
- arxiv url: http://arxiv.org/abs/2403.17231v1
- Date: Mon, 25 Mar 2024 22:17:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 19:16:39.649849
- Title: Dyna-LfLH: Learning Agile Navigation in Dynamic Environments from Learned Hallucination
- Title(参考訳): Dyna-LfLH: 学習した幻覚から動的環境におけるアジャイルナビゲーションを学ぶ
- Authors: Saad Abdul Ghani, Zizhao Wang, Peter Stone, Xuesu Xiao,
- Abstract要約: 本稿では,地上ロボットが動的障害物を伴って環境をナビゲートするための運動プランナを安全に学習するための自己指導型学習手法を提案する。
新たに開発したDynamic Learning from Learned Hallucination (Dyna-LfLH)では,新しい潜伏分布の設計と学習を行い,そこから動的障害を抽出する。
Dyna-LfLHは、シミュレーションされた環境と物理的環境の両方において地上ロボット上で評価され、ベースラインと比較して最大25%高い成功率を達成する。
- 参考スコア(独自算出の注目度): 37.0993566629277
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a self-supervised learning method to safely learn a motion planner for ground robots to navigate environments with dense and dynamic obstacles. When facing highly-cluttered, fast-moving, hard-to-predict obstacles, classical motion planners may not be able to keep up with limited onboard computation. For learning-based planners, high-quality demonstrations are difficult to acquire for imitation learning while reinforcement learning becomes inefficient due to the high probability of collision during exploration. To safely and efficiently provide training data, the Learning from Hallucination (LfH) approaches synthesize difficult navigation environments based on past successful navigation experiences in relatively easy or completely open ones, but unfortunately cannot address dynamic obstacles. In our new Dynamic Learning from Learned Hallucination (Dyna-LfLH), we design and learn a novel latent distribution and sample dynamic obstacles from it, so the generated training data can be used to learn a motion planner to navigate in dynamic environments. Dyna-LfLH is evaluated on a ground robot in both simulated and physical environments and achieves up to 25% better success rate compared to baselines.
- Abstract(参考訳): 本稿では,地中ロボットが高密度でダイナミックな障害物を伴って環境をナビゲートするための移動プランナを安全に学習するための自己指導型学習手法を提案する。
高度に散らばり、速く動き、予測が難しい障害に直面している場合、古典的なモーションプランナーは、オンボード計算の制限に追随できないかもしれない。
学習型プランナでは,探索中に衝突する確率が高いため,強化学習が非効率になる一方で,模擬学習において高品質な実演を得ることは困難である。
トレーニングデータを安全かつ効率的に提供するために、LfH(Learning from Hallucination)アプローチは、過去の成功したナビゲーション体験を比較的容易に、あるいは完全にオープンなものとして、難しいナビゲーション環境を合成するが、残念ながら動的障害には対処できない。
新たに開発したDynamic Learning from Learned Hallucination (Dyna-LfLH)では,新しい潜伏分布を設計,学習し,そこから動的障害をサンプリングする。
Dyna-LfLHは、シミュレーションされた環境と物理的環境の両方において地上ロボット上で評価され、ベースラインと比較して最大25%高い成功率を達成する。
関連論文リスト
- Infer and Adapt: Bipedal Locomotion Reward Learning from Demonstrations
via Inverse Reinforcement Learning [5.246548532908499]
本稿では、複雑な地形上の二足歩行問題を解決するために、最先端の逆強化学習(IRL)技術を導入する。
専門家の報酬関数を学習するためのアルゴリズムを提案し、その後、学習関数を解析する。
両足歩行ポリシーを推定報酬関数で訓練することで、視認できない地形での歩行性能が向上することが実証的に実証された。
論文 参考訳(メタデータ) (2023-09-28T00:11:06Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Efficient Learning of High Level Plans from Play [57.29562823883257]
本稿では,移動計画と深いRLを橋渡しするロボット学習のフレームワークであるELF-Pについて紹介する。
ELF-Pは、複数の現実的な操作タスクよりも、関連するベースラインよりもはるかに優れたサンプル効率を有することを示す。
論文 参考訳(メタデータ) (2023-03-16T20:09:47Z) - Learning-based Motion Planning in Dynamic Environments Using GNNs and
Temporal Encoding [15.58317292680615]
組込みとエッジ優先化ポリシの両方を学習するために,データアグリゲーションを用いた時間符号化と模倣学習を用いたGNNベースのアプローチを提案する。
実験により, 提案手法は, 最先端の完全な動的計画アルゴリズムよりも, オンラインプランニングを著しく高速化できることが示された。
論文 参考訳(メタデータ) (2022-10-16T01:27:16Z) - Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in
Dynamic Environments [25.366480092589022]
四足歩行ロボットは、環境の乱雑さや移動する障害物に応答して、頑丈で機敏な歩行行動を示す必要がある。
本稿では,知覚的移動の問題をハイレベルな意思決定に分解する,PreLUDEという階層型学習フレームワークを提案する。
シミュレーションおよびハードウェア実験において,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-09-19T17:55:07Z) - Learning to Jump from Pixels [23.17535989519855]
我々は、高度にアジャイルな視覚的誘導行動の合成法であるDepth-based Impulse Control (DIC)を提案する。
DICは、モデルフリー学習の柔軟性を提供するが、地面反応力の明示的なモデルベース最適化により、振る舞いを規則化する。
提案手法をシミュレーションと実世界の両方で評価する。
論文 参考訳(メタデータ) (2021-10-28T17:53:06Z) - Learning High-Speed Flight in the Wild [101.33104268902208]
複雑な自然環境や人工環境を高速で自律的に飛行するエンド・ツー・エンドのアプローチを提案する。
鍵となる原理は、雑音の知覚観測を直接、後退水平方向に無衝突軌道にマッピングすることである。
現実的なセンサノイズをシミュレートすることにより,シミュレーションから現実環境へのゼロショット転送を実現する。
論文 参考訳(メタデータ) (2021-10-11T09:43:11Z) - Learning Perceptual Locomotion on Uneven Terrains using Sparse Visual
Observations [75.60524561611008]
この研究は、人中心の環境において、よく見られるバンプ、ランプ、階段の広い範囲にわたる知覚的移動を達成するために、スパースな視覚的観察の使用を活用することを目的としている。
まず、関心の均一な面を表すことのできる最小限の視覚入力を定式化し、このような外受容的・固有受容的データを統合した学習フレームワークを提案する。
本研究では, 平地を全方向歩行し, 障害物のある地形を前方移動させるタスクにおいて, 学習方針を検証し, 高い成功率を示す。
論文 参考訳(メタデータ) (2021-09-28T20:25:10Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。