論文の概要: GuideWalk: Learning Unified Autonomous Navigation and Locomotion for Humanoid Robots across Versatile Terrains
- arxiv url: http://arxiv.org/abs/2606.10449v2
- Date: Sat, 13 Jun 2026 14:35:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 13:45:31.012465
- Title: GuideWalk: Learning Unified Autonomous Navigation and Locomotion for Humanoid Robots across Versatile Terrains
- Title(参考訳): GuideWalk:人間型ロボットのための統合された自律ナビゲーションとロコモーションの学習
- Authors: Haoxuan Han, Chen Chen, Linao Gong, Xin Yang, Hao Hu, Junhong Guo, Zhicheng He, Yao Su, Fenghua He,
- Abstract要約: 本稿では,移動性を考慮したナビゲーション指導と地形適応型移動指導とを統合したエンドツーエンド・フレームワークを提案する。
そこで本研究では,目標指向型コマンドと動的に一貫した動作を集約し,単一のポリシに蒸留する,複合型教員蒸留方式を提案する。
GuideWalkは、安定なヒューマノイド移動を維持しながら、安定かつ効果的なナビゲーションを実現する。
- 参考スコア(独自算出の注目度): 10.258225375602231
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid robots have achieved strong locomotion capabilities, but reliable navigation on versatile terrains remains challenging because obstacle avoidance must be coordinated with dynamically feasible motion. In this work, we present GuideWalk, a unified end-to-end framework that integrates traversability-aware navigation guidance with terrain-adaptive locomotion teacher for humanoid navigation. Specifically, we introduce a navigation module that provides explicit velocity guidance, decoupling obstacle avoidance from terrain conditions to enable robust planning across diverse environments. We propose a composite teacher distillation scheme, where goal-directed commands and dynamically consistent actions are aggregated and distilled into a single policy. To further improve robustness, the distilled policy is refined with reinforcement learning and an auxiliary behavior cloning objective, which promotes exploration while preserving desirable teacher behaviors. Experiments demonstrate that GuideWalk achieves stable and effective navigation while maintaining stable humanoid locomotion.
- Abstract(参考訳): ヒューマノイドロボットは強力な移動能力を達成したが、障害物回避を動的に実現可能な運動と調整する必要があるため、多目的な地形での信頼性の高いナビゲーションは依然として困難である。
本研究は,移動性を考慮したナビゲーション指導とランドスケープ適応型移動指導とを統合したエンド・ツー・エンド・エンド・フレームワークである GuideWalk について述べる。
具体的には,地形条件から障害物回避を分離し,多様な環境にまたがるロバストな計画を可能にするナビゲーションモジュールを提案する。
そこで本研究では,目標指向型コマンドと動的に一貫した動作を集約し,単一のポリシに蒸留する,複合型教員蒸留方式を提案する。
さらにロバスト性を向上させるために、蒸留政策を強化学習と補助的行動クローニングの目的で洗練し、望ましい教師行動を維持しながら探索を促進する。
GuideWalkは、安定なヒューマノイド移動を維持しながら、安定かつ効果的なナビゲーションを実現する。
関連論文リスト
- VAIC: Vision-Guided Humanoid Agile Object Interaction Control via Decoupled Commands [56.029505206531155]
Vision Guided Agile Interaction Control (VAIC)は、現在のコントローラとヒューマノイドロボットのギャップを埋める統合フレームワークである。
まず、特権教師政策は、正確な物体運動学と正確な環境状態を用いて多様な相互作用スキルを習得する。
第二に、デプロイ可能な学生ポリシーは、全体追跡を複数の軸にまたがる速度目標に置き換えることで、これらの能力を蒸留する。
論文 参考訳(メタデータ) (2026-06-08T09:52:55Z) - Mind Your Steps: A General Learning Framework for Accurate Humanoid Foothold Tracking [78.30338456206984]
本稿では,汎用3D足場追跡ポリシーをトレーニングするための新しいフレームワークを提案する。
本手法は, 目標検層による足場支援を動的に行うことにより, 学習方針を特定の地形に依存しないものにする。
我々の新しいターゲット表現は、雑音や不正確なポーズ推定や足の接触推定といった現実の課題を効果的に緩和する。
論文 参考訳(メタデータ) (2026-06-06T16:44:56Z) - SmoothTurn: Learning to Turn Smoothly for Agile Navigation with Quadrupedal Robots [24.152874093727153]
四足歩行ロボットは、火災救助や産業検査のような価値ある現実世界の応用に大きな可能性を秘めている。
既存のアジャイルナビゲーションのアプローチでは、ロボットが到達した後に目標位置に留まるよう促すことで、単一ゴールのリーチポリシーを学ぶのが一般的である。
学習ベースのコントロールフレームワークであるSmoothTurnを紹介します。
論文 参考訳(メタデータ) (2026-03-13T09:44:33Z) - Learning Rock Pushability on Rough Planetary Terrain [0.0]
本研究では,移動ロボットに搭載されたロボットマニピュレータの操作機能を活用することにより,非構造環境における移動ナビゲーションの代替手法を提案する。
提案フレームワークは,外的および内的フィードバックを統合し,障害物の押し出し能力を評価し,回避ではなく再配置を容易にする。
ナビゲーション手法の目的は,月面や火星面などの自律的なインフラ開発が不可欠である環境において,複数のエージェントが長期にわたって使用するルートの効率を向上させることである。
論文 参考訳(メタデータ) (2025-05-14T22:23:30Z) - Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning [0.0]
本稿では,ロボットナビゲーションと各種エージェントや障害物とのインタラクションを改善するための,新しい深層強化学習手法を提案する。
このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを確保する。
ロボットに近づいたり、異なる物体と衝突したりすることを罰する新たな報酬関数を導入する。
論文 参考訳(メタデータ) (2024-08-26T11:16:03Z) - Learning Robust Autonomous Navigation and Locomotion for Wheeled-Legged Robots [50.02055068660255]
都市環境のナビゲーションは、ロボットにとってユニークな課題であり、移動とナビゲーションのための革新的なソリューションを必要としている。
本研究は, 適応移動制御, 移動対応ローカルナビゲーション計画, 市内の大規模経路計画を含む, 完全に統合されたシステムを導入する。
モデルフリー強化学習(RL)技術と特権学習を用いて,多目的移動制御系を開発した。
私たちのコントローラーは大規模な都市航法システムに統合され、スイスのチューリッヒとスペインのセビリアで自律的、キロメートル規模の航法ミッションによって検証されます。
論文 参考訳(メタデータ) (2024-05-03T00:29:20Z) - Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation [72.24964965882783]
強化学習(RL)はロボットナビゲーションにおいて有望なアプローチであり、ロボットは試行錯誤を通じて学習することができる。
現実世界のロボットタスクは、しばしばまばらな報酬に悩まされ、非効率な探索と準最適政策に繋がる。
本稿では,RLに基づくロボットナビゲーションにおいて,報酬関数を変更せずにサンプル効率を向上させる新しい手法であるConfidence-Controlled Exploration (CCE)を紹介する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Holistic Deep-Reinforcement-Learning-based Training of Autonomous
Navigation Systems [4.409836695738518]
Deep Reinforcement Learningは、地上車両の自律的なナビゲーションのための有望なアプローチとして登場した。
本稿では,ナビゲーションスタックの全要素を含む総合的な深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2023-02-06T16:52:15Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。