論文の概要: PUMA: Perception-driven Unified Foothold Prior for Mobility Augmented Quadruped Parkour
- arxiv url: http://arxiv.org/abs/2601.15995v1
- Date: Thu, 22 Jan 2026 14:16:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.620267
- Title: PUMA: Perception-driven Unified Foothold Prior for Mobility Augmented Quadruped Parkour
- Title(参考訳): PUMA: パーセプション駆動型統一足場
- Authors: Liang Wang, Kanzhong Yao, Yang Liu, Weikai Qin, Jun Wu, Zhe Sun, Qiuguo Zhu,
- Abstract要約: 四足歩行のパーサータスクは、アジャイルの移動の有望なベンチマークとして現れている。
本稿では,視覚的知覚と足跡を1段階の学習プロセスに統合するエンドツーエンド学習フレームワークPUMAを提案する。
- 参考スコア(独自算出の注目度): 18.593929869124864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parkour tasks for quadrupeds have emerged as a promising benchmark for agile locomotion. While human athletes can effectively perceive environmental characteristics to select appropriate footholds for obstacle traversal, endowing legged robots with similar perceptual reasoning remains a significant challenge. Existing methods often rely on hierarchical controllers that follow pre-computed footholds, thereby constraining the robot's real-time adaptability and the exploratory potential of reinforcement learning. To overcome these challenges, we present PUMA, an end-to-end learning framework that integrates visual perception and foothold priors into a single-stage training process. This approach leverages terrain features to estimate egocentric polar foothold priors, composed of relative distance and heading, guiding the robot in active posture adaptation for parkour tasks. Extensive experiments conducted in simulation and real-world environments across various discrete complex terrains, demonstrate PUMA's exceptional agility and robustness in challenging scenarios.
- Abstract(参考訳): 四足歩行のパーサータスクは、アジャイルの移動の有望なベンチマークとして現れている。
人間のアスリートは、障害物回避のための適切な足場を選択するために、環境特性を効果的に知覚することができるが、同じような知覚的推論を持つ脚付きロボットは依然として大きな課題である。
既存の方法は、しばしば事前計算された足場に従う階層的なコントローラに依存し、それによってロボットのリアルタイム適応性と強化学習の探索可能性を制限する。
これらの課題を克服するために,視覚認識と足跡を1段階の学習プロセスに統合するエンドツーエンド学習フレームワークPUMAを提案する。
このアプローチは地形の特徴を活用して、相対距離と方向からなる自我中心の極地足場を推定し、パールタスクのアクティブな姿勢適応にロボットを誘導する。
様々な複雑な地形のシミュレーションや実世界の環境において行われた大規模な実験は、PUMAの挑戦的なシナリオにおける例外的な俊敏性と頑健さを実証している。
関連論文リスト
- Deep Whole-body Parkour [33.232856360240106]
本研究では,外感知覚を全身運動追跡に組み込む枠組みを提案する。
制御ループに知覚を統合するという非自明な利点を実証する。
その結果、このフレームワークは、非構造地形上でのボウトやダイブローリングのような、堅牢で高ダイナミックなマルチコンタクト運動を可能にする。
論文 参考訳(メタデータ) (2026-01-12T16:33:16Z) - Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z) - BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds [35.62230804783507]
既存の学習ベースのアプローチは、足場不足や非効率な学習プロセスのために、複雑な地形で苦労することが多い。
BeamDojoはアジャイルなヒューマノイドの移動を可能にするための強化学習フレームワークです。
BeamDojoはシミュレーションで効率的な学習を実現し、現実世界の狭い足場に正確な足場を配置してアジャイルの移動を可能にする。
論文 参考訳(メタデータ) (2025-02-14T18:42:42Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Learning to Jump from Pixels [23.17535989519855]
我々は、高度にアジャイルな視覚的誘導行動の合成法であるDepth-based Impulse Control (DIC)を提案する。
DICは、モデルフリー学習の柔軟性を提供するが、地面反応力の明示的なモデルベース最適化により、振る舞いを規則化する。
提案手法をシミュレーションと実世界の両方で評価する。
論文 参考訳(メタデータ) (2021-10-28T17:53:06Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。