論文の概要: ParkourFormer: Integrating Predictive Supervision and Sequence Modeling into Parkour Locomotion
- arxiv url: http://arxiv.org/abs/2605.25782v2
- Date: Tue, 26 May 2026 02:20:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.170165
- Title: ParkourFormer: Integrating Predictive Supervision and Sequence Modeling into Parkour Locomotion
- Title(参考訳): ParkourFormer:予測スーパービジョンとシーケンスモデリングを統合したParkour Locomotion
- Authors: Yanheng Mai, Wenhao Xu, Zirui Huang, Yifei Fu, Shengwei Dong, Xinjue Wang, Kailun Huang, Yanzhe Xie, Renjing Xu,
- Abstract要約: 本稿では,トランスフォーマーをベースとしたシーケンスモデリングフレームワークであるParkourFormerについて述べる。
シミュレーションと本物のヒューマノイドロボットの実験により、ParkourFormerは高度に挑戦的な地形で平均93.85%の成功率を達成した。
- 参考スコア(独自算出の注目度): 18.91196966757826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid parkour requires locomotion policies to coordinate whole-body dynamics across rapidly changing terrains such as stairs, gaps, slopes, and obstacles. Existing reinforcement learning policies are largely reactive, mapping observations directly to actions without explicitly modeling future body states. Such modeling becomes critical in agile locomotion tasks where successful motion execution depends strongly on anticipating upcoming contact transitions and body dynamics. We present ParkourFormer, a Transformer-based sequence modeling framework that reformulates humanoid locomotion as a future-conditioned decision-making problem. The current robot state queries historical sensorimotor trajectories through cross-attention, while a lightweight prediction head forecasts short-horizon future proprioceptive states. The predicted future states, trained with supervised signals, are fused with temporal features to generate actions, enabling the policy to jointly reason over motion history and anticipated future dynamics. We evaluate ParkourFormer on a diverse multi-terrain humanoid parkour benchmark including stairs, gaps, slopes, rough terrain, and obstacle traversal. Experiments in simulation and on a real humanoid robot show that ParkourFormer achieves a 93.85% average traversal success rate on highly challenging terrains, with improvements of up to 42.73% over strong MLP, MoE-based MLP, and vanilla Transformer baselines, while maintaining a single unified policy across all terrain types. These results demonstrate that explicit future-state modeling significantly improves robustness and generalization for agile whole-body locomotion.
- Abstract(参考訳): ヒューマノイドパークは、階段、隙間、斜面、障害物などの急速に変化する地形をまたいで、全身のダイナミクスを調整するために移動ポリシーを必要とする。
既存の強化学習ポリシーは概ね反応性があり、将来の身体状態を明示的にモデル化することなく、観察を直接行動にマッピングする。
このようなモデリングは、動きの実行を成功させるタスクが、今後の接触遷移や身体のダイナミクスを期待することに強く依存するアジャイルのロコモーションタスクにおいて重要なものになります。
本稿では,トランスフォーマーをベースとしたシーケンスモデリングフレームワークであるParkourFormerについて述べる。
現在のロボット状態は、クロスアテンションを通して、歴史的感覚運動の軌跡をクエリし、軽量な予測ヘッドは、短地将来の受容状態を予測する。
予測された将来の状態は、監督された信号で訓練され、時間的特徴と融合して行動を生成する。
ParkourFormerを,階段,隙間,斜面,荒地,障害物トラバーサルを含む多段人型パークールベンチマークで評価した。
シミュレーションと実際のヒューマノイドロボットの実験では、ParkourFormerは高度に困難な地形で平均93.85%の成功率を達成し、強いMLP、MoEベースのMLP、バニラトランスフォーマーベースラインよりも42.73%向上し、全ての地形で統一されたポリシーを維持している。
これらの結果は、明示的な未来状態モデリングは、アジャイル全体のロコモーションの堅牢性と一般化を著しく改善することを示している。
関連論文リスト
- GigaWorld-Policy: An Efficient Action-Centered World--Action Model [50.107640832046464]
GigaWorld-Policyはアクション中心のWAMで、2Dピクセルアクションのダイナミクスを学習し、オプションのビデオ生成で効率的なアクションデコーディングを可能にする。
実世界のロボットプラットフォームでの実験結果によると、GigaWorld-Policyは主要なWAMベースラインであるMotusの9倍高速で動作する。
論文 参考訳(メタデータ) (2026-03-18T00:52:02Z) - Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - A Kung Fu Athlete Bot That Can Do It All Day: Highly Dynamic, Balance-Challenging Motion Dataset and Autonomous Fall-Resilient Tracking [5.968082051565195]
武道の特徴は、急激な中心シフト、複雑な調整、急激な姿勢転換である。
KungFuAthleteは、プロアスリートの日々のトレーニングビデオから派生した、ハイダイナミックな武道運動データセットである。
本研究では,高ダイナミックなモーショントラッキングとフォールリカバリを共同で学習できる新しいトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2026-02-14T07:49:56Z) - PUMA: Perception-driven Unified Foothold Prior for Mobility Augmented Quadruped Parkour [18.593929869124864]
四足歩行のパーサータスクは、アジャイルの移動の有望なベンチマークとして現れている。
本稿では,視覚的知覚と足跡を1段階の学習プロセスに統合するエンドツーエンド学習フレームワークPUMAを提案する。
論文 参考訳(メタデータ) (2026-01-22T14:16:12Z) - Locomotion Beyond Feet [35.148387990120014]
Locomotion Beyond Feetは、挑戦的な地形を横断する全身のヒューマノイド・ロコモーションのための総合システムである。
我々のアプローチは、コンタクトリッチなモーションプランニングと、多様な地形における一般化という、2つの主要な課題に対処する。
キーフレームは人間のモータースキルの知識を符号化し、具体化に特化しており、シミュレーションやハードウェア上で容易に検証できる。
論文 参考訳(メタデータ) (2026-01-07T05:36:39Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - Natural Humanoid Robot Locomotion with Generative Motion Prior [21.147249860051616]
本稿では,ヒューマノイドロボットの移動作業のきめ細かい監督を行う新しいジェネレーティブ・モーション・プライオリティ(GMP)を提案する。
我々は、条件付き変分自動エンコーダに基づいて、ロボットの将来の自然参照動作を予測するために、生成モデルをオフラインでトレーニングする。
政策訓練の間、生成運動は凍結したオンラインモーションジェネレータとして機能し、軌道レベルで正確に包括的な監視を提供する。
論文 参考訳(メタデータ) (2025-03-12T03:04:15Z) - Weakly-supervised Action Transition Learning for Stochastic Human Motion
Prediction [81.94175022575966]
動作駆動型人間の動作予測の課題について紹介する。
一連の動作ラベルと短い動作履歴から、複数の可算な将来の動作を予測することを目的としている。
論文 参考訳(メタデータ) (2022-05-31T08:38:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。