論文の概要: APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots
- arxiv url: http://arxiv.org/abs/2602.11143v2
- Date: Fri, 06 Mar 2026 05:01:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.379561
- Title: APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots
- Title(参考訳): APEX:ヒューマノイドロボットのための適応型高速トラバーサル
- Authors: Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao,
- Abstract要約: 本稿では,登頂型高プラットフォーム交通行動認識システムであるAPEXを提案する。
私たちのアプローチの中心は、コンタクトに富んだ目標達成策を学ぶための一般的なラチェット進歩報酬です。
我々は、LiDARベースのフルボディ操作ポリシーを訓練し、sim-to-real知覚ギャップを低減する。
- 参考スコア(独自算出の注目度): 32.84976822343718
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humanoid locomotion has advanced rapidly with deep reinforcement learning (DRL), enabling robust feet-based traversal over uneven terrain. Yet platforms beyond leg length remain largely out of reach because current RL training paradigms often converge to jumping-like solutions that are high-impact, torque-limited, and unsafe for real-world deployment. To address this gap, we propose APEX, a system for perceptive, climbing-based high-platform traversal that composes terrain-conditioned behaviors: climb-up and climb-down at vertical edges, walking or crawling on the platform, and stand-up and lie-down for posture reconfiguration. Central to our approach is a generalized ratchet progress reward for learning contact-rich, goal-reaching maneuvers. It tracks the best-so-far task progress and penalizes non-improving steps, providing dense yet velocity-free supervision that enables efficient exploration under strong safety regularization. Based on this formulation, we train LiDAR-based full-body maneuver policies and reduce the sim-to-real perception gap through a dual strategy: modeling mapping artifacts during training and applying filtering and inpainting to elevation maps during deployment. Finally, we distill all six skills into a single policy that autonomously selects behaviors and transitions based on local geometry and commands. Experiments on a 29-DoF Unitree G1 humanoid demonstrate zero-shot sim-to-real traversal of 0.8 meter platforms (approximately 114% of leg length), with robust adaptation to platform height and initial pose, as well as smooth and stable multi-skill transitions.
- Abstract(参考訳): ヒューマノイドの移動は深部強化学習(DRL)によって急速に進行し、不均一な地形上での頑丈な足の移動を可能にしている。
しかし、脚の長さを超えるプラットフォームは、現在のRLトレーニングパラダイムが、高インパクト、トルク制限、そして現実世界の展開において安全でないジャンプのようなソリューションに収束することが多いため、到達範囲がほとんどないままである。
このギャップに対処するために,垂直端の登上・登上,プラットフォーム上を歩き回ったり,姿勢再構成のための立上・横ダウンといった地形条件の行動を構成する,登山型高プラットフォームトラバーサルのシステムであるAPEXを提案する。
私たちのアプローチの中心は、コンタクトに富んだ目標達成策を学ぶための一般的なラチェット進歩報酬です。
最高のタスクの進捗を追跡し、改善されていないステップを罰し、強力な安全正則化の下で効率的な探索を可能にする、高密度だが速度のない監督を提供する。
この定式化に基づいて、LiDARベースのフルボディ操作ポリシーをトレーニングし、トレーニング中のマッピングアーティファクトをモデル化し、デプロイメント中の標高マップに適応する、という2つの戦略を通じて、シム・トゥ・リアルの知覚ギャップを低減する。
最後に、6つのスキルを1つのポリシーに抽出し、局所幾何学とコマンドに基づいて行動と遷移を自律的に選択する。
29-DoF ユニツリー G1 ヒューマノイドの実験では、プラットフォームの高さと初期ポーズへの頑健な適応と、スムーズで安定なマルチスキル遷移とともに、0.8メートルのプラットフォーム(約114%の脚長)のゼロショット・シム・トゥ・リアルトラバースが示される。
関連論文リスト
- TransCurriculum: Multi-Dimensional Curriculum Learning for Fast & Stable Locomotion [50.54752207285298]
TransCurriculumは、アジャイル四足歩行のためのトランスフォーマーベースの多次元カリキュラム学習アプローチである。
シミュレーションでは,Unitree Go1ロボットに対するアプローチを検証し,Go1ハードウェア上でゼロショットでデプロイする。
論文 参考訳(メタデータ) (2026-03-14T23:44:42Z) - Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - PGTT: Phase-Guided Terrain Traversal for Perceptive Legged Locomotion [41.99844472131922]
PGTT ( Phase-Guided Terrain Traversal) は、報酬形成を通じて歩行構造を純粋に強制する認識型ディープRLアプローチである。
MuJoCo(MJX)で、カリキュラムやドメインランダム化を伴う手続き的に生成された階段のような地形で訓練されたPGTTは、プッシュ障害の下で最も成功している。
論文 参考訳(メタデータ) (2025-10-21T07:00:18Z) - BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds [35.62230804783507]
既存の学習ベースのアプローチは、足場不足や非効率な学習プロセスのために、複雑な地形で苦労することが多い。
BeamDojoはアジャイルなヒューマノイドの移動を可能にするための強化学習フレームワークです。
BeamDojoはシミュレーションで効率的な学習を実現し、現実世界の狭い足場に正確な足場を配置してアジャイルの移動を可能にする。
論文 参考訳(メタデータ) (2025-02-14T18:42:42Z) - Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot [7.516046071926082]
シミュレーションロボットと現実ロボットのギャップを軽減するための新しい枠組みを提案する。
本フレームワークはパラメータ選択のための構造化ガイドラインとシミュレーションにおける動的ランダム化の範囲を提供する。
結果は、我々の知る限り、実四足歩行ロボットにおいて、RLベースの制御ポリシーによって実証された最も高く、最も長いジャンプの1つです。
論文 参考訳(メタデータ) (2024-04-23T14:52:09Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。