論文の概要: RPL: Learning Robust Humanoid Perceptive Locomotion on Challenging Terrains
- arxiv url: http://arxiv.org/abs/2602.03002v1
- Date: Tue, 03 Feb 2026 02:17:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.117354
- Title: RPL: Learning Robust Humanoid Perceptive Locomotion on Challenging Terrains
- Title(参考訳): RPL: 混在地におけるロバストなヒューマノイド知覚ロコモーションの学習
- Authors: Yuanhang Zhang, Younggyo Seo, Juyue Chen, Yifu Yuan, Koushil Sreenath, Pieter Abbeel, Carmelo Sferrazza, Karen Liu, Rocky Duan, Guanya Shi,
- Abstract要約: 本研究では,挑戦的な地形上での多方向移動を可能にする2段階トレーニングフレームワークを提案する。
RPLは、高度マップの観察を特権化した専門家のポリシーを訓練し、分離された移動と操作のスキルを習得する。
次に、複数の深度カメラを活用して広い視野をカバーできるトランスフォーマーポリシーを作成します。
スケーラブルな深度蒸留のために、動的ロボットメッシュと静的な地形メッシュの両方に対してレイキャストを行う効率的なマルチ深度システムを開発した。
- 参考スコア(独自算出の注目度): 53.674116167774095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid perceptive locomotion has made significant progress and shows great promise, yet achieving robust multi-directional locomotion on complex terrains remains underexplored. To tackle this challenge, we propose RPL, a two-stage training framework that enables multi-directional locomotion on challenging terrains, and remains robust with payloads. RPL first trains terrain-specific expert policies with privileged height map observations to master decoupled locomotion and manipulation skills across different terrains, and then distills them into a transformer policy that leverages multiple depth cameras to cover a wide range of views. During distillation, we introduce two techniques to robustify multi-directional locomotion, depth feature scaling based on velocity commands and random side masking, which are critical for asymmetric depth observations and unseen widths of terrains. For scalable depth distillation, we develop an efficient multi-depth system that ray-casts against both dynamic robot meshes and static terrain meshes in massively parallel environments, achieving a 5-times speedup over the depth rendering pipelines in existing simulators while modeling realistic sensor latency, noise, and dropout. Extensive real-world experiments demonstrate robust multi-directional locomotion with payloads (2kg) across challenging terrains, including 20° slopes, staircases with different step lengths (22 cm, 25 cm, 30 cm), and 25 cm by 25 cm stepping stones separated by 60 cm gaps.
- Abstract(参考訳): ヒューマノイドの知覚的移動は大きな進歩を遂げており、大きな将来性を示しているが、複雑な地形上で頑健な多方向移動を実現することは、まだ未調査である。
この課題に対処するために、我々は、挑戦する地形上で多方向移動を可能にする2段階のトレーニングフレームワークであるRPLを提案し、ペイロードで頑健なままである。
RPLはまず、高度マップ観測による地形の専門家ポリシーを訓練し、異なる地形を横断する分離された移動と操作のスキルを習得した上で、複数の深度カメラを活用して広い視野をカバーしたトランスフォーマーポリシーに抽出する。
蒸留では,多方向移動,速度指令に基づく深度特徴スケーリング,ランダム側マスキングの2つの手法を導入する。
拡張性のある深度蒸留を行うため,大規模並列環境における動的ロボットメッシュと静的地形メッシュの両方に対してレイキャストを行い,現実的なセンサレイテンシ,ノイズ,ドロップアウトをモデル化しながら,既存のシミュレータの深度レンダリングパイプラインよりも5倍のスピードアップを実現した,効率的なマルチ深度システムを開発した。
広汎な実世界の実験では、20°斜面、階段(22cm、25cm、30cm)、25cm×25cmの階段など、困難な地形をまたいだペイロード(2kg)による頑丈な多方向移動が実証されている。
関連論文リスト
- APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots [32.84976822343718]
本稿では,登頂型高プラットフォーム交通行動認識システムであるAPEXを提案する。
私たちのアプローチの中心は、コンタクトに富んだ目標達成策を学ぶための一般的なラチェット進歩報酬です。
我々は、LiDARベースのフルボディ操作ポリシーを訓練し、sim-to-real知覚ギャップを低減する。
論文 参考訳(メタデータ) (2026-02-11T18:55:11Z) - RoboTracer: Mastering Spatial Trace with Reasoning in Vision-Language Models for Robotics [53.053660003572965]
本稿では,3次元空間参照と計測の両方を初めて実現した3D対応VLMであるRoboTracerを提案する。
RoboTracerは、強化微調整により、多段階のメートル法推論を進める。
本稿では,空間的トレーシングを評価する上で困難なベンチマークであるTraceSpatial-Benchを提案する。
論文 参考訳(メタデータ) (2025-12-15T18:52:43Z) - Learning to Track Any Points from Human Motion [55.831218129679144]
点追跡のための擬似ラベル付きトレーニングデータを生成する自動パイプラインを提案する。
AnthroTAPでトレーニングされた点追跡モデルは、TAP-Vidベンチマークで注釈付き最先端性能を達成する。
論文 参考訳(メタデータ) (2025-07-08T17:59:58Z) - Scaling Multi Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles [1.7923169244369488]
マルチエージェント強化学習は、サンプル非効率で悪名高い。
GazeboのLRAUVのような高忠実度シミュレータは、リアルタイムのシングルロボットシミュレーションを100倍高速にする。
本稿では,高忠実度シミュレーションをGPU加速環境へ伝達する反復蒸留法を提案する。
論文 参考訳(メタデータ) (2025-05-13T04:42:30Z) - BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds [35.62230804783507]
既存の学習ベースのアプローチは、足場不足や非効率な学習プロセスのために、複雑な地形で苦労することが多い。
BeamDojoはアジャイルなヒューマノイドの移動を可能にするための強化学習フレームワークです。
BeamDojoはシミュレーションで効率的な学習を実現し、現実世界の狭い足場に正確な足場を配置してアジャイルの移動を可能にする。
論文 参考訳(メタデータ) (2025-02-14T18:42:42Z) - Legged Locomotion in Challenging Terrains using Egocentric Vision [70.37554680771322]
本稿では,階段,縁石,石段,隙間を横断できる最初のエンドツーエンド移動システムを提案する。
この結果を,1台の前面深度カメラを用いた中型四足歩行ロボットに示す。
論文 参考訳(メタデータ) (2022-11-14T18:59:58Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Learning Perceptual Locomotion on Uneven Terrains using Sparse Visual
Observations [75.60524561611008]
この研究は、人中心の環境において、よく見られるバンプ、ランプ、階段の広い範囲にわたる知覚的移動を達成するために、スパースな視覚的観察の使用を活用することを目的としている。
まず、関心の均一な面を表すことのできる最小限の視覚入力を定式化し、このような外受容的・固有受容的データを統合した学習フレームワークを提案する。
本研究では, 平地を全方向歩行し, 障害物のある地形を前方移動させるタスクにおいて, 学習方針を検証し, 高い成功率を示す。
論文 参考訳(メタデータ) (2021-09-28T20:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。