論文の概要: FastStair: Learning to Run Up Stairs with Humanoid Robots
- arxiv url: http://arxiv.org/abs/2601.10365v1
- Date: Thu, 15 Jan 2026 13:14:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.793666
- Title: FastStair: Learning to Run Up Stairs with Humanoid Robots
- Title(参考訳): FastStair:ヒューマノイドロボットでステアを走らせる学習
- Authors: Yan Liu, Tao Yu, Haolin Song, Hongbo Zhu, Nianzong Hu, Yuzhi Hao, Xiuyong Yao, Xizhe Zang, Hua Chen, Jie Zhao,
- Abstract要約: 階段を駆け上がるのは人間にはむずかしいが、ヒューマノイドロボットには難しい。
FastStairは、高速で安定した階段上昇を実現するためのプランナーによる多段階学習フレームワークである。
我々は,Oliヒューマノイドロボットに制御器を配置し,最大1.65m/sの速度で安定な階段上昇を実現する。
- 参考スコア(独自算出の注目度): 19.796528911795516
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Running up stairs is effortless for humans but remains extremely challenging for humanoid robots due to the simultaneous requirements of high agility and strict stability. Model-free reinforcement learning (RL) can generate dynamic locomotion, yet implicit stability rewards and heavy reliance on task-specific reward shaping tend to result in unsafe behaviors, especially on stairs; conversely, model-based foothold planners encode contact feasibility and stability structure, but enforcing their hard constraints often induces conservative motion that limits speed. We present FastStair, a planner-guided, multi-stage learning framework that reconciles these complementary strengths to achieve fast and stable stair ascent. FastStair integrates a parallel model-based foothold planner into the RL training loop to bias exploration toward dynamically feasible contacts and to pretrain a safety-focused base policy. To mitigate planner-induced conservatism and the discrepancy between low- and high-speed action distributions, the base policy was fine-tuned into speed-specialized experts and then integrated via Low-Rank Adaptation (LoRA) to enable smooth operation across the full commanded-speed range. We deploy the resulting controller on the Oli humanoid robot, achieving stable stair ascent at commanded speeds up to 1.65 m/s and traversing a 33-step spiral staircase (17 cm rise per step) in 12 s, demonstrating robust high-speed performance on long staircases. Notably, the proposed approach served as the champion solution in the Canton Tower Robot Run Up Competition.
- Abstract(参考訳): 階段を上るのは人間には不便ですが、高い俊敏性と厳格な安定性の同時要求のため、ヒューマノイドロボットにとっては非常に難しいです。
モデルフリー強化学習(RL)は動的ロコモーションを生成することができるが、暗黙の安定性の報酬とタスク固有の報酬形成への強い依存は、特に階段での安全でない行動を引き起こす傾向がある。
我々は、これらの相補的な強みを調整し、高速で安定した階段上昇を実現するためのプランナー誘導多段階学習フレームワークであるFastStairを紹介する。
FastStairは、並列モデルベースの足場プランナをRLトレーニングループに統合し、動的に実現可能なコンタクトに向けたバイアス探索と、安全に焦点を当てた基本ポリシーの事前トレーニングを行う。
プランナーが引き起こした保守主義と低速動作分布と高速動作分布の相違を緩和するため、基本方針は高速特殊化の専門家に微調整され、ローランド適応(LoRA)を介して統合され、全命令速度範囲にわたって円滑な動作を可能にした。
我々は,Oliヒューマノイドロボットに制御器を配置し,命令速度1.65m/sで安定な階段上昇を実現し,33段のスパイラル階段(17cm上昇)を12秒で横切り,長い階段上での堅牢な高速性能を実証した。
特に、提案されたアプローチは、カントンタワーロボットランアップコンペティションのチャンピオンソリューションとして機能した。
関連論文リスト
- Omnidirectional Humanoid Locomotion on Stairs via Unsafe Stepping Penalty and Sparse LiDAR Elevation Mapping [6.267657984340167]
本稿では,重度の安全でないステップペナルティを取り入れた単段階トレーニングフレームワークを提案する。
シミュレーションでは階段上の安全なステップ速度をほぼ100%達成し、実際の配置では極めて安全なステップ速度を維持している。
複雑な屋外地形における長距離歩行試験を継続し、信頼性の高いシモン・トゥ・リアル・トランスファーと長期安定性を実証する。
論文 参考訳(メタデータ) (2026-03-09T03:48:32Z) - Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots [32.84976822343718]
本稿では,登頂型高プラットフォーム交通行動認識システムであるAPEXを提案する。
私たちのアプローチの中心は、コンタクトに富んだ目標達成策を学ぶための一般的なラチェット進歩報酬です。
我々は、LiDARベースのフルボディ操作ポリシーを訓練し、sim-to-real知覚ギャップを低減する。
論文 参考訳(メタデータ) (2026-02-11T18:55:11Z) - UEREBot: Learning Safe Quadrupedal Locomotion under Unstructured Environments and High-Speed Dynamic Obstacles [16.149422197272937]
UEREBotは階層的なフレームワークで、スロープランニングと即時回帰回避を分離する。
我々はIsaac LabのシミュレーションでUEREBotを評価し,それを車載認識機能を備えたUnitree Go2上にデプロイした。
論文 参考訳(メタデータ) (2026-02-07T05:09:48Z) - Walk the PLANC: Physics-Guided RL for Agile Humanoid Locomotion on Constrained Footholds [20.44610499489492]
二足歩行ロボットは、制約された足場に移動する際にバランス、タイミング、接触決定を調整する必要がある。
本稿では,低次ステッピングプランナが動的に一貫した運動目標を供給できるロコモーションフレームワークを提案する。
この構造化されたステップ計画とデータ駆動型適応の組み合わせは、ヒューマノイドロボット上で正確で、アジャイルで、ハードウェアで検証されたステップストーンの移動を生み出す。
論文 参考訳(メタデータ) (2026-01-09T19:56:42Z) - RobotDancing: Residual-Action Reinforcement Learning Enables Robust Long-Horizon Humanoid Motion Tracking [50.200035833530876]
RobotDancingはシンプルでスケーラブルなフレームワークで、残留する関節の目標を予測して、ダイナミックスの不一致を明示的に修正する。
複数分間の高エネルギー動作(ジャンプ、スピン、カートホイール)をトラッキングし、高いモーショントラッキング品質のハードウェアにゼロショットをデプロイする。
論文 参考訳(メタデータ) (2025-09-25T03:30:34Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。