論文の概要: Learning Transferability: A Two-Stage Reinforcement Learning Approach for Enhancing Quadruped Robots' Performance in U-Shaped Stair Climbing
- arxiv url: http://arxiv.org/abs/2602.14473v1
- Date: Mon, 16 Feb 2026 05:19:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.159001
- Title: Learning Transferability: A Two-Stage Reinforcement Learning Approach for Enhancing Quadruped Robots' Performance in U-Shaped Stair Climbing
- Title(参考訳): 学習伝達性:U字型ステアクライミングにおける四足歩行ロボットの性能向上のための2段階強化学習アプローチ
- Authors: Baixiao Huang, Baiyu Huang, Yu Hou,
- Abstract要約: 我々は,U字型階段上でのロボットの性能を最適化するために,2段階の深層強化学習手法を用いる。
トレーニングロボット-ドッグのモダリティであるUnitree Go2は、アイザック・ラボのピラミッド-階段の階段を登るように訓練された。
以上の結果から, ロボット犬がU字型階段を登上する上で, 失速したペナルティを達成できたこと, 直線, L字型, 渦巻き階段に展開するためのU字型階段を訓練した方針からの移動性が示唆された。
- 参考スコア(独自算出の注目度): 4.901516178319544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quadruped robots are employed in various scenarios in building construction. However, autonomous stair climbing across different indoor staircases remains a major challenge for robot dogs to complete building construction tasks. In this project, we employed a two-stage end-to-end deep reinforcement learning (RL) approach to optimize a robot's performance on U-shaped stairs. The training robot-dog modality, Unitree Go2, was first trained to climb stairs on Isaac Lab's pyramid-stair terrain, and then to climb a U-shaped indoor staircase using the learned policies. This project explores end-to-end RL methods that enable robot dogs to autonomously climb stairs. The results showed (1) the successful goal reached for robot dogs climbing U-shaped stairs with a stall penalty, and (2) the transferability from the policy trained on U-shaped stairs to deployment on straight, L-shaped, and spiral stair terrains, and transferability from other stair models to deployment on U-shaped terrain.
- Abstract(参考訳): 四足歩行ロボットは建築の様々なシナリオで使用されている。
しかし、さまざまな屋内階段を横断する自律的な階段は、ロボット犬にとって建設作業を完了させる大きな課題である。
本研究では,U字型階段上でのロボットの性能を最適化するために,2段階のエンドツーエンド深部強化学習(RL)アプローチを用いた。
トレーニングロボット・ドッグのモダリティであるUnitree Go2は、最初はアイザック・ラボのピラミッド階段の階段を登り、その後、学習方針を使ってU字型の屋内階段を登るように訓練された。
このプロジェクトでは、ロボット犬が自動で階段を登ることができるエンドツーエンドのRL手法を探求する。
以上の結果から, ロボット犬がU字型階段に登頂し, 失速したペナルティで達成した目標, 直線, L字型, 渦巻き型階段への展開, その他の階段モデルからの移動性, およびU字型階段への展開性について検討した。
関連論文リスト
- Training and Simulation of Quadrupedal Robot in Adaptive Stair Climbing for Indoor Firefighting: An End-to-End Reinforcement Learning Approach [4.901516178319544]
四足歩行ロボットは、屋内火災の初期段階において一次探索に使用される。
複雑な屋内環境における状況認識と 階段の急激な登頂が 主な課題です
このプロジェクトでは、ナビゲーションと移動のバランスと、四足歩行を異なる階段形状に適応させるエンドツーエンドのRL手法について検討する。
論文 参考訳(メタデータ) (2026-02-03T04:23:50Z) - Training Directional Locomotion for Quadrupedal Low-Cost Robotic Systems via Deep Reinforcement Learning [4.669957449088593]
現実世界における低コスト四足歩行ロボットの方向移動の深層強化学習訓練について述べる。
我々は、動作状態遷移の探索を促進するためにロボットが従わなければならない方向のランダム化を利用する。
エピソードの先頭のリセットを現在のヨーと通常の分布から引き出されたランダムな値に変更すると、複雑な軌跡に従うことができるポリシーが得られる。
論文 参考訳(メタデータ) (2025-03-14T03:53:01Z) - BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds [35.62230804783507]
既存の学習ベースのアプローチは、足場不足や非効率な学習プロセスのために、複雑な地形で苦労することが多い。
BeamDojoはアジャイルなヒューマノイドの移動を可能にするための強化学習フレームワークです。
BeamDojoはシミュレーションで効率的な学習を実現し、現実世界の狭い足場に正確な足場を配置してアジャイルの移動を可能にする。
論文 参考訳(メタデータ) (2025-02-14T18:42:42Z) - Learning Humanoid Locomotion over Challenging Terrain [84.35038297708485]
本研究では,自然と人為的な地形を横断する視覚障害者の移動に対する学習に基づくアプローチを提案する。
本モデルではまず, 時系列モデルを用いた平地軌道のデータセット上で事前学習を行い, 補強学習を用いて不均一な地形を微調整する。
本研究では, 荒面, 変形面, 傾斜面など, 様々な地形にまたがる実際のヒューマノイドロボットを用いて, モデルを評価する。
論文 参考訳(メタデータ) (2024-10-04T17:57:09Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Legged Locomotion in Challenging Terrains using Egocentric Vision [70.37554680771322]
本稿では,階段,縁石,石段,隙間を横断できる最初のエンドツーエンド移動システムを提案する。
この結果を,1台の前面深度カメラを用いた中型四足歩行ロボットに示す。
論文 参考訳(メタデータ) (2022-11-14T18:59:58Z) - Learning Bipedal Walking On Planned Footsteps For Humanoid Robots [5.127310126394387]
脚付きロボットのための深部強化学習(RL)ベースのコントローラーは、いくつかのロボットプラットフォームのために異なる環境を歩行する際、顕著な頑丈さを実証している。
ヒューマノイドロボットへのRLポリシーの適用を現実の環境で実現するためには,どのような方向にも堅牢な歩行を実現するシステムを構築することが不可欠である。
本稿では,あるステップシーケンスに従うポリシーを学習することで,この問題に対処する。
今後の2つのステップをポリシーに投入するだけで、一方向歩行、位置転換、立ち上がり、階段を登るのに十分であることを示す。
論文 参考訳(メタデータ) (2022-07-26T04:16:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。