論文の概要: Training and Simulation of Quadrupedal Robot in Adaptive Stair Climbing for Indoor Firefighting: An End-to-End Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2602.03087v1
- Date: Tue, 03 Feb 2026 04:23:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.240717
- Title: Training and Simulation of Quadrupedal Robot in Adaptive Stair Climbing for Indoor Firefighting: An End-to-End Reinforcement Learning Approach
- Title(参考訳): 屋内消火用適応ステアクライミングにおける四足歩行ロボットの訓練とシミュレーション : エンドツーエンド強化学習アプローチ
- Authors: Baixiao Huang, Baiyu Huang, Yu Hou,
- Abstract要約: 四足歩行ロボットは、屋内火災の初期段階において一次探索に使用される。
複雑な屋内環境における状況認識と 階段の急激な登頂が 主な課題です
このプロジェクトでは、ナビゲーションと移動のバランスと、四足歩行を異なる階段形状に適応させるエンドツーエンドのRL手法について検討する。
- 参考スコア(独自算出の注目度): 4.901516178319544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quadruped robots are used for primary searches during the early stages of indoor fires. A typical primary search involves quickly and thoroughly looking for victims under hazardous conditions and monitoring flammable materials. However, situational awareness in complex indoor environments and rapid stair climbing across different staircases remain the main challenges for robot-assisted primary searches. In this project, we designed a two-stage end-to-end deep reinforcement learning (RL) approach to optimize both navigation and locomotion. In the first stage, the quadrupeds, Unitree Go2, were trained to climb stairs in Isaac Lab's pyramid-stair terrain. In the second stage, the quadrupeds were trained to climb various realistic indoor staircases in the Isaac Lab engine, with the learned policy transferred from the previous stage. These indoor staircases are straight, L-shaped, and spiral, to support climbing tasks in complex environments. This project explores how to balance navigation and locomotion and how end-to-end RL methods can enable quadrupeds to adapt to different stair shapes. Our main contributions are: (1) A two-stage end-to-end RL framework that transfers stair-climbing skills from abstract pyramid terrain to realistic indoor stair topologies. (2) A centerline-based navigation formulation that enables unified learning of navigation and locomotion without hierarchical planning. (3) Demonstration of policy generalization across diverse staircases using only local height-map perception. (4) An empirical analysis of success, efficiency, and failure modes under increasing stair difficulty.
- Abstract(参考訳): 四足歩行ロボットは、屋内火災の初期段階において一次探索に使用される。
典型的な一次探索では、危険条件下で素早く徹底的に被害者を探し、可燃性物質を監視する。
しかし、複雑な屋内環境における状況認識と階段の急激な上昇は、ロボットによる一次探索の主要な課題である。
このプロジェクトでは,ナビゲーションと移動の両方を最適化する2段階のエンドツーエンド深部強化学習(RL)アプローチを設計した。
最初の段階では、4人組のUnitree Go2がアイザック・ラボのピラミッド階段の階段を登るために訓練された。
2段目では、4段目はアイザック・ラボのエンジンで様々なリアルな屋内階段を登るように訓練され、学習された方針は前段から移された。
これらの屋内階段は直線的で、L字型で、複雑な環境での登山作業を支援する。
このプロジェクトでは、ナビゲーションと移動のバランスと、四足歩行を異なる階段形状に適応させるエンドツーエンドのRL手法について検討する。
主な貢献は,(1) 抽象的なピラミッド地形からリアルな屋内階段トポロジーへ階段登頂スキルを伝達する2段階のエンド・ツー・エンドのRLフレームワークである。
2) 階層的な計画を立てることなくナビゲーションと移動の統一的な学習を可能にする中心線に基づくナビゲーション定式化。
(3)局所的高さマップ認識のみを用いた多様な階段における政策一般化の実証
(4)階段の難易度の増加に伴う成功・効率・失敗モードの実証分析。
関連論文リスト
- From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds [35.62230804783507]
既存の学習ベースのアプローチは、足場不足や非効率な学習プロセスのために、複雑な地形で苦労することが多い。
BeamDojoはアジャイルなヒューマノイドの移動を可能にするための強化学習フレームワークです。
BeamDojoはシミュレーションで効率的な学習を実現し、現実世界の狭い足場に正確な足場を配置してアジャイルの移動を可能にする。
論文 参考訳(メタデータ) (2025-02-14T18:42:42Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - StairNetV3: Depth-aware Stair Modeling using Deep Learning [6.145334325463317]
視覚に基づく階段認識は、自律的な移動ロボットが階段を登るという課題に対処するのに役立つ。
現在の単眼視法では、深度情報なしで階段を正確にモデル化することは困難である。
本稿では,単眼視のための深度対応階段モデリング手法を提案する。
論文 参考訳(メタデータ) (2023-08-13T08:11:40Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Deep Leaning-Based Ultra-Fast Stair Detection [6.362951673024623]
深層学習に基づく階段線検出のためのエンドツーエンド手法を提案する。
実験では,速度と精度の両面で高い性能が得られる。
軽量版は、同じ解像度で毎秒300フレーム以上を達成できる。
論文 参考訳(メタデータ) (2022-01-14T02:05:01Z) - Learning Perceptual Locomotion on Uneven Terrains using Sparse Visual
Observations [75.60524561611008]
この研究は、人中心の環境において、よく見られるバンプ、ランプ、階段の広い範囲にわたる知覚的移動を達成するために、スパースな視覚的観察の使用を活用することを目的としている。
まず、関心の均一な面を表すことのできる最小限の視覚入力を定式化し、このような外受容的・固有受容的データを統合した学習フレームワークを提案する。
本研究では, 平地を全方向歩行し, 障害物のある地形を前方移動させるタスクにおいて, 学習方針を検証し, 高い成功率を示す。
論文 参考訳(メタデータ) (2021-09-28T20:25:10Z) - Learning to Generalize Across Long-Horizon Tasks from Human
Demonstrations [52.696205074092006]
Generalization Through Imitation (GTI) は、2段階のオフライン模倣学習アルゴリズムである。
GTIは、状態空間の共通領域で異なるタスクの軌道を示す構造を利用する。
GTIの第1段階では,異なる実演軌跡から行動を構成する能力を持つために交差点を利用する政策を訓練する。
GTIの第2段階では、ゴール指向エージェントをトレーニングして、新しいスタートとゴールの設定を一般化する。
論文 参考訳(メタデータ) (2020-03-13T02:25:28Z) - augKlimb: Interactive Data-Led Augmentation of Bouldering Training [0.0]
クライミングは人気のあるスポーツであり、特に屋内では、登山者が人工ホールドを使って人工ルートで訓練することができる。
近年,登山にコンピュータ・インタラクションを加える様々な側面が研究されている。
レクリエーションの中間登山者を支援するための軽量ツールの研究のための広大なスペースがある。
論文 参考訳(メタデータ) (2020-01-22T10:26:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。