論文の概要: REASAN: Learning Reactive Safe Navigation for Legged Robots
- arxiv url: http://arxiv.org/abs/2512.09537v1
- Date: Wed, 10 Dec 2025 11:23:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.257254
- Title: REASAN: Learning Reactive Safe Navigation for Legged Robots
- Title(参考訳): ReASAN:レッグロボットのためのリアクティブセーフナビゲーション学習
- Authors: Qihao Yuan, Ziyu Cao, Ming Cao, Kailai Li,
- Abstract要約: 複雑な動的環境における脚付きリアクティブナビゲーションのための新しいモジュール化されたエンドツーエンドフレームワークを提案する。
3つの強化学習(RL)ポリシーで、移動、安全遮蔽、ナビゲーション、およびトランスフォーマーをベースとした外部受容推定器を備える。
結果として生じるリアクティブセーフナビゲーション(REASAN)システムは、シングルボットとマルチボットの両方で完全にオンボードおよびリアルタイムのリアクティブナビゲーションを実現する。
- 参考スコア(独自算出の注目度): 3.0268879088436496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel modularized end-to-end framework for legged reactive navigation in complex dynamic environments using a single light detection and ranging (LiDAR) sensor. The system comprises four simulation-trained modules: three reinforcement-learning (RL) policies for locomotion, safety shielding, and navigation, and a transformer-based exteroceptive estimator that processes raw point-cloud inputs. This modular decomposition of complex legged motor-control tasks enables lightweight neural networks with simple architectures, trained using standard RL practices with targeted reward shaping and curriculum design, without reliance on heuristics or sophisticated policy-switching mechanisms. We conduct comprehensive ablations to validate our design choices and demonstrate improved robustness compared to existing approaches in challenging navigation tasks. The resulting reactive safe navigation (REASAN) system achieves fully onboard and real-time reactive navigation across both single- and multi-robot settings in complex environments. We release our training and deployment code at https://github.com/ASIG-X/REASAN.
- Abstract(参考訳): 単一光検出・測光センサ(LiDAR)を用いて,複雑な動的環境下での脚付きリアクティブナビゲーションのための新しいモジュール化されたエンドツーエンドフレームワークを提案する。
システムは,3つの強化学習(RL)ポリシー,ローコモーション,安全遮蔽,ナビゲーションの4つのシミュレーション学習モジュールと,生のポイントクラウド入力を処理するトランスフォーマーベースの外部受容推定器を備える。
複雑な脚の運動制御タスクのモジュラー分解により、単純なアーキテクチャを持つ軽量ニューラルネットワークが実現され、ヒューリスティックや洗練されたポリシー変更機構に頼ることなく、目標とする報酬形成とカリキュラム設計を備えた標準のRLプラクティスを使用して訓練される。
設計上の選択を検証し、ナビゲーションタスクに挑戦する既存のアプローチと比較して堅牢性の向上を実証するために、包括的なアブリケーションを実施します。
結果として生じるリアクティブセーフナビゲーション(REASAN)システムは、複雑な環境において、シングルボットとマルチボットの両方で完全にオンボードおよびリアルタイムのリアクティブナビゲーションを実現する。
トレーニングとデプロイメントのコードはhttps://github.com/ASIG-X/REASAN.comで公開しています。
関連論文リスト
- CLASH: Collaborative Large-Small Hierarchical Framework for Continuous Vision-and-Language Navigation [38.37757288365413]
VLN(Vision-and-Language Navigation)では、ロボットが自然言語の指示に従い、事前の地図を使わずに複雑な環境をナビゲートする必要がある。
反応型小型モデルプランナ (RSMP) と反射型大型モデル推論器 (RLMR) を統合した VLN-CE フレームワーク CLASH を提案する。
シミュレーションでは,ルールベースのコントローラを完全学習可能なポイントゴールポリシーに置き換え,実世界の展開では,ナビゲーション可能なウェイポイントを生成するためのLiDARベースのクラスタリングモジュールを設計する。
論文 参考訳(メタデータ) (2025-12-11T07:20:06Z) - Hierarchical Decision-Making for Autonomous Navigation: Integrating Deep Reinforcement Learning and Fuzzy Logic in Four-Wheel Independent Steering and Driving Systems [19.641592340569577]
本稿では,4WISDシステムにおける自律ナビゲーションのための階層的意思決定フレームワークを提案する。
提案手法は,高レベルナビゲーションのための深層強化学習とファジィロジックを統合し,タスク性能と物理的実現性の両方を保証する。
論文 参考訳(メタデータ) (2025-08-22T17:57:56Z) - From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - RoboRAN: A Unified Robotics Framework for Reinforcement Learning-Based Autonomous Navigation [15.548637925166986]
多様なロボットプラットフォームと運用環境にまたがって、RLベースのナビゲーションポリシーをトレーニング、評価、デプロイするためのマルチドメインフレームワークを提案する。
本研究は,(1)シームレスなロボットタスク交換性と再現可能なトレーニングパイプラインを実現するスケーラブルでモジュール化されたフレームワーク,(2)複数のロボットによる実世界実験を通じて実世界へのトランスファーを実証するsim-to-real,(3)Isaac Labがトレーニングしたポリシーを実際のロボットに展開する最初のオープンソースAPIのリリース,の4つの重要な貢献について述べる。
論文 参考訳(メタデータ) (2025-05-20T15:48:23Z) - Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文 参考訳(メタデータ) (2025-04-30T13:47:25Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Modular Neural Network Policies for Learning In-Flight Object Catching
with a Robot Hand-Arm System [55.94648383147838]
本稿では,ロボットハンドアームシステムによる飛行物体の捕獲方法の学習を可能にするモジュラーフレームワークを提案する。
本フレームワークは,物体の軌跡予測を学習するオブジェクト状態推定器,(ii)捕捉対象のポーズのスコアとランク付けを学ぶキャッチポーズ品質ネットワーク,(iii)ロボットハンドをキャッチ前ポーズに移動させるように訓練されたリーチ制御ポリシ,(iv)ソフトキャッチ動作を行うように訓練された把握制御ポリシの5つのコアモジュールから構成される。
各モジュールと統合システムのシミュレーションにおいて、我々のフレームワークを広範囲に評価し、飛行における高い成功率を示す。
論文 参考訳(メタデータ) (2023-12-21T16:20:12Z) - PIC4rl-gym: a ROS2 modular framework for Robots Autonomous Navigation
with Deep Reinforcement Learning [0.4588028371034407]
この研究は、ナビゲーションと学習の研究を強化するための基本的なモジュラーフレームワークであるtextitPIC4rl-gymを導入している。
本稿では、DRLエージェントのトレーニングとテストを完全に統合したPIC4rl-gymの全体構造について述べる。
モジュラーアプローチは、新しいプラットフォーム、センサー、モデルを選択することで、シミュレーションを簡単にカスタマイズするために採用されている。
論文 参考訳(メタデータ) (2022-11-19T14:58:57Z) - Embodied Visual Navigation with Automatic Curriculum Learning in Real
Environments [20.017277077448924]
NavACLは、ナビゲーションタスクに適した自動カリキュラム学習の方法である。
NavACLを用いて訓練した深層強化学習剤は、均一サンプリングで訓練した最先端エージェントよりも有意に優れていた。
我々のエージェントは、未知の乱雑な屋内環境から、RGB画像のみを使用して意味的に特定されたターゲットへ移動することができる。
論文 参考訳(メタデータ) (2020-09-11T13:28:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。