論文の概要: Path-conditioned Reinforcement Learning-based Local Planning for Long-Range Navigation
- arxiv url: http://arxiv.org/abs/2603.13888v1
- Date: Sat, 14 Mar 2026 10:56:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.796635
- Title: Path-conditioned Reinforcement Learning-based Local Planning for Long-Range Navigation
- Title(参考訳): 経路条件強化学習に基づく長距離ナビゲーションのためのローカルプランニング
- Authors: Mateo Haro, Julia Richter, Fan Yang, Cesar Cadena, Marco Hutter,
- Abstract要約: 長距離ナビゲーションは、グローバルプランナーが経路を生成し、ウェイポイントに分解し、続いてローカルプランナーが続く階層的なパイプラインを通して一般的に対処される。
これらのシステムはグローバルパスの品質に敏感であり、不正確なリモートセンシングデータによって局所的に不可能な経路ポイントが発生し、局所的な実行が低下する可能性がある。
本稿では,経路情報を文脈ガイダンスとして活用する強化学習に基づくローカルナビゲーションポリシーを提案する。
- 参考スコア(独自算出の注目度): 7.689666519246369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-range navigation is commonly addressed through hierarchical pipelines in which a global planner generates a path, decomposed into waypoints, and followed sequentially by a local planner. These systems are sensitive to global path quality, as inaccurate remote sensing data can result in locally infeasible waypoints, which degrade local execution. At the same time, the limited global context available to the local planner hinders long-range efficiency. To address this issue, we propose a reinforcement learning-based local navigation policy that leverages path information as contextual guidance. The policy is conditioned on reference path observations and trained with a reward function mainly based on goal-reaching objectives, without any explicit path-following reward. Through this implicit conditioning, the policy learns to opportunistically exploit path information while remaining robust to misleading or degraded guidance. Experimental results show that the proposed approach significantly improves navigation efficiency when high-quality paths are available and maintains baseline-level performance when path observations are severely degraded or even non-existent. These properties make the method particularly well-suited for long-range navigation scenarios in which high-level plans are approximate and local execution must remain adaptive to uncertainty.
- Abstract(参考訳): 長距離ナビゲーションは、グローバルプランナーが経路を生成し、ウェイポイントに分解し、続いてローカルプランナーが続く階層的なパイプラインを通して一般的に対処される。
これらのシステムはグローバルパスの品質に敏感であり、不正確なリモートセンシングデータによって局所的に不可能な経路ポイントが発生し、局所的な実行が低下する可能性がある。
同時に、地域プランナーが利用できる限られたグローバルコンテキストは、長距離効率を妨げる。
この問題に対処するために,経路情報を文脈ガイダンスとして活用する強化学習に基づくローカルナビゲーションポリシーを提案する。
この方針は基準経路の観測に基づいて調整され、目標達成目標に基づいた報酬関数で訓練されるが、明確な経路追従報酬は得られない。
この暗黙の条件付けを通じて、ポリシーは、誤った誘導や劣化したガイダンスに頑健でありながら、パス情報を機会的に活用することを学ぶ。
実験結果から,提案手法は高品質パスが利用可能である場合のナビゲーション効率を著しく向上し,パス観察が著しく劣化したり,あるいは存在しない場合のベースラインレベルの性能を維持した。
これらの特性は、高レベル計画が近似的であり、局所実行が不確実性に適応していなければならない長距離ナビゲーションシナリオに特に適している。
関連論文リスト
- HaltNav: Reactive Visual Halting over Lightweight Topological Priors for Robust Vision-Language Navigation [1.774434289475737]
VLN(Vision-and-Language Navigation)は、厳格なステップバイステップの指示から、オープンな語彙、ゴール指向の自律性へとシフトしている。
本稿では,OsmAGのロバストなグローバルプランニングと,VLNの局所探索と命令グラウンド機能を組み合わせた階層型ナビゲーションフレームワークHaltNavを提案する。
論文 参考訳(メタデータ) (2026-03-13T06:22:35Z) - DAgger Diffusion Navigation: DAgger Boosted Diffusion Policy for Vision-Language Navigation [73.80968452950854]
Vision-Language Navigation in Continuous Environments (VLN-CE) は、エージェントが自由形式の3D空間を通して自然言語の指示に従う必要がある。
既存のVLN-CEアプローチは通常、2段階のウェイポイント計画フレームワークを使用する。
本稿では,エンドツーエンド最適化VLN-CEポリシとしてDAgger Diffusion Navigation (DifNav)を提案する。
論文 参考訳(メタデータ) (2025-08-13T02:51:43Z) - Bayesian-Driven Graph Reasoning for Active Radio Map Construction [96.08082552413117]
本稿では,経路ナビゲーションに適したグラフベースの推論を明示的に活用する不確実性を考慮した無線地図再構成フレームワークを提案する。
提案手法は,(1)空間的不確実性をリアルタイムで推定するベイズニューラルネットワーク,(2)グローバル推論を行う注意に基づく強化学習ポリシの2つの重要な深層学習要素を統合した。
実験の結果,URAMは既存のベースラインよりも最大で34%の精度で復元できることがわかった。
論文 参考訳(メタデータ) (2025-07-29T03:32:01Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - Find a Way Forward: a Language-Guided Semantic Map Navigator [53.69229615952205]
本稿では,新たな視点で言語誘導ナビゲーションの問題に対処する。
ロボットが自然言語の指示を実行し、地図観測に基づいて目標位置へ移動できるようにする。
提案手法は特に長距離ナビゲーションの場合において顕著な性能向上をもたらす。
論文 参考訳(メタデータ) (2022-03-07T07:40:33Z) - Uncertainty-driven Planner for Exploration and Navigation [36.933903274373336]
未確認環境における探索とポイントゴールナビゲーションの問題点を考察する。
本論では,屋内マップよりも先進的な学習が,これらの問題に対処する上で大きなメリットをもたらすと論じている。
本稿では、まず、エージェントの視野を超えた占有マップを生成することを学習する新しい計画フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-24T05:25:31Z) - Real-time Localization Using Radio Maps [59.17191114000146]
パスロスに基づく簡易かつ効果的なローカライゼーション法を提案する。
提案手法では, 受信した信号強度を, 既知の位置を持つ基地局の集合から報告する。
論文 参考訳(メタデータ) (2020-06-09T16:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。