論文の概要: LoGoPlanner: Localization Grounded Navigation Policy with Metric-aware Visual Geometry
- arxiv url: http://arxiv.org/abs/2512.19629v2
- Date: Tue, 23 Dec 2025 05:37:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 13:10:52.74895
- Title: LoGoPlanner: Localization Grounded Navigation Policy with Metric-aware Visual Geometry
- Title(参考訳): LoGoPlanner: Metric-Aware Visual Geometry を用いたローカライゼーション接地ナビゲーションポリシ
- Authors: Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, Tai Wang, Yuan Shen, Jiangmiao Pang,
- Abstract要約: 非構造環境における軌道計画は、移動ロボットの基本的で困難な能力である。
ローカライズされたエンドツーエンドナビゲーションフレームワークであるLoGoPlannerを紹介する。
シミュレーションと実世界の両方の環境でLoGoPlannerを評価し,その完全なエンドツーエンド設計により累積誤差が低減される。
- 参考スコア(独自算出の注目度): 41.054069737969876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory planning in unstructured environments is a fundamental and challenging capability for mobile robots. Traditional modular pipelines suffer from latency and cascading errors across perception, localization, mapping, and planning modules. Recent end-to-end learning methods map raw visual observations directly to control signals or trajectories, promising greater performance and efficiency in open-world settings. However, most prior end-to-end approaches still rely on separate localization modules that depend on accurate sensor extrinsic calibration for self-state estimation, thereby limiting generalization across embodiments and environments. We introduce LoGoPlanner, a localization-grounded, end-to-end navigation framework that addresses these limitations by: (1) finetuning a long-horizon visual-geometry backbone to ground predictions with absolute metric scale, thereby providing implicit state estimation for accurate localization; (2) reconstructing surrounding scene geometry from historical observations to supply dense, fine-grained environmental awareness for reliable obstacle avoidance; and (3) conditioning the policy on implicit geometry bootstrapped by the aforementioned auxiliary tasks, thereby reducing error propagation. We evaluate LoGoPlanner in both simulation and real-world settings, where its fully end-to-end design reduces cumulative error while metric-aware geometry memory enhances planning consistency and obstacle avoidance, leading to more than a 27.3\% improvement over oracle-localization baselines and strong generalization across embodiments and environments. The code and models have been made publicly available on the https://steinate.github.io/logoplanner.github.io.
- Abstract(参考訳): 非構造環境における軌道計画は、移動ロボットの基本的で困難な能力である。
従来のモジュールパイプラインは、認識、ローカライゼーション、マッピング、計画モジュールにわたるレイテンシとカスケードエラーに悩まされている。
最近のエンド・ツー・エンドの学習手法は、生の視覚的観察を直接制御信号や軌道にマッピングし、オープンワールド環境でのより優れた性能と効率を約束する。
しかし、従来のエンド・ツー・エンドのアプローチは依然として、正確なセンサ外部キャリブレーションによる自己状態推定に依存した別のローカライゼーション・モジュールに依存しており、それによって実施環境や環境の一般化が制限される。
この制限に対処するローカライゼーション・グラウンドド・エンド・ツー・エンドのナビゲーション・フレームワークであるLoGoPlannerを紹介した。(1)長い水平な視覚幾何学のバックボーンを絶対距離スケールで地上予測に微調整し、正確な位置推定のための暗黙の状態を推定し、(2)歴史的観測から周囲の地形を再構築し、高密度できめ細かな環境認識を信頼性のある障害物回避のために提供し、(3)上記の補助タスクによってブートストラップされた暗黙の幾何学のポリシーを条件化し、エラーの伝播を低減する。
シミュレーションと実世界の両面でLoGoPlannerを評価し,その完全なエンドツーエンド設計は累積誤差を低減し,メカニカル・アウェア・ジオメトリ・メモリは計画整合性と障害物回避を強化し,オラクル局在化ベースラインよりも27.3%以上向上し,エボディメントや環境をまたいだ強力な一般化を実現した。
コードとモデルはhttps://steinate.github.io/logoplanner.github.ioで公開されている。
関連論文リスト
- Fly0: Decoupling Semantic Grounding from Geometric Planning for Zero-Shot Aerial Navigation [14.466092698477858]
現在のVisual-Language Navigation (VLN) 手法はセマンティック理解と制御精度のトレードオフに直面している。
幾何学的計画から意味論的推論を分離するフレームワークFly0を提案する。
Fly0は計算オーバーヘッドを減らし、システムの安定性を向上させる。
論文 参考訳(メタデータ) (2026-02-02T09:06:50Z) - OpenNavMap: Structure-Free Topometric Mapping via Large-Scale Collaborative Localization [12.686154192361913]
OpenNavMapは、オンデマンドの再構築に3D幾何学的基礎モデルを活用する軽量で構造のないトポロジカルシステムである。
提案手法は,動的プログラミングに基づくシーケンスマッチング,幾何検証,信頼性校正最適化を,頑健で粗いサブマップアライメントに統一する。
Map-Freeベンチマークの評価は、平均翻訳誤差0.62mを達成し、構造移動ベースラインと回帰ベースラインよりも優れた精度を示す。
論文 参考訳(メタデータ) (2026-01-18T07:24:46Z) - TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - MetricNet: Recovering Metric Scale in Generative Navigation Policies [51.90872764552077]
MetricNetは、ウェイポイント間の距離を予測するジェネレーティブナビゲーションのための効果的なアドオンである。
MetricNetスケールのウェイポイントの実行はナビゲーションと探索の両方のパフォーマンスを大幅に改善することを示す。
また、MetricNetをナビゲーションポリシーに統合し、目標に向かって移動しながら障害物からロボットを誘導するMetricNavを提案する。
論文 参考訳(メタデータ) (2025-09-17T13:37:13Z) - TANGO: Traversability-Aware Navigation with Local Metric Control for Topological Goals [10.69725316052444]
ゼロショット・ロングホライゾン・ロボットナビゲーションを可能にする新しいRGBのみのオブジェクトレベルのトポロジカルナビゲーションパイプラインを提案する。
提案手法は,グローバルなトポロジカルパス計画と局所的軌跡制御を統合し,障害物を避けつつ,ロボットがオブジェクトレベルのサブゴールに向かって移動できるようにする。
シミュレーション環境と実世界の両方のテストにおいて,本手法の有効性を実証し,その堅牢性とデプロイ性を強調した。
論文 参考訳(メタデータ) (2025-09-10T15:43:32Z) - Unified Linear Parametric Map Modeling and Perception-aware Trajectory Planning for Mobile Robotics [1.7495208770207367]
本稿では,高次元空間にデータをマッピングする軽量な線形パラメトリックマップを提案する。
UAVでは,Euclidean Signed Distance Field (ESDF) マップを用いた。
UGVでは、モデルは地形を特徴づけ、クローズドフォーム勾配を提供し、オンラインプランニングによって大きな穴を回避できる。
論文 参考訳(メタデータ) (2025-07-12T16:39:19Z) - NavTopo: Leveraging Topological Maps For Autonomous Navigation Of a Mobile Robot [1.0550841723235613]
トポロジマップと2段階の経路計画に基づく完全なナビゲーションパイプラインを提案する。
パイプラインは、入力ポイントクラウドのニューラルネットワーク記述子と2Dプロジェクションをマッチングすることで、グラフにローカライズする。
提案手法は,大規模な室内光相対論的シミュレーション環境でテストし,一般的な計量マッピング手法であるRTAB-MAPに基づく計量地図に基づく手法と比較する。
論文 参考訳(メタデータ) (2024-10-15T10:54:49Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Towards Motion Forecasting with Real-World Perception Inputs: Are
End-to-End Approaches Competitive? [93.10694819127608]
実世界の知覚入力を用いた予測手法の統一評価パイプラインを提案する。
我々の詳細な調査では、キュレートされたデータから知覚ベースのデータへ移行する際の大きなパフォーマンスギャップが明らかになりました。
論文 参考訳(メタデータ) (2023-06-15T17:03:14Z) - Think Global, Act Local: Dual-scale Graph Transformer for
Vision-and-Language Navigation [87.03299519917019]
本稿では,2次元グラフ変換器 (DUET) を提案する。
我々は,グローバルな行動空間における効率的な探索を可能にするために,トポロジカルマップをオンザフライで構築する。
提案手法であるDUETは、目標指向の視覚・言語ナビゲーションベンチマークにおいて最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-02-23T19:06:53Z) - Lightweight Object-level Topological Semantic Mapping and Long-term
Global Localization based on Graph Matching [19.706907816202946]
本稿では,高精度でロバストなオブジェクトレベルのマッピングとローカライズ手法を提案する。
我々は、環境のランドマークをモデル化するために、意味情報と幾何学情報の両方を持つオブジェクトレベルの特徴を使用する。
提案したマップに基づいて,新たな局所的シーングラフ記述子を構築することにより,ロバストなローカライゼーションを実現する。
論文 参考訳(メタデータ) (2022-01-16T05:47:07Z) - Differentiable Spatial Planning using Transformers [87.90709874369192]
本研究では、長距離空間依存を計画して行動を生成する障害マップを与えられた空間計画変換器(SPT)を提案する。
エージェントが地上の真理マップを知らない環境では、エンド・ツー・エンドのフレームワークで事前訓練されたSPTを利用する。
SPTは、操作タスクとナビゲーションタスクの両方のすべてのセットアップにおいて、最先端の差別化可能なプランナーよりも優れています。
論文 参考訳(メタデータ) (2021-12-02T06:48:16Z) - Sign-Agnostic CONet: Learning Implicit Surface Reconstructions by
Sign-Agnostic Optimization of Convolutional Occupancy Networks [39.65056638604885]
畳み込み型ネットワークの符号非依存最適化により暗黙的表面再構成を学習する。
この目標をシンプルで効果的な設計で効果的に達成できることを示す。
論文 参考訳(メタデータ) (2021-05-08T03:35:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。