論文の概要: LAMP: Implicit Language Map for Robot Navigation
- arxiv url: http://arxiv.org/abs/2602.11862v1
- Date: Thu, 12 Feb 2026 12:09:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.392107
- Title: LAMP: Implicit Language Map for Robot Navigation
- Title(参考訳): LAMP:ロボットナビゲーションのための暗黙の言語マップ
- Authors: Sibaek Lee, Hyeonwoo Yu, Giseop Kim, Sunwook Choi,
- Abstract要約: 我々は、新しいニューラルネットワークフィールドベースのナビゲーションフレームワークであるLAMPを紹介する。
連続した言語駆動のマップを学習し、それを直接、きめ細かいパス生成に利用する。
LAMPは、メモリ効率と細かいゴール取得精度の両方において、既存の明示的な手法よりも優れています。
- 参考スコア(独自算出の注目度): 5.142476231432641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in vision-language models have made zero-shot navigation feasible, enabling robots to follow natural language instructions without requiring labeling. However, existing methods that explicitly store language vectors in grid or node-based maps struggle to scale to large environments due to excessive memory requirements and limited resolution for fine-grained planning. We introduce LAMP (Language Map), a novel neural language field-based navigation framework that learns a continuous, language-driven map and directly leverages it for fine-grained path generation. Unlike prior approaches, our method encodes language features as an implicit neural field rather than storing them explicitly at every location. By combining this implicit representation with a sparse graph, LAMP supports efficient coarse path planning and then performs gradient-based optimization in the learned field to refine poses near the goal. This coarse-to-fine pipeline, language-driven, gradient-guided optimization is the first application of an implicit language map for precise path generation. This refinement is particularly effective at selecting goal regions not directly observed by leveraging semantic similarities in the learned feature space. To further enhance robustness, we adopt a Bayesian framework that models embedding uncertainty via the von Mises-Fisher distribution, thereby improving generalization to unobserved regions. To scale to large environments, LAMP employs a graph sampling strategy that prioritizes spatial coverage and embedding confidence, retaining only the most informative nodes and substantially reducing computational overhead. Our experimental results, both in NVIDIA Isaac Sim and on a real multi-floor building, demonstrate that LAMP outperforms existing explicit methods in both memory efficiency and fine-grained goal-reaching accuracy.
- Abstract(参考訳): 近年の視覚言語モデルの進歩により、ゼロショットナビゲーションの実現が可能となり、ラベル付けを必要とせずに、ロボットが自然言語命令に従うことが可能になった。
しかし、グリッドやノードベースのマップに言語ベクトルを明示的に格納する既存の手法では、過剰なメモリ要求ときめ細かい計画のための限定された解像度のため、大規模環境へのスケールが困難である。
LAMP(Language Map)は,連続的な言語駆動マップを学習し,よりきめ細かい経路生成のために直接利用する,新しい言語フィールドベースのナビゲーションフレームワークである。
従来の手法とは異なり、我々の手法は言語の特徴を暗黙のニューラルネットワークとしてエンコードする。
この暗黙の表現とスパースグラフを組み合わせることで、LAMPは効率的な粗い経路計画をサポートし、学習分野における勾配に基づく最適化を行い、目標付近のポーズを洗練させる。
この粗いパイプライン、言語駆動、勾配誘導最適化は、正確なパス生成のための暗黙の言語マップの最初の応用である。
この改良は、学習した特徴空間における意味的類似性を利用して直接観察されない目標領域を選択するのに特に効果的である。
さらにロバスト性を高めるために、フォン・ミセス・フィッシャー分布を介して不確実性をモデル化し、非観測領域への一般化を改善するベイズ的枠組みを採用する。
大規模環境にスケールするために、LAMPはグラフサンプリング戦略を採用し、空間的カバレッジと信頼性の埋め込みを優先し、最も情報性の高いノードのみを保持し、計算オーバーヘッドを大幅に削減する。
NVIDIAのIsaac Simと実際のマルチフロア・ビルディングにおける実験結果は、LAMPがメモリ効率と目標達成精度の両方において、既存の明示的手法より優れていることを実証している。
関連論文リスト
- R2F: Repurposing Ray Frontiers for LLM-free Object Navigation [1.4755786263360526]
VLM(Vision-Language Models)とLLM(Large Language Models)は、現在ではエンドツーエンドのポリシーではなく、ハイレベルな意思決定者として広く使われている。
室内でのオープン語彙オブジェクトナビゲーションのためのLLMフリーフレームワークを開発した。
Habitat-simおよび実際のロボットプラットフォームにおける実験は、リアルタイム実行による最先端のゼロショットパフォーマンスの競争力を示す。
論文 参考訳(メタデータ) (2026-03-09T15:10:10Z) - USS-Nav: Unified Spatio-Semantic Scene Graph for Lightweight UAV Zero-Shot Object Navigation [10.934912400963588]
USS-Navは、Unified Spatio-Semanticのシーングラフをインクリメンタルに構築する軽量フレームワークである。
未知環境での効率的なLarge Language Model (LLM)拡張Zero-Shot Object Navigationを可能にする。
我々のフレームワークは、計算効率とリアルタイム更新頻度の点で最先端の手法より優れています。
論文 参考訳(メタデータ) (2026-01-31T13:10:02Z) - LangGS-SLAM: Real-Time Language-Feature Gaussian Splatting SLAM [2.738569311610586]
RGB-D SLAM システムは低遅延追跡とマッピングを継続しながら,言語対応の高密度特徴場を再構築する。
システムは15FPSで動作しながら、幾何学的のみのベースラインとオフラインアプローチに匹敵する意味的忠実性よりも優れた幾何学的忠実性を実現する。
論文 参考訳(メタデータ) (2026-01-28T05:35:34Z) - Language Driven Occupancy Prediction [13.35971455725581]
オープン語彙占有予測のための効果的で一般化可能なフレームワークであるLOccを紹介する。
私たちのパイプラインは、画像の貴重な意味情報を掘り下げ、画像からテキストラベルをLiDARポイントクラウドに、最終的にはボクセルに転送する、実現可能な方法を提供します。
教師付き占有モデルの当初の予測ヘッドを二進的占有状態のための幾何学ヘッドと言語特徴のための言語ヘッドに置き換えることで、LOccは生成された言語基底真実を効果的に利用して、3D言語ボリュームの学習をガイドする。
論文 参考訳(メタデータ) (2024-11-25T03:47:10Z) - MAGNET: Improving the Multilingual Fairness of Language Models with Adaptive Gradient-Based Tokenization [81.83460411131931]
マルチ言語設定では、非ラテン語スクリプトと低リソース言語は通常、言語モデルの実用性、効率、コストの点で不利である。
適応的勾配に基づくサブワードトークン化による過分割を低減するために,多言語適応型勾配ベーストークン化を提案する。
論文 参考訳(メタデータ) (2024-07-11T18:59:21Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - GOI: Find 3D Gaussians of Interest with an Optimizable Open-vocabulary Semantic-space Hyperplane [53.388937705785025]
3Dオープンボキャブラリのシーン理解は、拡張現実とロボット応用の推進に不可欠である。
GOIは2次元視覚言語基礎モデルから3次元ガウススプラッティング(3DGS)に意味的特徴を統合するフレームワークである。
提案手法では,特徴空間内の超平面分割として特徴選択処理を扱い,クエリに関連性の高い特徴のみを保持する。
論文 参考訳(メタデータ) (2024-05-27T18:57:18Z) - Think Global, Act Local: Dual-scale Graph Transformer for
Vision-and-Language Navigation [87.03299519917019]
本稿では,2次元グラフ変換器 (DUET) を提案する。
我々は,グローバルな行動空間における効率的な探索を可能にするために,トポロジカルマップをオンザフライで構築する。
提案手法であるDUETは、目標指向の視覚・言語ナビゲーションベンチマークにおいて最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-02-23T19:06:53Z) - Lightweight Object-level Topological Semantic Mapping and Long-term
Global Localization based on Graph Matching [19.706907816202946]
本稿では,高精度でロバストなオブジェクトレベルのマッピングとローカライズ手法を提案する。
我々は、環境のランドマークをモデル化するために、意味情報と幾何学情報の両方を持つオブジェクトレベルの特徴を使用する。
提案したマップに基づいて,新たな局所的シーングラフ記述子を構築することにより,ロバストなローカライゼーションを実現する。
論文 参考訳(メタデータ) (2022-01-16T05:47:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。