論文の概要: DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes
- arxiv url: http://arxiv.org/abs/2506.01950v2
- Date: Wed, 04 Jun 2025 17:05:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 13:54:39.525463
- Title: DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes
- Title(参考訳): DualMap: 動的変化シーンにおける自然言語ナビゲーションのためのオンラインオープン語彙セマンティックマッピング
- Authors: Jiajun Jiang, Yiming Zhu, Zirui Wu, Jie Song,
- Abstract要約: DualMapは、ロボットが動的に変化する環境を理解し、ナビゲートできるオンラインのオープン語彙マッピングシステムである。
提案するハイブリッドセグメンテーションとオブジェクトレベルのステータスチェックにより,従来の手法が必要とする3Dオブジェクトのマージが不要になる。
- 参考スコア(独自算出の注目度): 16.698884856720408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce DualMap, an online open-vocabulary mapping system that enables robots to understand and navigate dynamically changing environments through natural language queries. Designed for efficient semantic mapping and adaptability to changing environments, DualMap meets the essential requirements for real-world robot navigation applications. Our proposed hybrid segmentation frontend and object-level status check eliminate the costly 3D object merging required by prior methods, enabling efficient online scene mapping. The dual-map representation combines a global abstract map for high-level candidate selection with a local concrete map for precise goal-reaching, effectively managing and updating dynamic changes in the environment. Through extensive experiments in both simulation and real-world scenarios, we demonstrate state-of-the-art performance in 3D open-vocabulary segmentation, efficient scene mapping, and online language-guided navigation.
- Abstract(参考訳): 我々は、ロボットが自然言語クエリを通して動的に変化する環境を理解し、ナビゲートできるオンラインのオープン語彙マッピングシステムであるDualMapを紹介した。
環境変化に対する効率的なセマンティックマッピングと適応性のために設計されたDualMapは、現実世界のロボットナビゲーションアプリケーションに必要な要件を満たす。
提案するハイブリッドセグメンテーションフロントエンドとオブジェクトレベルのステータスチェックは,従来の手法が必要とする3Dオブジェクトのマージを不要にすることで,効率的なオンラインシーンマッピングを実現する。
デュアルマップ表現は、高レベル候補選択のためのグローバル抽象マップと、正確なゴール取得、環境の動的変化の効果的管理と更新のための局所的な具体的なマップを組み合わせる。
シミュレーションと実世界のシナリオの両方における広範な実験を通じて、3次元オープン語彙セグメンテーション、効率的なシーンマッピング、オンライン言語誘導ナビゲーションの最先端性能を実証した。
関連論文リスト
- O2V-Mapping: Online Open-Vocabulary Mapping with Neural Implicit Representation [9.431926560072412]
ボクセルをベースとした言語と幾何学的特徴を利用してオープン語彙場を作成するO2Vマッピングを提案する。
オープン語彙オブジェクトのローカライゼーションとセマンティックセグメンテーションの実験は、O2Vマッピングが言語シーンのオンライン構築を実現することを示す。
論文 参考訳(メタデータ) (2024-04-10T08:54:43Z) - Mapping High-level Semantic Regions in Indoor Environments without
Object Recognition [50.624970503498226]
本研究では,屋内環境における埋め込みナビゲーションによる意味領域マッピング手法を提案する。
地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。
グローバルなフレームにエゴセントリックなシーン理解を投影することにより、提案手法は各場所の可能な領域ラベル上の分布としてのセマンティックマップを生成する。
論文 参考訳(メタデータ) (2024-03-11T18:09:50Z) - Vision and Language Navigation in the Real World via Online Visual
Language Mapping [18.769171505280127]
視覚・言語ナビゲーション(VLN)法は主にシミュレーションで評価される。
実世界のVLN課題に対処する新しい枠組みを提案する。
未確認実験環境において,Interbotix LoCoBot WX250を用いたパイプラインの評価を行った。
論文 参考訳(メタデータ) (2023-10-16T20:44:09Z) - Object Goal Navigation with Recursive Implicit Maps [92.6347010295396]
対象目標ナビゲーションのための暗黙的な空間マップを提案する。
提案手法は, 挑戦的なMP3Dデータセット上での技量を著しく上回る。
我々は、実際のロボットにモデルをデプロイし、実際のシーンでオブジェクトゴールナビゲーションの結果を奨励する。
論文 参考訳(メタデータ) (2023-08-10T14:21:33Z) - GridMM: Grid Memory Map for Vision-and-Language Navigation [40.815400962166535]
ビジョン・アンド・ランゲージナビゲーション(VLN)は、エージェントが3D環境における自然言語の指示に従って遠隔地へ移動できるようにする。
訪問環境を構築するために、トップダウンのエゴセントリックで動的に成長するグリッドメモリマップを構築します。
地球から見ると、歴史的観測はトップダウンの視点で統一グリッドマップに投影され、環境の空間的関係をよりよく表すことができる。
論文 参考訳(メタデータ) (2023-07-24T16:02:42Z) - Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language
Navigation [87.52136927091712]
我々は,ロボットエージェントが言語指導によって記述された経路をたどって,環境の中をナビゲートするよう訓練する,現実的かつ困難な問題に対処する。
高精度かつ効率的なナビゲーションを実現するためには,環境オブジェクトの空間的位置と意味情報の両方を正確に表現した地図を構築することが重要である。
より包括的にオブジェクトを表現するために,オブジェクトの細粒度(色,テクスチャなど)とセマンティッククラスの両方を含む多粒度マップを提案する。
論文 参考訳(メタデータ) (2022-10-14T04:23:27Z) - Think Global, Act Local: Dual-scale Graph Transformer for
Vision-and-Language Navigation [87.03299519917019]
本稿では,2次元グラフ変換器 (DUET) を提案する。
我々は,グローバルな行動空間における効率的な探索を可能にするために,トポロジカルマップをオンザフライで構築する。
提案手法であるDUETは、目標指向の視覚・言語ナビゲーションベンチマークにおいて最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-02-23T19:06:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。