論文の概要: PM-Nav: Priori-Map Guided Embodied Navigation in Functional Buildings
- arxiv url: http://arxiv.org/abs/2603.09113v1
- Date: Tue, 10 Mar 2026 02:46:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.957834
- Title: PM-Nav: Priori-Map Guided Embodied Navigation in Functional Buildings
- Title(参考訳): PM-Nav: 関数型建物における事前マップガイド付き身体ナビゲーション
- Authors: Jiang Gao, Xiangyu Dong, Haozhou Li, Haoran Zhao, Yaoming Zhou, Xiaoguang Ma,
- Abstract要約: 関数型建物(FB)のための事前マップガイド型身体ナビゲーション(PM-Nav)を提案する。
PM-Navは環境マップをナビゲーションフレンドリーなセマンティック事前マップに変換し、正確な経路計画を可能にする階層的連鎖プロンプトテンプレートを設計する。
自家製のFBデータセットを用いた総合的なテストでは、PM-Navはシミュレーションと実世界におけるSG-NavとInstructNavよりも平均で511%と1175%、SG-NavとInstructNavよりも650%と400%向上している。
- 参考スコア(独自算出の注目度): 6.978429025073979
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing language-driven embodied navigation paradigms face challenges in functional buildings (FBs) with highly similar features, as they lack the ability to effectively utilize priori spatial knowledge. To tackle this issue, we propose a Priori-Map Guided Embodied Navigation (PM-Nav), wherein environmental maps are transformed into navigation-friendly semantic priori-maps, a hierarchical chain-of-thought prompt template with an annotation priori-map is designed to enable precise path planning, and a multi-model collaborative action output mechanism is built to accomplish positioning decisions and execution control for navigation planning. Comprehensive tests using a home-made FB dataset show that the PM-Nav obtains average improvements of 511\% and 1175\%, and 650\% and 400\% over the SG-Nav and the InstructNav in simulation and real-world, respectively. These tremendous boosts elucidate the great potential of using the PM-Nav as a backbone navigation framework for FBs.
- Abstract(参考訳): 既存の言語駆動の具体化ナビゲーションパラダイムは、事前空間知識を効果的に活用する能力がないため、機能的建物(FB)において非常に類似した特徴を持つ課題に直面している。
そこで本研究では,環境マップをナビゲーションフレンドリなセマンティック事前マップに変換し,アノテーションを付加した階層的なチェーン・オブ・シークレットテンプレートを,正確な経路計画を可能にするよう設計し,ナビゲーション計画のための位置決定と実行制御を実現するための多モデル協調動作出力機構を構築した。
自家製のFBデータセットを用いた総合的なテストでは、PM-Navは、シミュレーションと実世界のそれぞれで、SG-NavとInstructNavの平均511\%と1175\%、SG-Navの平均650\%と400\%を得る。
これにより、PM-NavをFBのバックボーンナビゲーションフレームワークとして使用する大きな可能性を解明する。
関連論文リスト
- ReasonNavi: Human-Inspired Global Map Reasoning for Zero-Shot Embodied Navigation [53.95797153529148]
身体的エージェントは、主に部分的な自我中心の観測に依存するため、効率的なナビゲーションに苦しむことが多い。
本稿では,マルチモーダル大規模言語モデル(MLLM)と決定論的プランナを結合することにより,この理由に基づくパラダイムを運用する,人間にインスパイアされたフレームワークであるReasonNaviを紹介する。
論文 参考訳(メタデータ) (2026-01-26T19:09:20Z) - FOM-Nav: Frontier-Object Maps for Object Goal Navigation [65.76906445210112]
FOM-Navはフロンティアオブジェクトマップと視覚言語モデルによる探索効率を高めるフレームワークである。
FOM-Navをトレーニングするために,実環境から大規模ナビゲーションデータセットを自動構築する。
FOM-NavはMP3DとHM3Dのベンチマーク、特にナビゲーション効率の指標SPLで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-30T18:16:09Z) - TopV-Nav: Unlocking the Top-View Spatial Reasoning Potential of MLLM for Zero-shot Object Navigation [52.422619828854984]
MLLMをベースとしたTopV-Navを提案する。
MLLMの空間推論能力をトップビューで完全に解き放つために,適応型視覚プロンプト生成法(AVPG)を提案する。
論文 参考訳(メタデータ) (2024-11-25T14:27:55Z) - SayNav: Grounding Large Language Models for Dynamic Planning to Navigation in New Environments [14.179677726976056]
SayNavは、Large Language Models(LLM)からの人間の知識を活用して、複雑なナビゲーションタスクを効率的に一般化する新しいアプローチである。
SayNavは最先端の結果を達成し、成功率の点で強烈な地道的な仮定でオラクルベースのベースラインを8%以上上回ります。
論文 参考訳(メタデータ) (2023-09-08T02:24:37Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。