論文の概要: NORM-Nav: Zero-Shot Mobile Robot Navigation with Natural Language Behavioral Constraints
- arxiv url: http://arxiv.org/abs/2605.16979v1
- Date: Sat, 16 May 2026 12:58:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:39:06.056365
- Title: NORM-Nav: Zero-Shot Mobile Robot Navigation with Natural Language Behavioral Constraints
- Title(参考訳): NORM-Nav:自然言語行動制約付きゼロショット移動ロボットナビゲーション
- Authors: Dongjie Huo, Junhui Wang, Chao Gao, Yan Qiao, Dong Zhang, Guyue Zhou,
- Abstract要約: 本稿では,NORM-Navについて述べる。NORM-Navは,自然言語の振る舞い制約をコストマップに基づく計画に組み込むフレームワークである。
LLMは、各命令を構造化された制約に解析し、リアルタイムビジョン-LiDAR知覚を使ってそれらをグラウンド化する。
シミュレーションと実世界の実験により、NORM-Navはタスクの成功率を改善し、代表ベースラインよりも人間の参照に近い軌道を生成することが示されている。
- 参考スコア(独自算出の注目度): 46.6378130545666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile robots operating in human-centered environments must generate not only collision-free paths but also trajectories that follow local behavioral conventions. Conventional costmap-based navigation emphasizes geometric feasibility and often overlooks such requirements, which can result in socially inappropriate behaviors. This paper presents NORM-Nav, a zero-shot framework that integrates natural language behavioral constraints into costmap-based planning. An LLM parses each instruction into structured constraints and grounds them using real-time vision--LiDAR perception. These constraints are encoded as multi-layer costmaps that represent geometric, semantic, directional, and velocity cues and are directly compatible with standard grid-based planners. Simulation and real-world experiments indicate that NORM-Nav improves task success rates and produces trajectories closer to human references than representative baselines. The project website is available at https://ei-nav.github.io/NORM-Nav.
- Abstract(参考訳): 人間中心の環境で動く移動ロボットは、衝突のない経路だけでなく、局所的な行動規範に従う軌道も生成しなければならない。
従来のコストマップに基づくナビゲーションは幾何学的実現性を強調し、しばしばそのような要件を見落とし、社会的に不適切な振る舞いをもたらす。
本稿では,NORM-Navについて述べる。NORM-Navは,自然言語の振る舞い制約をコストマップに基づく計画に組み込むゼロショットフレームワークである。
LLMは、各命令を構造化された制約に解析し、リアルタイムビジョン-LiDAR知覚を使ってそれらをグラウンド化する。
これらの制約は、幾何、意味、方向、速度のキューを表す多層コストマップとして符号化され、標準グリッドベースのプランナーと直接互換性がある。
シミュレーションと実世界の実験により、NORM-Navはタスクの成功率を改善し、代表ベースラインよりも人間の参照に近い軌道を生成することが示されている。
プロジェクトのWebサイトはhttps://ei-nav.github.io/NORM-Nav.comで公開されている。
関連論文リスト
- ReasonNavi: Human-Inspired Global Map Reasoning for Zero-Shot Embodied Navigation [53.95797153529148]
身体的エージェントは、主に部分的な自我中心の観測に依存するため、効率的なナビゲーションに苦しむことが多い。
本稿では,マルチモーダル大規模言語モデル(MLLM)と決定論的プランナを結合することにより,この理由に基づくパラダイムを運用する,人間にインスパイアされたフレームワークであるReasonNaviを紹介する。
論文 参考訳(メタデータ) (2026-01-26T19:09:20Z) - GC-VLN: Instruction as Graph Constraints for Training-free Vision-and-Language Navigation [61.34589819350429]
視覚・言語ナビゲーション(VLN)のための学習自由フレームワークを提案する。
本フレームワークは,指示を明示的な空間的制約に分解することで,グラフ制約最適化としてナビゲーションガイダンスを定式化する。
我々のフレームワークは、新しい環境や命令セットに効果的に一般化することができ、より堅牢で自律的なナビゲーションフレームワークへの道を開くことができる。
論文 参考訳(メタデータ) (2025-09-12T17:59:58Z) - TANGO: Traversability-Aware Navigation with Local Metric Control for Topological Goals [10.69725316052444]
ゼロショット・ロングホライゾン・ロボットナビゲーションを可能にする新しいRGBのみのオブジェクトレベルのトポロジカルナビゲーションパイプラインを提案する。
提案手法は,グローバルなトポロジカルパス計画と局所的軌跡制御を統合し,障害物を避けつつ,ロボットがオブジェクトレベルのサブゴールに向かって移動できるようにする。
シミュレーション環境と実世界の両方のテストにおいて,本手法の有効性を実証し,その堅牢性とデプロイ性を強調した。
論文 参考訳(メタデータ) (2025-09-10T15:43:32Z) - NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning Disentangled Reasoning [97.88246428240872]
Embodied AIの重要な研究課題であるVision-and-Language Navigation (VLN)は、自然言語の指示に従って複雑な3D環境をナビゲートするために、エンボディエージェントを必要とする。
近年の研究では、ナビゲーションの推論精度と解釈可能性を改善することにより、VLNにおける大きな言語モデル(LLM)の有望な能力を強調している。
本稿では,自己誘導型ナビゲーション決定を実現するために,パラメータ効率の高いドメイン内トレーニングを実現する,Navigational Chain-of-Thought (NavCoT) という新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T07:27:02Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Learning Synthetic to Real Transfer for Localization and Navigational
Tasks [7.019683407682642]
ナビゲーションは、コンピュータビジョン、ロボット工学、制御の概念を組み合わせて、複数の分野のクロスロードにある。
この研究は、実世界への移動をできる限り少ない努力で行うことができるナビゲーションパイプラインをシミュレーションで作成することを目的としていた。
ナビゲーションパイプラインを設計するには、環境、ローカライゼーション、ナビゲーション、計画の4つの大きな課題が発生する。
論文 参考訳(メタデータ) (2020-11-20T08:37:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。