論文の概要: Grid2Guide: A* Enabled Small Language Model for Indoor Navigation
- arxiv url: http://arxiv.org/abs/2508.08100v1
- Date: Mon, 11 Aug 2025 15:39:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.180613
- Title: Grid2Guide: A* Enabled Small Language Model for Indoor Navigation
- Title(参考訳): Grid2Guide: A*による屋内ナビゲーションのための小さな言語モデル
- Authors: Md. Wasiul Haque, Sagar Dasgupta, Mizanur Rahman,
- Abstract要約: 本研究では,A*探索アルゴリズムとSmall Language Model(SLM)を組み合わせるハイブリッドナビゲーションフレームワークを提案する。
提案手法を,リアルタイム屋内ナビゲーション支援のための軽量かつインフラストラクチャフリーなソリューションとして検証した。
- 参考スコア(独自算出の注目度): 5.004013511392863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable indoor navigation remains a significant challenge in complex environments, particularly where external positioning signals and dedicated infrastructures are unavailable. This research presents Grid2Guide, a hybrid navigation framework that combines the A* search algorithm with a Small Language Model (SLM) to generate clear, human-readable route instructions. The framework first conducts a binary occupancy matrix from a given indoor map. Using this matrix, the A* algorithm computes the optimal path between origin and destination, producing concise textual navigation steps. These steps are then transformed into natural language instructions by the SLM, enhancing interpretability for end users. Experimental evaluations across various indoor scenarios demonstrate the method's effectiveness in producing accurate and timely navigation guidance. The results validate the proposed approach as a lightweight, infrastructure-free solution for real-time indoor navigation support.
- Abstract(参考訳): 信頼性の高い屋内航法は複雑な環境において重要な課題であり、特に外部測位信号や専用のインフラは利用できない。
そこで本研究では,A*探索アルゴリズムとSmall Language Model(SLM)を組み合わせたハイブリッドナビゲーションフレームワークGrid2Guideを提案する。
フレームワークはまず、所定の屋内マップからバイナリ占有行列を実行する。
この行列を用いて、A*アルゴリズムは出発点と目的地の間の最適な経路を計算し、簡潔なテキストナビゲーションステップを生成する。
これらのステップはSLMによって自然言語命令に変換され、エンドユーザの解釈可能性を高める。
様々な屋内シナリオに対する実験的な評価は、正確かつタイムリーなナビゲーションガイダンスを作成する方法の有効性を示す。
提案手法を,リアルタイム屋内ナビゲーション支援のための軽量かつインフラストラクチャフリーなソリューションとして検証した。
関連論文リスト
- NavComposer: Composing Language Instructions for Navigation Trajectories through Action-Scene-Object Modularization [17.525269369227786]
高品質なナビゲーション命令を自動生成するフレームワークであるNavComposerを提案する。
NavComposerは、アクション、シーン、オブジェクトなどのセマンティックエンティティを明示的に分解し、それらを自然言語命令に再分解する。
データに依存しない方法で動作し、ドメイン固有のトレーニングなしで多様なナビゲーショントラジェクトリへの適応をサポートする。
NavInstrCriticは、専門家のアノテーションに大きく依存する従来のメトリクスの制限に対処する、命令品質の全体的な評価を提供する。
論文 参考訳(メタデータ) (2025-07-15T01:20:22Z) - LLM-Guided Indoor Navigation with Multimodal Map Understanding [1.5325823985727567]
屋内地図画像からコンテキスト対応ナビゲーションインストラクションを生成するための大規模言語モデル(LLM)、すなわちChatGPTの可能性を探る。
以上の結果から,パーソナライズされた屋内ナビゲーションを支援するLLMが,平均86.59%,最大97.14%の正答率を持つ可能性が示唆された。
これらの結果は、AI駆動ナビゲーションと補助技術に重要な意味を持つ。
論文 参考訳(メタデータ) (2025-03-12T09:32:43Z) - Navigation-GPT: A Robust and Adaptive Framework Utilizing Large Language Models for Navigation Applications [6.990141986853289]
既存のナビゲーション決定支援システムは、未定義のシナリオを扱う場合、しばしば性能が良くない。
この問題に対処するためのLLMアプリケーションのためのデュアルコアフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-23T01:41:58Z) - NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning Disentangled Reasoning [97.88246428240872]
Embodied AIの重要な研究課題であるVision-and-Language Navigation (VLN)は、自然言語の指示に従って複雑な3D環境をナビゲートするために、エンボディエージェントを必要とする。
近年の研究では、ナビゲーションの推論精度と解釈可能性を改善することにより、VLNにおける大きな言語モデル(LLM)の有望な能力を強調している。
本稿では,自己誘導型ナビゲーション決定を実現するために,パラメータ効率の高いドメイン内トレーニングを実現する,Navigational Chain-of-Thought (NavCoT) という新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T07:27:02Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Find a Way Forward: a Language-Guided Semantic Map Navigator [53.69229615952205]
本稿では,新たな視点で言語誘導ナビゲーションの問題に対処する。
ロボットが自然言語の指示を実行し、地図観測に基づいて目標位置へ移動できるようにする。
提案手法は特に長距離ナビゲーションの場合において顕著な性能向上をもたらす。
論文 参考訳(メタデータ) (2022-03-07T07:40:33Z) - Unsupervised Domain Adaptation for Visual Navigation [115.85181329193092]
視覚ナビゲーションのための教師なし領域適応手法を提案する。
本手法では,対象領域の画像をソース領域に変換し,ナビゲーションポリシで学習した表現と一致するようにする。
論文 参考訳(メタデータ) (2020-10-27T18:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。