論文の概要: The User-Centric Geo-Experience: An LLM-Powered Framework for Enhanced Planning, Navigation, and Dynamic Adaptation
- arxiv url: http://arxiv.org/abs/2507.06993v1
- Date: Wed, 09 Jul 2025 16:18:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.66779
- Title: The User-Centric Geo-Experience: An LLM-Powered Framework for Enhanced Planning, Navigation, and Dynamic Adaptation
- Title(参考訳): ユーザ中心のジオエクスペリエンス: 計画,ナビゲーション,動的適応の強化を目的としたLLMフレームワーク
- Authors: Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, Dragomir Yankov, Chiqun Zhang,
- Abstract要約: 従来の旅行計画システムはしばしば静的で断片化されており、現実の複雑さを扱うには不適当である。
本稿では,既存サービスプロバイダ間でのユーザエクスペリエンスのフラストレーションの原因となる3つのギャップを明らかにする。
複雑なマルチモーダルなユーザクエリの解決を支援するためにグリッドベースの空間接地とマップ分析を利用する旅行計画エージェントと、各旅行の最終ナビゲーション脚のきめ細かいガイダンスを提供する目的地支援エージェントと、画像埋め込みと検索拡張生成(RAG)を活用して旅行計画の中断を検出し、応答する地域発見エージェントの3つの協力エージェントを提案する。
- 参考スコア(独自算出の注目度): 41.25886302818883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional travel-planning systems are often static and fragmented, leaving them ill-equipped to handle real-world complexities such as evolving environmental conditions and unexpected itinerary disruptions. In this paper, we identify three gaps between existing service providers causing frustrating user experience: intelligent trip planning, precision "last-100-meter" navigation, and dynamic itinerary adaptation. We propose three cooperative agents: a Travel Planning Agent that employs grid-based spatial grounding and map analysis to help resolve complex multi-modal user queries; a Destination Assistant Agent that provides fine-grained guidance for the final navigation leg of each journey; and a Local Discovery Agent that leverages image embeddings and Retrieval-Augmented Generation (RAG) to detect and respond to trip plan disruptions. With evaluations and experiments, our system demonstrates substantial improvements in query interpretation, navigation accuracy, and disruption resilience, underscoring its promise for applications from urban exploration to emergency response.
- Abstract(参考訳): 従来の旅行計画システムはしばしば静的で断片化されており、環境条件の進化や予期せぬ反復的破壊といった現実の複雑さを扱うには不適当である。
本稿では,知的旅行計画,「ラスト100メートル」ナビゲーション,動的反復適応という,既存サービスプロバイダのユーザエクスペリエンスにフラストレーションをもたらす3つのギャップを識別する。
複雑なマルチモーダルなユーザクエリの解決を支援するためにグリッドベースの空間接地とマップ分析を利用する旅行計画エージェントと、各旅行の最終ナビゲーション脚のきめ細かいガイダンスを提供する目的地支援エージェントと、画像埋め込みと検索拡張生成(RAG)を活用して旅行計画の中断を検出し、応答する地域発見エージェントの3つの協力エージェントを提案する。
評価と実験により, 都市探査から緊急対応に至るまで, クエリ解釈, ナビゲーション精度, ディスラプション耐性の大幅な改善が示された。
関連論文リスト
- TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning [39.934634038758404]
本稿では,検索用時間RAG対応旅行計画の最初のベンチマークであるTP-RAGを紹介する。
我々のデータセットには、2,348の現実世界の旅行クエリ、85,575の微粒なPOI、18,784の注釈付きPOIが含まれている。
論文 参考訳(メタデータ) (2025-04-11T17:02:40Z) - TravelAgent: An AI Assistant for Personalized Travel Planning [36.046107116324826]
大規模言語モデル(LLM)を利用した旅行計画システムであるTravelAgentを紹介する。
TravelAgentはツール使用、推奨、計画、メモリモジュールの4つのモジュールで構成されている。
我々は,TravelAgentの性能を人間とシミュレーションユーザで評価し,その全体的な効果を3つの基準で示し,パーソナライズされたレコメンデーションの精度を確認した。
論文 参考訳(メタデータ) (2024-09-12T14:24:45Z) - Perceive, Reflect, and Plan: Designing LLM Agent for Goal-Directed City Navigation without Instructions [19.03156236107806]
本稿では,その知覚,反映,計画能力に特徴付けられる新しいエージェントワークフローを提案する。
LLaVA-7Bは都市のナビゲーションに十分な精度でランドマークの方向と距離を把握できるように微調整できる。
論文 参考訳(メタデータ) (2024-08-08T02:28:43Z) - MapGPT: Map-Guided Prompting with Adaptive Path Planning for Vision-and-Language Navigation [73.81268591484198]
GPTを装備した身体的エージェントは、様々なタスクにまたがる異常な意思決定と一般化能力を示した。
本稿では,グローバルな探索を促進するオンライン言語地図を提供するMapGPTという,地図誘導型GPTエージェントについて紹介する。
本設計の利点を生かして,地図に基づく多段階経路計画を行うエージェントを支援する適応型計画手法を提案する。
論文 参考訳(メタデータ) (2024-01-14T15:34:48Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints [94.60414567852536]
長距離航法には、計画と局所的な移動可能性の推論の両方が必要である。
学習と計画を統合する学習に基づくアプローチを提案する。
ViKiNGは、画像ベースの学習コントローラを利用できる。
論文 参考訳(メタデータ) (2022-02-23T02:14:23Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。