論文の概要: Understanding the Geospatial Reasoning Capabilities of LLMs: A Trajectory Recovery Perspective
- arxiv url: http://arxiv.org/abs/2510.01639v1
- Date: Thu, 02 Oct 2025 03:37:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.973811
- Title: Understanding the Geospatial Reasoning Capabilities of LLMs: A Trajectory Recovery Perspective
- Title(参考訳): LLMの地理空間推論能力の理解:軌道回復の観点から
- Authors: Thinh Hung Truong, Jey Han Lau, Jianzhong Qi,
- Abstract要約: 本稿では,Large Language Models (LLMs) が道路網地図を読み取ってナビゲーションを行うことができるかどうかを考察する。
トラジェクトリ・リカバリは,マスク付きGPSトレースを復元するモデルを必要とするプロキシ・タスクである。
我々のプロンプトフレームワークは,道路ネットワークをコンテキストとして使用することにより,外部ナビゲーションツールにアクセスすることなく,有効な経路を生成することができる。
- 参考スコア(独自算出の注目度): 31.228269455751363
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We explore the geospatial reasoning capabilities of Large Language Models (LLMs), specifically, whether LLMs can read road network maps and perform navigation. We frame trajectory recovery as a proxy task, which requires models to reconstruct masked GPS traces, and introduce GLOBALTRACE, a dataset with over 4,000 real-world trajectories across diverse regions and transportation modes. Using road network as context, our prompting framework enables LLMs to generate valid paths without accessing any external navigation tools. Experiments show that LLMs outperform off-the-shelf baselines and specialized trajectory recovery models, with strong zero-shot generalization. Fine-grained analysis shows that LLMs have strong comprehension of the road network and coordinate systems, but also pose systematic biases with respect to regions and transportation modes. Finally, we demonstrate how LLMs can enhance navigation experiences by reasoning over maps in flexible ways to incorporate user preferences.
- Abstract(参考訳): 本研究では,大規模言語モデル (LLM) の地理空間的推論能力について検討する。
マスクされたGPSトレースを再構築するモデルを必要とするプロキシタスクとしてトラジェクトリリカバリ(trajectory recovery)を設定し,多様な地域や交通手段にまたがる4000以上の現実世界のトラジェクトリを備えたデータセットであるGLOBALTRACEを導入する。
我々のプロンプトフレームワークは,道路ネットワークをコンテキストとして使用することにより,外部ナビゲーションツールにアクセスすることなく,有効な経路を生成することができる。
実験により、LLMはゼロショットの強い一般化により、既成のベースラインや特別な軌道回復モデルよりも優れていることが示された。
きめ細かい分析により、LLMは道路網や座標系を強く理解しているだけでなく、地域や交通手段に関して体系的な偏見も生んでいることが分かる。
最後に,LLMがユーザの好みを取り入れたフレキシブルな方法で地図を解析することで,ナビゲーションエクスペリエンスを向上させる方法を示す。
関連論文リスト
- RoadMind: Towards a Geospatial AI Expert for Disaster Response [6.038207189709353]
大規模言語モデル(LLM)は、様々な自然言語タスクで顕著なパフォーマンスを示しているが、地理空間データについて推論する能力には制限がある。
OpenStreetMap (OSM) の構造化データを用いて LLM の地理空間的推論能力を向上させる自己教師型フレームワークである RoadMind を提案する。
以上の結果から,先進的なプログレッシブ・エンジニアリングを備えた最先端のLLMを含む,強力なベースラインをはるかに上回るモデルが得られた。
論文 参考訳(メタデータ) (2025-09-18T09:46:55Z) - TrajSceneLLM: A Multimodal Perspective on Semantic GPS Trajectory Analysis [0.0]
我々は,GPSトラジェクトリのセマンティック理解を強化するためのマルチモーダル視点であるTrajSceneLLMを提案する。
本稿では,旅行選択を分析し,移動行動を理解する上で重要な課題である旅行モード識別(TMI)の枠組みを検証した。
このセマンティックエンハンスメントは、さまざまな下流のアプリケーションや、人工知能の将来の研究に有意義な可能性を約束する。
論文 参考訳(メタデータ) (2025-06-19T15:31:40Z) - Can LLMs Learn to Map the World from Local Descriptions? [50.490593949836146]
本研究では,Large Language Models (LLMs) がコヒーレントなグローバル空間認識を構築できるかどうかを検討する。
都市環境を模擬した実験により, LLMは実空間分布に一致した潜在表現を示すことを示した。
論文 参考訳(メタデータ) (2025-05-27T08:22:58Z) - Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文 参考訳(メタデータ) (2025-03-27T11:56:27Z) - Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning [69.5875073447454]
本稿では,大規模言語モデル(LLM)によって強化された動作エージェントを,動的・乱雑な環境における自律的なナビゲーションに向けて前進させる。
トレーニング不要なフレームワークは、マルチエージェント調整、クローズドループ計画、動的障害物回避を、リトレーニングや微調整なしでサポートしています。
論文 参考訳(メタデータ) (2025-03-10T13:39:09Z) - Universal Model Routing for Efficient LLM Inference [69.86195589350264]
モデルルーティングは,大規模言語モデル(LLM)の推論コストを削減する手法である
動的ルーティング問題に対する新しいアプローチであるUniRouteを提案する。
これらは理論的に最適なルーティングルールの推定であり、過大なリスクバウンドによってそれらのエラーを定量化する。
論文 参考訳(メタデータ) (2025-02-12T20:30:28Z) - Guide-LLM: An Embodied LLM Agent and Text-Based Topological Map for Robotic Guidance of People with Visual Impairments [1.18749525824656]
Guide-LLMは、大きな屋内環境をナビゲートする際の視覚障害者(PVI)を支援するために設計されたテキストベースのエージェントである。
我々のアプローチは,LLMがグローバルパスを計画できる新しいテキストベースのトポロジマップを特徴としている。
シミュレーション実験は、PVIを誘導するシステムの有効性を実証し、その可能性を補助技術の重要な進歩として示している。
論文 参考訳(メタデータ) (2024-10-28T01:58:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。