論文の概要: Understanding the Geospatial Reasoning Capabilities of LLMs: A Trajectory Recovery Perspective
- arxiv url: http://arxiv.org/abs/2510.01639v1
- Date: Thu, 02 Oct 2025 03:37:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.973811
- Title: Understanding the Geospatial Reasoning Capabilities of LLMs: A Trajectory Recovery Perspective
- Title(参考訳): LLMの地理空間推論能力の理解:軌道回復の観点から
- Authors: Thinh Hung Truong, Jey Han Lau, Jianzhong Qi,
- Abstract要約: 本稿では,Large Language Models (LLMs) が道路網地図を読み取ってナビゲーションを行うことができるかどうかを考察する。
トラジェクトリ・リカバリは,マスク付きGPSトレースを復元するモデルを必要とするプロキシ・タスクである。
我々のプロンプトフレームワークは,道路ネットワークをコンテキストとして使用することにより,外部ナビゲーションツールにアクセスすることなく,有効な経路を生成することができる。
- 参考スコア(独自算出の注目度): 31.228269455751363
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We explore the geospatial reasoning capabilities of Large Language Models (LLMs), specifically, whether LLMs can read road network maps and perform navigation. We frame trajectory recovery as a proxy task, which requires models to reconstruct masked GPS traces, and introduce GLOBALTRACE, a dataset with over 4,000 real-world trajectories across diverse regions and transportation modes. Using road network as context, our prompting framework enables LLMs to generate valid paths without accessing any external navigation tools. Experiments show that LLMs outperform off-the-shelf baselines and specialized trajectory recovery models, with strong zero-shot generalization. Fine-grained analysis shows that LLMs have strong comprehension of the road network and coordinate systems, but also pose systematic biases with respect to regions and transportation modes. Finally, we demonstrate how LLMs can enhance navigation experiences by reasoning over maps in flexible ways to incorporate user preferences.
- Abstract(参考訳): 本研究では,大規模言語モデル (LLM) の地理空間的推論能力について検討する。
マスクされたGPSトレースを再構築するモデルを必要とするプロキシタスクとしてトラジェクトリリカバリ(trajectory recovery)を設定し,多様な地域や交通手段にまたがる4000以上の現実世界のトラジェクトリを備えたデータセットであるGLOBALTRACEを導入する。
我々のプロンプトフレームワークは,道路ネットワークをコンテキストとして使用することにより,外部ナビゲーションツールにアクセスすることなく,有効な経路を生成することができる。
実験により、LLMはゼロショットの強い一般化により、既成のベースラインや特別な軌道回復モデルよりも優れていることが示された。
きめ細かい分析により、LLMは道路網や座標系を強く理解しているだけでなく、地域や交通手段に関して体系的な偏見も生んでいることが分かる。
最後に,LLMがユーザの好みを取り入れたフレキシブルな方法で地図を解析することで,ナビゲーションエクスペリエンスを向上させる方法を示す。
関連論文リスト
- Concise Geometric Description as a Bridge: Unleashing the Potential of LLM for Plane Geometry Problem Solving [50.05273675575345]
PlaneThought Problem Solving (PGPS) は幾何学図と問題テキスト記述に基づく平面幾何学的問題を解決することを目的としている。
大規模言語モデル(LLM)は強力な推論能力を有しており、PGPSへの直接的な応用は視覚図の処理能力の欠如によって妨げられている。
視覚図の幾何学的記述を生成するためにMLLMインタープリタを訓練し、既製のLCMを用いて推論を行う。
論文 参考訳(メタデータ) (2026-01-29T02:03:33Z) - RoadMind: Towards a Geospatial AI Expert for Disaster Response [6.038207189709353]
大規模言語モデル(LLM)は、様々な自然言語タスクで顕著なパフォーマンスを示しているが、地理空間データについて推論する能力には制限がある。
OpenStreetMap (OSM) の構造化データを用いて LLM の地理空間的推論能力を向上させる自己教師型フレームワークである RoadMind を提案する。
以上の結果から,先進的なプログレッシブ・エンジニアリングを備えた最先端のLLMを含む,強力なベースラインをはるかに上回るモデルが得られた。
論文 参考訳(メタデータ) (2025-09-18T09:46:55Z) - TrajSceneLLM: A Multimodal Perspective on Semantic GPS Trajectory Analysis [0.0]
我々は,GPSトラジェクトリのセマンティック理解を強化するためのマルチモーダル視点であるTrajSceneLLMを提案する。
本稿では,旅行選択を分析し,移動行動を理解する上で重要な課題である旅行モード識別(TMI)の枠組みを検証した。
このセマンティックエンハンスメントは、さまざまな下流のアプリケーションや、人工知能の将来の研究に有意義な可能性を約束する。
論文 参考訳(メタデータ) (2025-06-19T15:31:40Z) - Can LLMs Learn to Map the World from Local Descriptions? [50.490593949836146]
本研究では,Large Language Models (LLMs) がコヒーレントなグローバル空間認識を構築できるかどうかを検討する。
都市環境を模擬した実験により, LLMは実空間分布に一致した潜在表現を示すことを示した。
論文 参考訳(メタデータ) (2025-05-27T08:22:58Z) - Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文 参考訳(メタデータ) (2025-03-27T11:56:27Z) - Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning [69.5875073447454]
本稿では,大規模言語モデル(LLM)によって強化された動作エージェントを,動的・乱雑な環境における自律的なナビゲーションに向けて前進させる。
トレーニング不要なフレームワークは、マルチエージェント調整、クローズドループ計画、動的障害物回避を、リトレーニングや微調整なしでサポートしています。
論文 参考訳(メタデータ) (2025-03-10T13:39:09Z) - Universal Model Routing for Efficient LLM Inference [69.86195589350264]
モデルルーティングは,大規模言語モデル(LLM)の推論コストを削減する手法である
動的ルーティング問題に対する新しいアプローチであるUniRouteを提案する。
これらは理論的に最適なルーティングルールの推定であり、過大なリスクバウンドによってそれらのエラーを定量化する。
論文 参考訳(メタデータ) (2025-02-12T20:30:28Z) - Strada-LLM: Graph LLM for traffic prediction [62.2015839597764]
交通予測における大きな課題は、非常に異なる交通条件によって引き起こされる多様なデータ分散を扱うことである。
近位交通情報を考慮した交通予測のためのグラフ対応LLMを提案する。
我々は、新しいデータ分散に直面する際に、ドメイン適応を効率的にするための軽量なアプローチを採用する。
論文 参考訳(メタデータ) (2024-10-28T09:19:29Z) - Guide-LLM: An Embodied LLM Agent and Text-Based Topological Map for Robotic Guidance of People with Visual Impairments [1.18749525824656]
Guide-LLMは、大きな屋内環境をナビゲートする際の視覚障害者(PVI)を支援するために設計されたテキストベースのエージェントである。
我々のアプローチは,LLMがグローバルパスを計画できる新しいテキストベースのトポロジマップを特徴としている。
シミュレーション実験は、PVIを誘導するシステムの有効性を実証し、その可能性を補助技術の重要な進歩として示している。
論文 参考訳(メタデータ) (2024-10-28T01:58:21Z) - Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation [64.84996994779443]
本稿では,連続視覚言語ナビゲーション(VLN)タスクのためのAffordances-Oriented Plannerを提案する。
我々のAO-Plannerは、様々な基礎モデルを統合して、アベイランス指向の低レベルな動き計画とハイレベルな意思決定を実現する。
挑戦的なR2R-CEデータセットとRxR-CEデータセットの実験は、AO-Plannerが最先端のゼロショットのパフォーマンスを達成したことを示している。
論文 参考訳(メタデータ) (2024-07-08T12:52:46Z) - MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains [4.941781282578696]
Vision-and-Language Navigation (VLN)タスクでは、エージェントは自然言語の指示に従って目的地に向かう必要がある。
学習ベースのアプローチはタスクに対する主要な解決策だが、高いトレーニングコストと解釈可能性の欠如に悩まされている。
近年、Large Language Models (LLMs) は強力な一般化能力のため、VLNにとって有望なツールとして登場した。
論文 参考訳(メタデータ) (2024-05-17T08:33:27Z) - NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large
Language Models [17.495162643127003]
我々は,複雑なエンボディシーンにおけるGPTモデルの推論能力を明らかにするために,NavGPTを導入した。
NavGPTは、視覚的な観察、ナビゲーション履歴、将来の探索可能な方向のテキスト記述を入力として、エージェントの現在の状態を推論する。
本研究では,NavGPTが経路に沿った観察や行動から高品質なナビゲーション命令を生成可能であることを示す。
論文 参考訳(メタデータ) (2023-05-26T14:41:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。