論文の概要: GPSBench: Do Large Language Models Understand GPS Coordinates?
- arxiv url: http://arxiv.org/abs/2602.16105v1
- Date: Wed, 18 Feb 2026 00:33:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.476165
- Title: GPSBench: Do Large Language Models Understand GPS Coordinates?
- Title(参考訳): GPSBench: 大規模言語モデルはGPSのコーディネートを理解するか?
- Authors: Thinh Hung Truong, Jey Han Lau, Jianzhong Qi,
- Abstract要約: 大きな言語モデル(LLM)は、ナビゲーション、ロボット工学、マッピングといった物理的な世界と相互作用するアプリケーションにますます多くデプロイされている。
それにもかかわらず、LLMがGPS座標と現実世界の地理を推論する能力はいまだに未調査である。
我々は,LLMにおける地理空間的推論を評価するために,17タスクにわたる57,800個のサンプルのデータセットであるGPSBenchを紹介する。
- 参考スコア(独自算出の注目度): 31.228269455751363
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large Language Models (LLMs) are increasingly deployed in applications that interact with the physical world, such as navigation, robotics, or mapping, making robust geospatial reasoning a critical capability. Despite that, LLMs' ability to reason about GPS coordinates and real-world geography remains underexplored. We introduce GPSBench, a dataset of 57,800 samples across 17 tasks for evaluating geospatial reasoning in LLMs, spanning geometric coordinate operations (e.g., distance and bearing computation) and reasoning that integrates coordinates with world knowledge. Focusing on intrinsic model capabilities rather than tool use, we evaluate 14 state-of-the-art LLMs and find that GPS reasoning remains challenging, with substantial variation across tasks: models are generally more reliable at real-world geographic reasoning than at geometric computations. Geographic knowledge degrades hierarchically, with strong country-level performance but weak city-level localization, while robustness to coordinate noise suggests genuine coordinate understanding rather than memorization. We further show that GPS-coordinate augmentation can improve in downstream geospatial tasks, and that finetuning induces trade-offs between gains in geometric computation and degradation in world knowledge. Our dataset and reproducible code are available at https://github.com/joey234/gpsbench
- Abstract(参考訳): 大きな言語モデル(LLM)は、ナビゲーション、ロボット工学、マッピングといった物理世界と相互作用するアプリケーションにますます多くデプロイされており、地理空間的推論が重要な機能である。
それにもかかわらず、LLMがGPS座標と現実世界の地理を推論する能力はいまだに未調査である。
GPSBenchは17のタスクにまたがる57,800個のサンプルのデータセットで,LLMの地理空間的推論,幾何座標演算(例えば距離と軸受計算),および座標を世界知識と統合する推論を行う。
ツールの使用よりも本質的なモデル機能に注目し,14の最先端のLCMを評価し,GPS推論が課題であり,タスクによって大きく異なることを見出した。
地理的知識は階層的に低下し、国レベルのパフォーマンスは強いが、都市レベルのローカライゼーションは弱いが、騒音のコーディネート性は記憶よりも真のコーディネート理解を示唆している。
さらに,GPS座標の増大により下流の地理空間的タスクが向上し,微調整によって幾何計算の利得と世界知識の劣化のトレードオフが引き起こされることを示す。
私たちのデータセットと再現可能なコードはhttps://github.com/joey234/gpsbenchで利用可能です。
関連論文リスト
- TrustGeoGen: Formal-Verified Data Engine for Trustworthy Multi-modal Geometric Problem Solving [106.04001249574786]
TrustGeoGenは、標準的で信頼性の高いベンチマークを確立するために、正式に検証された幾何問題を生成するデータエンジンである。
1)ダイアグラム,テキスト,ステップバイステップのソリューションの生成を同期するマルチモーダルアライメント,2)すべての推論パスがルール準拠であることを保証する形式検証,3)接続思考,ブリッジング,ヒューマンライクな論理ステップとの論理的推論,4)複数のソリューションと自己回帰バックトラックを備えた多種多様な問題を生成できるTextitGeoExploreシリーズアルゴリズム。
論文 参考訳(メタデータ) (2025-04-22T10:45:23Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - A Multi-Modal Neural Geometric Solver with Textual Clauses Parsed from
Diagram [33.62866585222121]
マルチモーダル情報を効率的に融合する新しいニューラルソルバであるPGPSNetを提案する。
PGPSNetには幾何学定理と幾何学的表現の知識が豊富にある。
我々はPGPS9Kという,大規模かつ詳細なGPSデータセットを構築した。
論文 参考訳(メタデータ) (2023-02-22T02:38:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。