論文の概要: GPSBench: Do Large Language Models Understand GPS Coordinates?
- arxiv url: http://arxiv.org/abs/2602.16105v1
- Date: Wed, 18 Feb 2026 00:33:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.476165
- Title: GPSBench: Do Large Language Models Understand GPS Coordinates?
- Title(参考訳): GPSBench: 大規模言語モデルはGPSのコーディネートを理解するか?
- Authors: Thinh Hung Truong, Jey Han Lau, Jianzhong Qi,
- Abstract要約: 大きな言語モデル(LLM)は、ナビゲーション、ロボット工学、マッピングといった物理的な世界と相互作用するアプリケーションにますます多くデプロイされている。
それにもかかわらず、LLMがGPS座標と現実世界の地理を推論する能力はいまだに未調査である。
我々は,LLMにおける地理空間的推論を評価するために,17タスクにわたる57,800個のサンプルのデータセットであるGPSBenchを紹介する。
- 参考スコア(独自算出の注目度): 31.228269455751363
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large Language Models (LLMs) are increasingly deployed in applications that interact with the physical world, such as navigation, robotics, or mapping, making robust geospatial reasoning a critical capability. Despite that, LLMs' ability to reason about GPS coordinates and real-world geography remains underexplored. We introduce GPSBench, a dataset of 57,800 samples across 17 tasks for evaluating geospatial reasoning in LLMs, spanning geometric coordinate operations (e.g., distance and bearing computation) and reasoning that integrates coordinates with world knowledge. Focusing on intrinsic model capabilities rather than tool use, we evaluate 14 state-of-the-art LLMs and find that GPS reasoning remains challenging, with substantial variation across tasks: models are generally more reliable at real-world geographic reasoning than at geometric computations. Geographic knowledge degrades hierarchically, with strong country-level performance but weak city-level localization, while robustness to coordinate noise suggests genuine coordinate understanding rather than memorization. We further show that GPS-coordinate augmentation can improve in downstream geospatial tasks, and that finetuning induces trade-offs between gains in geometric computation and degradation in world knowledge. Our dataset and reproducible code are available at https://github.com/joey234/gpsbench
- Abstract(参考訳): 大きな言語モデル(LLM)は、ナビゲーション、ロボット工学、マッピングといった物理世界と相互作用するアプリケーションにますます多くデプロイされており、地理空間的推論が重要な機能である。
それにもかかわらず、LLMがGPS座標と現実世界の地理を推論する能力はいまだに未調査である。
GPSBenchは17のタスクにまたがる57,800個のサンプルのデータセットで,LLMの地理空間的推論,幾何座標演算(例えば距離と軸受計算),および座標を世界知識と統合する推論を行う。
ツールの使用よりも本質的なモデル機能に注目し,14の最先端のLCMを評価し,GPS推論が課題であり,タスクによって大きく異なることを見出した。
地理的知識は階層的に低下し、国レベルのパフォーマンスは強いが、都市レベルのローカライゼーションは弱いが、騒音のコーディネート性は記憶よりも真のコーディネート理解を示唆している。
さらに,GPS座標の増大により下流の地理空間的タスクが向上し,微調整によって幾何計算の利得と世界知識の劣化のトレードオフが引き起こされることを示す。
私たちのデータセットと再現可能なコードはhttps://github.com/joey234/gpsbenchで利用可能です。
関連論文リスト
- Performance and Generalizability Impacts of Incorporating Location Encoders into Deep Learning for Dynamic PM2.5 Estimation [0.39762912548964846]
動的・空間的不均一な応用のための深層学習における位置情報の効果について検討する。
日表面PM2.5を衛星観測と地上観測により推定した。
以上の結果から,空間一般化の支援により,原座標は領域内の性能を向上させることができるが,領域間の一般化性は低下することが示された。
論文 参考訳(メタデータ) (2025-05-24T02:00:34Z) - TrustGeoGen: Formal-Verified Data Engine for Trustworthy Multi-modal Geometric Problem Solving [106.04001249574786]
TrustGeoGenは、標準的で信頼性の高いベンチマークを確立するために、正式に検証された幾何問題を生成するデータエンジンである。
1)ダイアグラム,テキスト,ステップバイステップのソリューションの生成を同期するマルチモーダルアライメント,2)すべての推論パスがルール準拠であることを保証する形式検証,3)接続思考,ブリッジング,ヒューマンライクな論理ステップとの論理的推論,4)複数のソリューションと自己回帰バックトラックを備えた多種多様な問題を生成できるTextitGeoExploreシリーズアルゴリズム。
論文 参考訳(メタデータ) (2025-04-22T10:45:23Z) - OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - A Multi-Modal Neural Geometric Solver with Textual Clauses Parsed from
Diagram [33.62866585222121]
マルチモーダル情報を効率的に融合する新しいニューラルソルバであるPGPSNetを提案する。
PGPSNetには幾何学定理と幾何学的表現の知識が豊富にある。
我々はPGPS9Kという,大規模かつ詳細なGPSデータセットを構築した。
論文 参考訳(メタデータ) (2023-02-22T02:38:25Z) - A Gis Aided Approach for Geolocalizing an Unmanned Aerial System Using
Deep Learning [0.4297070083645048]
本稿では,GPS信号の劣化や拒否時にUASをジオローカライズする手法を提案する。
UASは、プラットフォームが飛ぶとリアルタイム画像を取得することができる、下向きのカメラをプラットフォーム上に備えているので、ジオローカライゼーションを実現するために、最新のディープラーニング技術を適用します。
我々は,OpenStreetMap (OSM) からGIS情報を抽出し,意味的に一致した特徴をビルディングクラスとランドスケープクラスに分割する。
論文 参考訳(メタデータ) (2022-08-25T17:51:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。