論文の概要: EVGeoQA: Benchmarking LLMs on Dynamic, Multi-Objective Geo-Spatial Exploration
- arxiv url: http://arxiv.org/abs/2604.07070v1
- Date: Wed, 08 Apr 2026 13:20:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.550744
- Title: EVGeoQA: Benchmarking LLMs on Dynamic, Multi-Objective Geo-Spatial Exploration
- Title(参考訳): EVGeoQA: 動的多目的地球空間探査におけるLCMのベンチマーク
- Authors: Jianfei Wu, Zhichun Wang, Zhensheng Wang, Zhiyu He,
- Abstract要約: EVGeoQAは電気自動車(EV)充電シナリオに基づく新しいベンチマークである。
EVGeoQAの各クエリは、ユーザのリアルタイム座標に明示的に結び付けられ、充電の必要性の2つの目的と、同時に位置付けられたアクティビティの嗜好を統合する。
実験の結果,LLMはサブタスクに対処するためのツールをうまく利用しているが,長距離空間探索に苦慮していることがわかった。
- 参考スコア(独自算出の注目度): 3.059053384364342
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Large Language Models (LLMs) demonstrate remarkable reasoning capabilities, their potential for purpose-driven exploration in dynamic geo-spatial environments remains under-investigated. Existing Geo-Spatial Question Answering (GSQA) benchmarks predominantly focus on static retrieval, failing to capture the complexity of real-world planning that involves dynamic user locations and compound constraints. To bridge this gap, we introduce EVGeoQA, a novel benchmark built upon Electric Vehicle (EV) charging scenarios that features a distinct location-anchored and dual-objective design. Specifically, each query in EVGeoQA is explicitly bound to a user's real-time coordinate and integrates the dual objectives of a charging necessity and a co-located activity preference. To systematically assess models in such complex settings, we further propose GeoRover, a general evaluation framework based on a tool-augmented agent architecture to evaluate the LLMs' capacity for dynamic, multi-objective exploration. Our experiments reveal that while LLMs successfully utilize tools to address sub-tasks, they struggle with long-range spatial exploration. Notably, we observe an emergent capability: LLMs can summarize historical exploration trajectories to enhance exploration efficiency. These findings establish EVGeoQA as a challenging testbed for future geo-spatial intelligence. The dataset and prompts are available at https://github.com/Hapluckyy/EVGeoQA/.
- Abstract(参考訳): 大規模言語モデル(LLM)は、顕著な推論能力を示しているが、動的地理空間環境における目的駆動的な探索の可能性は、まだ解明されていない。
既存のGSQA(Geo-Spatial Question Answering)ベンチマークは主に静的検索に重点を置いており、動的なユーザ位置と複雑な制約を含む現実的な計画の複雑さを捉えていない。
このギャップを埋めるために、EVGeoQAという電気自動車(EV)の充電シナリオをベースに構築された新しいベンチマークを紹介します。
具体的には、EVGeoQAの各クエリは、ユーザのリアルタイム座標に明示的に結びついており、充電の必要性の2つの目的と、同時に位置付けられたアクティビティの嗜好を統合する。
このような複雑な環境でモデルを体系的に評価するために,ツール拡張エージェントアーキテクチャに基づく汎用評価フレームワークGeoRoverを提案する。
実験の結果,LLMはサブタスクに対処するためのツールをうまく利用しているが,長距離空間探索に苦慮していることがわかった。
LLMは、探査効率を高めるために、歴史的探査軌道を要約することができる。
これらの結果は、EVGeoQAを将来の地理空間知能のための挑戦的なテストベッドとして確立する。
データセットとプロンプトはhttps://github.com/Hapluckyy/EVGeoQA/で入手できる。
関連論文リスト
- Learning to Wander: Improving the Global Image Geolocation Ability of LMMs via Actionable Reasoning [72.13218601075958]
textbfWanderBenchは,具体的シナリオにおける行動可能な位置情報推論のための,最初のオープンアクセスグローバルジオロケーションベンチマークである。
我々は,下線Action of UnderlineThoughを用いた下線Geolocationフレームワークである textbfGeoAoT (Action of Thought) を提案する。
19個の大規模マルチモーダルモデルによる実験により、GeoAoTは動的環境におけるより優れた微細な局所化とより強力な一般化を実現することが示された。
論文 参考訳(メタデータ) (2026-03-11T06:24:10Z) - GeoX-Bench: Benchmarking Cross-View Geo-Localization and Pose Estimation Capabilities of Large Multimodal Models [78.98542840563907]
GeoX-BenchはLMMの機能を調べ評価するために設計された総合的なアンダーラインベンチマークである。
49カ国の128都市にまたがる10,859枚のパノラマ・サテライトイメージペアと、対応する755,976個の質問回答(QA)ペアを含んでいる。
GeoX-Benchに基づいて,25の最先端LMMがクロスビューなジオローカライゼーションおよびポーズ推定タスクに与える影響を評価する。
論文 参考訳(メタデータ) (2025-11-17T11:19:07Z) - GeoExplorer: Active Geo-localization with Curiosity-Driven Exploration [24.01750902074338]
アクティブジオローカライゼーション(Active Geo-localization, AGL)は、事前に定義された検索領域内のゴールをローカライズするタスクである。
現在の手法は距離に基づく報酬を伴う目標獲得強化学習問題としてAGLにアプローチしている。
固有報酬による好奇心駆動探索を取り入れたAGLエージェントGeoExplorerを提案する。
論文 参考訳(メタデータ) (2025-07-31T20:23:25Z) - OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Geospatial Reasoning Questions [5.053463027769152]
空間RAG(Spatial-RAG)は、地理空間質問応答用に設計された検索型生成フレームワークである。
構造化空間データベースと大きな言語モデル(LLM)をハイブリッド空間レトリバーを介して統合する。
応答過程を空間的および意味的関連性に対する多目的最適化として定式化する。
論文 参考訳(メタデータ) (2025-02-04T01:30:06Z) - GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks [84.86699025256705]
本稿では,地理空間的タスクの視覚言語モデル(VLM)を評価するためのベンチマークであるGEOBench-VLMを提案する。
私たちのベンチマークでは、手動で検証された命令が1万以上あり、さまざまな視覚条件、オブジェクトタイプ、スケールにまたがっています。
地理空間固有の課題における性能を評価するために,いくつかの最先端のVLMを評価した。
論文 参考訳(メタデータ) (2024-11-28T18:59:56Z) - An LLM Agent for Automatic Geospatial Data Analysis [5.842462214442362]
大規模言語モデル(LLM)は、データサイエンスコード生成タスクで使われている。
複雑なデータ構造と空間的制約を組み込むのが困難であるため,空間空間データ処理への応用は困難である。
ジオアジェント(GeoAgent)は,LLMが地理空間データ処理をより効率的に処理できるように設計された対話型フレームワークである。
論文 参考訳(メタデータ) (2024-10-24T14:47:25Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。