論文の概要: MapAgent: A Hierarchical Agent for Geospatial Reasoning with Dynamic Map Tool Integration
- arxiv url: http://arxiv.org/abs/2509.05933v1
- Date: Sun, 07 Sep 2025 05:47:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.78656
- Title: MapAgent: A Hierarchical Agent for Geospatial Reasoning with Dynamic Map Tool Integration
- Title(参考訳): MapAgent: 動的マップツールの統合による地理空間推論のための階層的エージェント
- Authors: Md Hasebul Hasan, Mahir Labib Dihan, Mohammed Eunus Ali, Md Rizwan Parvez,
- Abstract要約: MapAgentは、地図統合地理空間推論のためのカスタマイズされたツールセットとエージェントスキャフォールドを備えた階層的なマルチエージェントプラグイン・アンド・プレイフレームワークである。
高レベルプランナーは複雑なクエリをサブゴールに分解し、特別なモジュールにルーティングする。
マップベースのサービスのようなツールの多いモジュールでは、関連するAPIを効率的にオーケストレーションする専用のMap-toolエージェントを設計します。
この階層設計は認知的負荷を低減し、ツールの選択精度を改善し、類似したAPI間の正確な調整を可能にする。
- 参考スコア(独自算出の注目度): 10.416062603733655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic AI has significantly extended the capabilities of large language models (LLMs) by enabling complex reasoning and tool use. However, most existing frameworks are tailored to domains such as mathematics, coding, or web automation, and fall short on geospatial tasks that require spatial reasoning, multi-hop planning, and real-time map interaction. To address these challenges, we introduce MapAgent, a hierarchical multi-agent plug-and-play framework with customized toolsets and agentic scaffolds for map-integrated geospatial reasoning. Unlike existing flat agent-based approaches that treat tools uniformly-often overwhelming the LLM when handling similar but subtly different geospatial APIs-MapAgent decouples planning from execution. A high-level planner decomposes complex queries into subgoals, which are routed to specialized modules. For tool-heavy modules-such as map-based services-we then design a dedicated map-tool agent that efficiently orchestrates related APIs adaptively in parallel to effectively fetch geospatial data relevant for the query, while simpler modules (e.g., solution generation or answer extraction) operate without additional agent overhead. This hierarchical design reduces cognitive load, improves tool selection accuracy, and enables precise coordination across similar APIs. We evaluate MapAgent on four diverse geospatial benchmarks-MapEval-Textual, MapEval-API, MapEval-Visual, and MapQA-and demonstrate substantial gains over state-of-the-art tool-augmented and agentic baselines. We open-source our framwork at https://github.com/Hasebul/MapAgent.
- Abstract(参考訳): Agentic AIは、複雑な推論とツールの使用を可能にすることで、大規模言語モデル(LLM)の機能を大幅に拡張した。
しかし、既存のフレームワークのほとんどは、数学、コーディング、ウェブオートメーションといった分野に特化しており、空間的推論、マルチホップ計画、リアルタイムマップの相互作用を必要とする地理空間的タスクに不足している。
これらの課題に対処するために、マップ統合地理空間推論のためのカスタマイズされたツールセットとエージェント足場を備えた階層的なマルチエージェント・プラグイン・アンド・プレイフレームワークであるMapAgentを紹介した。
ツールを均一に扱う既存のフラットエージェントベースのアプローチとは異なり、同様の、しかし微妙に異なる地理空間API-MapAgentでは、実行から計画が切り離されている。
高レベルプランナーは複雑なクエリをサブゴールに分解し、特別なモジュールにルーティングする。
マップベースのサービスのようなツールの多いモジュールでは、クエリに関連する地理空間データを効率的に取得するために、関連APIを効率的に並列にオーケストレーションする専用のMap-toolエージェントを設計します。
この階層設計は認知的負荷を低減し、ツールの選択精度を改善し、類似したAPI間の正確な調整を可能にする。
我々はMapAgentを、MapEval-Textual、MapEval-API、MapEval-Visual、MapQAの4つの多様な地理空間ベンチマークで評価し、最先端のツール拡張およびエージェントベースラインよりも大幅に向上したことを示す。
私たちはframworkをhttps://github.com/Hasebul/MapAgent.comでオープンソース化しました。
関連論文リスト
- AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [54.52092001110694]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたベンチマークである。
ThinkGeoは、ツール-インタラクションのパラダイムにインスパイアされたもので、さまざまな現実世界のアプリケーションにまたがる人間のクエリを含んでいる。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - MapQaTor: An Extensible Framework for Efficient Annotation of Map-Based QA Datasets [3.3856216159724983]
我々は、トレース可能なマップベースのQAデータセットの作成を合理化する、オープンソースのフレームワークであるMapQaTorを紹介した。
MapQaTorは任意のMap APIとのシームレスな統合を可能にし、ユーザはさまざまなソースからデータを収集して視覚化することができる。
論文 参考訳(メタデータ) (2024-12-30T15:33:19Z) - MGMapNet: Multi-Granularity Representation Learning for End-to-End Vectorized HD Map Construction [75.93907511203317]
多粒性表現を持つ地図要素をモデル化するためのMGMapNet(Multi-Granularity Map Network)を提案する。
提案したMGMapNetは最先端のパフォーマンスを達成し,MapTRv2 を nuScenes で 5.3 mAP,Argoverse2 で 4.4 mAP で上回った。
論文 参考訳(メタデータ) (2024-10-10T09:05:23Z) - Leveraging Enhanced Queries of Point Sets for Vectorized Map Construction [15.324464723174533]
本稿では,オンラインベクトル化マップ構築のためのクエリ機能の向上を重視したエンドツーエンド手法であるMapQRを紹介する。
MapQR はscatter-and-gather クエリと呼ばれる新しいクエリ設計を採用している。
提案したMapQRは,最高平均精度(mAP)を達成し,nuScenesとArgoverse 2.0の両方で良好な効率を維持する。
論文 参考訳(メタデータ) (2024-02-27T11:43:09Z) - MGeo: Multi-Modal Geographic Pre-Training Method [49.78466122982627]
マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-11T03:05:12Z) - GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文 参考訳(メタデータ) (2022-11-04T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。