論文の概要: Spatial-Agent: Agentic Geo-spatial Reasoning with Scientific Core Concepts
- arxiv url: http://arxiv.org/abs/2601.16965v1
- Date: Fri, 23 Jan 2026 18:33:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.80235
- Title: Spatial-Agent: Agentic Geo-spatial Reasoning with Scientific Core Concepts
- Title(参考訳): 空間エージェント:科学コア概念を用いたエージェント的地理空間推論
- Authors: Riyang Bao, Cheng Yang, Dazhou Yu, Zhexiang Tang, Gengchen Mai, Liang Zhao,
- Abstract要約: 地理空間的推論は、都市分析、交通計画、災害対応といった現実世界の応用に不可欠である。
本稿では,空間情報科学の基礎理論に基づくAIエージェントであるSpatial-Agentを紹介する。
- 参考スコア(独自算出の注目度): 14.270067452643621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geospatial reasoning is essential for real-world applications such as urban analytics, transportation planning, and disaster response. However, existing LLM-based agents often fail at genuine geospatial computation, relying instead on web search or pattern matching while hallucinating spatial relationships. We present Spatial-Agent, an AI agent grounded in foundational theories of spatial information science. Our approach formalizes geo-analytical question answering as a concept transformation problem, where natural-language questions are parsed into executable workflows represented as GeoFlow Graphs -- directed acyclic graphs with nodes corresponding to spatial concepts and edges representing transformations. Drawing on spatial information theory, Spatial-Agent extracts spatial concepts, assigns functional roles with principled ordering constraints, and composes transformation sequences through template-based generation. Extensive experiments on MapEval-API and MapQA benchmarks demonstrate that Spatial-Agent significantly outperforms existing baselines including ReAct and Reflexion, while producing interpretable and executable geospatial workflows.
- Abstract(参考訳): 地理空間的推論は、都市分析、交通計画、災害対応といった現実世界の応用に不可欠である。
しかし、既存のLLMベースのエージェントは、実際の地理空間計算に失敗することが多く、その代わりに、空間関係を幻覚させながら、Web検索やパターンマッチングに依存する。
本稿では,空間情報科学の基礎理論に基づくAIエージェントであるSpatial-Agentを紹介する。
提案手法は,自然言語質問をGeoFlow Graphsとして表現された実行可能なワークフローに解析する概念変換問題として,空間概念に対応するノードと変換を表すエッジを備えた非巡回グラフを定式化する。
空間情報理論に基づいて空間的概念を抽出し、原理的順序制約で機能的役割を割り当て、テンプレートベースの生成を通じて変換シーケンスを構成する。
MapEval-APIとMapQAベンチマークの大規模な実験では、空間-エージェントはReActやReflexionといった既存のベースラインを著しく上回り、解釈可能で実行可能な地理空間ワークフローを生成する。
関連論文リスト
- GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization [53.080882980294795]
エージェント視覚推論に関する最近の研究は、深いマルチモーダル理解を可能にするが、主に画像操作ツールに焦点を当てている。
そこで本研究では,視覚的グラウンディングだけでなく,仮説の検証や修正のためにWeb検索も必要とするジオローカライゼーションタスクを再考する。
既存のジオローカライゼーションベンチマークは、高解像度画像の必要性と深部エージェント推論の局所化課題を満たすことができないため、GeoBenchをキュレートする。
推論ループ内にツールの実行をシームレスに統合するエージェントモデルであるGeoVistaを提案し,興味のある領域を拡大するイメージズームインツールと関連する領域を検索するWeb検索ツールを提案する。
論文 参考訳(メタデータ) (2025-11-19T18:59:22Z) - GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models [49.257706111340134]
進化的探索と地理空間的ドメイン知識を結合した多エージェントLLMフレームワークであるGeoEvolveを紹介する。
本研究では,空間的不確実性と空間的不確実性という2つの基本的・古典的課題について評価する。
空間誤差(RMSE)を13-21%削減し、不確実性推定性能を17%向上させる。
論文 参考訳(メタデータ) (2025-09-25T21:03:57Z) - GeoRef: Referring Expressions in Geometry via Task Formulation, Synthetic Supervision, and Reinforced MLLM-based Solutions [45.70578816057097]
本稿では,幾何学的問題に対するReferring Expression (REC) の課題を紹介する。
RECは、テキストのプロンプトに応じて図形の点、形、空間関係をローカライズできるかどうかを評価する。
構造化幾何形式言語を用いた大規模合成学習データセットを生成する。
論文 参考訳(メタデータ) (2025-09-25T12:00:52Z) - GeoSR: Cognitive-Agentic Framework for Probing Geospatial Knowledge Boundaries via Iterative Self-Refinement [4.026524042818433]
GeoSRは自己修正型のエージェント推論フレームワークで、コア地理的原則を反復予測ループに組み込む。
物理世界特性推定から社会経済予測に至るまでのタスクにおけるGeoSRの検証を行う。
論文 参考訳(メタデータ) (2025-08-06T04:45:34Z) - Foundation Models for Geospatial Reasoning: Assessing Capabilities of Large Language Models in Understanding Geometries and Topological Spatial Relations [4.302482081136594]
本研究では、空間的推論において、よく知られたテクスト(WKT)表現とその空間的関係が保持される範囲について検討する。
我々のワークフローは、比較のための空間的推論タスクを完成させるために、3つの異なるアプローチを採用している。
論文 参考訳(メタデータ) (2025-05-22T05:21:31Z) - Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Geospatial Reasoning Questions [5.053463027769152]
空間RAG(Spatial-RAG)は、地理空間質問応答用に設計された検索型生成フレームワークである。
構造化空間データベースと大きな言語モデル(LLM)をハイブリッド空間レトリバーを介して統合する。
応答過程を空間的および意味的関連性に対する多目的最適化として定式化する。
論文 参考訳(メタデータ) (2025-02-04T01:30:06Z) - Self-Supervised Representation Learning for Geospatial Objects: A Survey [21.504978593542354]
自己教師付き学習(SSL)は、広範囲にラベル付けされた監督なしでデータから直接効果的で一般化可能な表現を学習できる能力に注目が集まっている。
本稿では,3種類の幾何学的ベクトルタイプ(ポイント,ポリライン,ポリゴン)において,地理空間オブジェクトに対して特別に適用または開発されたSSL技術について調査する。
地空間オブジェクトに対するSSLの出現傾向,特に地空間基盤モデルへの段階的な進歩について検討する。
論文 参考訳(メタデータ) (2024-08-22T05:28:22Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。