論文の概要: GISclaw: An Open-Source LLM-Powered Agent System for Full-Stack Geospatial Analysis
- arxiv url: http://arxiv.org/abs/2603.26845v1
- Date: Fri, 27 Mar 2026 09:46:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.664032
- Title: GISclaw: An Open-Source LLM-Powered Agent System for Full-Stack Geospatial Analysis
- Title(参考訳): GISclaw:フルスタック地理空間解析のためのオープンソースのLLMエージェントシステム
- Authors: Jinzhen Han, JinByeong Lee, Yuri Shim, Jisung Kim, Jae-Joon Lee,
- Abstract要約: GISclawは、LLM推論コアと永続的なPythonサンドボックスを統合する、オープンソースのエージェントシステムである。
GISclawは、Single Agent ReActとDual Agent Plan-Replanパイプラインという、2つのプラグイン可能なエージェントアーキテクチャを実装している。
システムは50タスクGeoAnalystBenchベンチマークで最大96%のタスク成功を達成する。
- 参考スコア(独自算出の注目度): 1.1417805445492082
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The convergence of Large Language Models (LLMs) and Geographic Information Science has opened new avenues for automating complex geospatial analysis. However, existing LLM-powered GIS agents are constrained by limited data-type coverage (vector-only), reliance on proprietary GIS platforms, and single-model architectures that preclude systematic comparisons. We present GISclaw, an open-source agent system that integrates an LLM reasoning core with a persistent Python sandbox, a comprehensive suite of open-source GIS libraries (GeoPandas, rasterio, scipy, scikit-learn), and a web-based interactive interface for full-stack geospatial analysis spanning vector, raster, and tabular data. GISclaw implements two pluggable agent architectures -- a Single Agent ReAct loop and a Dual Agent Plan-Execute-Replan pipeline -- and supports six heterogeneous LLM backends ranging from cloud-hosted flagship models (GPT-5.4) to locally deployed 14B models on consumer GPUs. Through three key engineering innovations -- Schema Analysis bridging the task-data information gap, Domain Knowledge injection for domain-specific workflows, and an Error Memory mechanism for intelligent self-correction -- GISclaw achieves up to 96% task success on the 50-task GeoAnalystBench benchmark. Systematic evaluation across 600 model--architecture--task combinations reveals that the Dual Agent architecture consistently degrades strong models while providing marginal gains for weaker ones. We further propose a three-layer evaluation protocol incorporating code structure analysis, reasoning process assessment, and type-specific output verification for comprehensive GIS agent assessment. The system and all evaluation code are publicly available.
- Abstract(参考訳): 大規模言語モデル(LLM)と地理情報科学の融合により,複雑な地理空間解析を自動化する新たな道が開かれた。
しかし、既存のLCMベースのGISエージェントは、限られたデータ型カバレッジ(ベクターのみ)、プロプライエタリなGISプラットフォームへの依存、体系的な比較を妨げる単一モデルアーキテクチャによって制約されている。
GISclaw, LLM推論コアを永続Pythonサンドボックス, オープンソースのGISライブラリ(GeoPandas, rasterio, scipy, scikit-learn)の包括的スイート, ベクトル, ラスタ, 表層データにまたがるフルスタックな地理空間解析のためのWebベースのインタラクティブインターフェースとを統合した, オープンソースのエージェントシステムについて述べる。
GISclawは、Single Agent ReActループとDual Agent Plan-Execute-Replanパイプラインという2つのプラグイン可能なエージェントアーキテクチャを実装し、クラウドホストされたフラッグシップモデル(GPT-5.4)から、コンシューマGPU上にローカルにデプロイされた14Bモデルまで、6つの異種LSMバックエンドをサポートする。
タスクデータ情報ギャップを埋めるスキーマ分析、ドメイン固有のワークフローのためのドメイン知識注入、インテリジェントな自己補正のためのエラーメモリメカニズム -- GISclawは50タスクGeoAnalystBenchベンチマークで最大96%のタスク成功を達成した。
600モデル-アーキテクチャ-タスクの組み合わせによる体系的な評価により、デュアルエージェントアーキテクチャは、より弱いモデルに対して限界ゲインを提供しながら、一貫して強力なモデルを分解することが明らかになった。
さらに、コード構造解析、推論プロセスの評価、およびGISエージェントの総合評価のためのタイプ固有の出力検証を組み込んだ3層評価プロトコルを提案する。
システムと評価コードはすべて公開されている。
関連論文リスト
- LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.1690891731311]
従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。
このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。
明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2025-09-30T22:34:23Z) - GeoJSON Agents:A Multi-Agent LLM Architecture for Geospatial Analysis-Function Calling vs Code Generation [7.335354895959486]
この研究は、GeoJSONデータのためのLLMマルチエージェントフレームワークを初めて導入した。
アーキテクチャは3つのコンポーネントタスク解析、エージェントコラボレーション、結果統合で構成されている。
論文 参考訳(メタデータ) (2025-09-10T03:43:46Z) - GeoAnalystBench: A GeoAI benchmark for assessing large language models for spatial analysis workflow and code generation [32.22754624992446]
実世界の地理空間問題から派生したPythonベースのタスク50のベンチマークであるGeoAnalystBenchを紹介する。
このベンチマークを用いて、プロプライエタリモデルとオープンソースモデルの両方を評価します。
ChatGPT-4o-miniのようなプロプライエタリなモデルは95%の妥当性とより強力なコードアライメントを実現します。
論文 参考訳(メタデータ) (2025-09-07T00:51:57Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks [84.86699025256705]
本稿では,地理空間的タスクの視覚言語モデル(VLM)を評価するためのベンチマークであるGEOBench-VLMを提案する。
私たちのベンチマークでは、手動で検証された命令が1万以上あり、さまざまな視覚条件、オブジェクトタイプ、スケールにまたがっています。
地理空間固有の課題における性能を評価するために,いくつかの最先端のVLMを評価した。
論文 参考訳(メタデータ) (2024-11-28T18:59:56Z) - ShapefileGPT: A Multi-Agent Large Language Model Framework for Automated Shapefile Processing [8.594821438139187]
大規模言語モデル(LLM)を利用した革新的なフレームワークであるShapefileGPTを提案する。
ShapefileGPTはマルチエージェントアーキテクチャを使用し、プランナーエージェントがタスクの分解と監督を担当し、ワーカーエージェントがタスクを実行する。
評価のために,幾何演算や空間的クエリといったカテゴリのタスクを含む,権威教科書に基づくベンチマークデータセットを開発した。
論文 参考訳(メタデータ) (2024-10-16T08:48:27Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。