論文の概要: LLM Agent Framework for Intelligent Change Analysis in Urban Environment using Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2601.02757v1
- Date: Tue, 06 Jan 2026 06:49:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.834239
- Title: LLM Agent Framework for Intelligent Change Analysis in Urban Environment using Remote Sensing Imagery
- Title(参考訳): リモートセンシング画像を用いた都市環境における知的変化分析のためのLLMエージェントフレームワーク
- Authors: Zixuan Xiao, Jun Ma,
- Abstract要約: 本稿では,Large Language Models(LLM)を視覚基盤モデルと統合し,ChangeGPTを形成する汎用エージェントフレームワークを提案する。
このエージェントは、現実世界のシナリオによって分類された140の質問(例えば、サイズ、クラス、数)と複雑さを含む、キュレートされたデータセットで評価された。
ChangeGPT、特にGPT-4-turboバックエンドは優れた性能を示し、90.71%のマッチングレートを達成した。
- 参考スコア(独自算出の注目度): 3.585412183424656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing change detection methods often lack the versatility to handle diverse real-world queries and the intelligence for comprehensive analysis. This paper presents a general agent framework, integrating Large Language Models (LLM) with vision foundation models to form ChangeGPT. A hierarchical structure is employed to mitigate hallucination. The agent was evaluated on a curated dataset of 140 questions categorized by real-world scenarios, encompassing various question types (e.g., Size, Class, Number) and complexities. The evaluation assessed the agent's tool selection ability (Precision/Recall) and overall query accuracy (Match). ChangeGPT, especially with a GPT-4-turbo backend, demonstrated superior performance, achieving a 90.71 % Match rate. Its strength lies particularly in handling change-related queries requiring multi-step reasoning and robust tool selection. Practical effectiveness was further validated through a real-world urban change monitoring case study in Qianhai Bay, Shenzhen. By providing intelligence, adaptability, and multi-type change analysis, ChangeGPT offers a powerful solution for decision-making in remote sensing applications.
- Abstract(参考訳): 既存の変更検出方法は、様々な現実世界のクエリを扱うための汎用性や、包括的な分析のためのインテリジェンスに欠けることが多い。
本稿では,Large Language Models(LLM)を視覚基盤モデルと統合し,ChangeGPTを形成する汎用エージェントフレームワークを提案する。
幻覚を緩和するために階層構造を用いる。
このエージェントは、現実世界のシナリオによって分類された140の質問(例えば、サイズ、クラス、数)と複雑さを含む、キュレートされたデータセットで評価された。
評価では、エージェントのツール選択能力(Precision/Recall)と全体的なクエリ精度(Match)を評価した。
ChangeGPT、特にGPT-4-turboバックエンドは優れた性能を示し、90.71%のマッチングレートを達成した。
その強みは、特にマルチステップの推論と堅牢なツール選択を必要とする変更関連のクエリを扱うことである。
深センの清海湾における実世界の都市変動モニタリングケーススタディにより, 実効性をさらに検証した。
インテリジェンス、適応性、マルチタイプの変更分析を提供することで、ChangeGPTはリモートセンシングアプリケーションにおける意思決定に強力なソリューションを提供する。
関連論文リスト
- How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.114899897566964]
マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。
本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。
IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文 参考訳(メタデータ) (2025-08-28T15:57:33Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.65760006883248]
我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。
CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。
QAG-360Kと呼ばれる最初のCDQAGベンチマークデータセットを構築し、360K以上の質問、テキスト回答、およびそれに対応する高品質な視覚マスクを含む。
論文 参考訳(メタデータ) (2024-10-31T11:20:13Z) - Change-Agent: Towards Interactive Comprehensive Remote Sensing Change Interpretation and Analysis [28.3763053922823]
現在のRSICI技術は、変更検出と変更キャプションを包含しており、それぞれに包括的な解釈を提供する限界がある。
本稿では,ユーザ指示に従って包括的な変更解釈を実現するインタラクティブなChange-Agentを提案する。
Change-Agentは、マルチレベル変化解釈(MCI)モデルを目として、大きな言語モデル(LLM)を脳として統合する。
論文 参考訳(メタデータ) (2024-03-28T17:55:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。