論文の概要: LLM Agent Framework for Intelligent Change Analysis in Urban Environment using Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2601.02757v1
- Date: Tue, 06 Jan 2026 06:49:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.834239
- Title: LLM Agent Framework for Intelligent Change Analysis in Urban Environment using Remote Sensing Imagery
- Title(参考訳): リモートセンシング画像を用いた都市環境における知的変化分析のためのLLMエージェントフレームワーク
- Authors: Zixuan Xiao, Jun Ma,
- Abstract要約: 本稿では,Large Language Models(LLM)を視覚基盤モデルと統合し,ChangeGPTを形成する汎用エージェントフレームワークを提案する。
このエージェントは、現実世界のシナリオによって分類された140の質問(例えば、サイズ、クラス、数)と複雑さを含む、キュレートされたデータセットで評価された。
ChangeGPT、特にGPT-4-turboバックエンドは優れた性能を示し、90.71%のマッチングレートを達成した。
- 参考スコア(独自算出の注目度): 3.585412183424656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing change detection methods often lack the versatility to handle diverse real-world queries and the intelligence for comprehensive analysis. This paper presents a general agent framework, integrating Large Language Models (LLM) with vision foundation models to form ChangeGPT. A hierarchical structure is employed to mitigate hallucination. The agent was evaluated on a curated dataset of 140 questions categorized by real-world scenarios, encompassing various question types (e.g., Size, Class, Number) and complexities. The evaluation assessed the agent's tool selection ability (Precision/Recall) and overall query accuracy (Match). ChangeGPT, especially with a GPT-4-turbo backend, demonstrated superior performance, achieving a 90.71 % Match rate. Its strength lies particularly in handling change-related queries requiring multi-step reasoning and robust tool selection. Practical effectiveness was further validated through a real-world urban change monitoring case study in Qianhai Bay, Shenzhen. By providing intelligence, adaptability, and multi-type change analysis, ChangeGPT offers a powerful solution for decision-making in remote sensing applications.
- Abstract(参考訳): 既存の変更検出方法は、様々な現実世界のクエリを扱うための汎用性や、包括的な分析のためのインテリジェンスに欠けることが多い。
本稿では,Large Language Models(LLM)を視覚基盤モデルと統合し,ChangeGPTを形成する汎用エージェントフレームワークを提案する。
幻覚を緩和するために階層構造を用いる。
このエージェントは、現実世界のシナリオによって分類された140の質問(例えば、サイズ、クラス、数)と複雑さを含む、キュレートされたデータセットで評価された。
評価では、エージェントのツール選択能力(Precision/Recall)と全体的なクエリ精度(Match)を評価した。
ChangeGPT、特にGPT-4-turboバックエンドは優れた性能を示し、90.71%のマッチングレートを達成した。
その強みは、特にマルチステップの推論と堅牢なツール選択を必要とする変更関連のクエリを扱うことである。
深センの清海湾における実世界の都市変動モニタリングケーススタディにより, 実効性をさらに検証した。
インテリジェンス、適応性、マルチタイプの変更分析を提供することで、ChangeGPTはリモートセンシングアプリケーションにおける意思決定に強力なソリューションを提供する。
関連論文リスト
- GISA: A Benchmark for General Information-Seeking Assistant [102.30831921333755]
GISAは汎用情報検索アシスタントのベンチマークであり、373の人為的なクエリで構成されている。
深い推論と広範囲な情報集約を統合タスクに統合し、暗記に抵抗するために定期的に更新された回答を含むライブサブセットを含む。
主要なLCMと商用検索製品の実験では、最高のパフォーマンスモデルでさえ19.30%の正確なマッチスコアしか達成していないことが示されている。
論文 参考訳(メタデータ) (2026-02-09T11:44:15Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.114899897566964]
マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。
本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。
IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文 参考訳(メタデータ) (2025-08-28T15:57:33Z) - Retrieval-Augmented Generation Systems for Intellectual Property via Synthetic Multi-Angle Fine-tuning [2.4368308736427697]
知的財産権(IP)分野の検索システムは、しばしば多様なユーザクエリに苦しむ。
マルチアングル質問生成と検索ファインチューニング法(MQG-RFM)を提案する。
MQG-RFMは、高速なクエリ生成と強い負のマイニングを組み合わせることで、コストのかかるインフラ変更を伴わずに、検索の堅牢性を高める。
論文 参考訳(メタデータ) (2025-05-31T12:19:35Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - DSGBench: A Diverse Strategic Game Benchmark for Evaluating LLM-based Agents in Complex Decision-Making Environments [6.451418207865797]
大規模言語モデル(LLM)ベースのエージェントは、複雑で動的なタスクの解決において、ますます人気が高まっている。
既存のベンチマークは通常、単一目的のタスクにフォーカスするか、非常に広い評価基準を使用する。
戦略的意思決定のための厳格な評価プラットフォームであるDSGBenchを紹介します。
論文 参考訳(メタデータ) (2025-03-08T04:17:23Z) - Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.65760006883248]
我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。
CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。
QAG-360Kと呼ばれる最初のCDQAGベンチマークデータセットを構築し、360K以上の質問、テキスト回答、およびそれに対応する高品質な視覚マスクを含む。
論文 参考訳(メタデータ) (2024-10-31T11:20:13Z) - Linguistic Fuzzy Information Evolution with Random Leader Election Mechanism for Decision-Making Systems [58.67035332062508]
言語ファジィ情報進化はエージェント間の情報交換を理解する上で重要である。
エージェントの重みの違いは、古典的なDeGrootモデルにおいて異なる収束結果をもたらす可能性がある。
本稿では,言語ファジィ情報力学の新しい3つのモデルを提案する。
論文 参考訳(メタデータ) (2024-10-19T18:15:24Z) - Change-Agent: Towards Interactive Comprehensive Remote Sensing Change Interpretation and Analysis [28.3763053922823]
現在のRSICI技術は、変更検出と変更キャプションを包含しており、それぞれに包括的な解釈を提供する限界がある。
本稿では,ユーザ指示に従って包括的な変更解釈を実現するインタラクティブなChange-Agentを提案する。
Change-Agentは、マルチレベル変化解釈(MCI)モデルを目として、大きな言語モデル(LLM)を脳として統合する。
論文 参考訳(メタデータ) (2024-03-28T17:55:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。