論文の概要: GeoDisaster: Benchmarking Orchestrated Agents for Operational Disaster Geo-Intelligence
- arxiv url: http://arxiv.org/abs/2606.17246v1
- Date: Mon, 15 Jun 2026 19:46:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.12139
- Title: GeoDisaster: Benchmarking Orchestrated Agents for Operational Disaster Geo-Intelligence
- Title(参考訳): GeoDisaster: 運用上の災害ジオインテリジェンスのためのオーケストレーションエージェントのベンチマーク
- Authors: Maram Hasan, Aman Verma, Savitra Roy, Hariseetharam Gunduboina, Daksh Jain, Muhammad Haris Khan, Subhasis Chaudhuri, Biplab Banerjee,
- Abstract要約: 43の質問タイプにわたる2,921の検証インスタンスを備えた,運用時地理空間災害推論ベンチマークであるGeoDisasterを紹介した。
地空間的および決定論的整合性チェックでは, 地表面の解答が基礎となる。
本稿では,18の災害対応ツールを用いたマルチエージェントフレームワークを提案する。
- 参考スコア(独自算出の注目度): 34.091777505490235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote-sensing vision-language models (RS-VLMs) have advanced Earth-observation analysis toward visual interpretation and instruction-following, yet fall short of operational geo-intelligence, which demands tool-grounded spatial reasoning and structured, evidence-backed decisions. We introduce GeoDisaster, an operational geospatial disaster reasoning benchmark with 2,921 verified instances across 43 question types and five task families: deforestation monitoring, multi-hazard analysis, building-damage assessment, flood-safe routing, and Sentinel-1 SAR flood monitoring. Instances integrate heterogeneous EO/GIS evidence-optical and SAR imagery, raster masks, vector geometries, road networks, and exposure layers-spanning hazard detection, damage assessment, exposure estimation, and diagnostic report generation. Ground-truth answers are grounded in executable geospatial workflows and deterministic consistency checks, removing the need for language-model annotation. We further propose an orchestrated multi-agent framework with 18 disaster-oriented tools, where role-specialized agents coordinate through explicit execution contracts, aligned via Role-Contract Expectation Alignment (RCEA): failure-aware supervised fine-tuning combined with contract-grounded reinforcement learning over dense step-level signals. Experiments show that GeoDisaster challenges existing RS-VLMs and agentic systems, while RCEA improves tool use, evidence grounding, state consistency, and decision generation.
- Abstract(参考訳): リモートセンシング視覚言語モデル (RS-VLMs) は、視覚的解釈と命令追従に先進的な地球観測分析を行うが、ツールによる空間的推論と構造的、エビデンスに支えられた決定を要求する操作的ジオインテリジェンスに欠ける。
GeoDisasterは,43の質問タイプと5つのタスクファミリーにわたる2,921の検証済みインスタンスを備えた,運用上の地理空間的災害推論ベンチマークである。
インスタンスは異種EO/GISエビデンス、SAR画像、ラスタマスク、ベクトルジオメトリー、道路ネットワーク、露光層が拡大するハザード検出、損傷評価、露出推定、診断レポート生成を統合している。
地空間的ワークフローや決定論的整合性チェックでは,言語モデルアノテーションの必要性が排除されている。
さらに,18の災害対応ツールを用いたマルチエージェント・フレームワークを提案する。このフレームワークでは,ロール・コントラスト予測調整(RCEA)を介し,役割指定エージェントが明示的な実行契約を通じて協調する。
実験によると、GeoDisasterは既存のRS-VLMやエージェントシステムに挑戦し、RCEAはツールの使用、エビデンス、状態整合性、意思決定を改善している。
関連論文リスト
- Can LLM Agents Respond to Disasters? Benchmarking Heterogeneous Geospatial Reasoning in Emergency Operations [55.251494694783894]
災害対応エージェントベンチマーク(DORA)は、エンド・ツー・エンドの災害対応のための最初のエージェントベンチマークである。
タスクは、災害認識、空間関係分析、救助・避難計画、時間的進化推論、マルチモーダルレポート合成という、災害対応パイプラインをカバーする5つの次元にまたがる。
DORAは、運用上の信頼性の高い災害対応エージェントのための厳格なテストベッドを確立する。
論文 参考訳(メタデータ) (2026-05-12T06:57:41Z) - Agentic AI for Remote Sensing: Technical Challenges and Research Directions [37.28125428920207]
地球観測(EO)は、データ、参照ツール、地理空間状態の協調推論を必要とする多段階解析への静的予測を超えて進んでいる。
本稿では,これらの課題は偶発的ではなく構造的仮定であると主張する。
次に、構造的地理空間状態、ツール認識推論、検証者誘導実行、地理空間的および物理的妥当性に適合した学習目標を中心に、EOネイティブエージェントの設計原理を概説する。
論文 参考訳(メタデータ) (2026-04-27T18:59:49Z) - Beyond detection: cooperative multi-agent reasoning for rapid onboard EO crisis response [39.146761527401424]
危険事象の迅速同定は、次世代の地球観測ミッションに不可欠である。
現在の監視パイプラインは、ダウンリンクの制限、マルチソースデータ融合の制約、徹底的なシーン分析の計算コストによるレイテンシーを導入している。
本研究では,厳密なリソース制約と帯域幅制約下でのEO処理のための階層型マルチエージェントアーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-03-20T11:20:03Z) - OpenEarthAgent: A Unified Framework for Tool-Augmented Geospatial Agents [68.85365034738534]
本稿では,衛星画像,自然言語クエリ,詳細な推論トレースに基づいて学習したツール拡張された地理空間エージェントを開発するための統一的なフレームワークを提案する。
トレーニングパイプラインは、構造化推論軌道上の教師付き微調整に依存し、モデルを検証された多段階ツールの相互作用と整合させる。
付随コーパスは、14,538のトレーニングと1,169の評価インスタンスから構成され、トレーニングスプリットでは100K以上の推論ステップ、評価スプリットでは7K以上の推論ステップがある。
論文 参考訳(メタデータ) (2026-02-19T18:59:54Z) - GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics [91.17301794848025]
本稿では,人間と密に推論し,詳細なアドレス結論を導出できるGeoAgentについて述べる。
従来のRLベースの手法は、パフォーマンスと解釈可能性においてブレークスルーを達成したが、AI生成のチェーン・オブ・プリート(CoT)データとトレーニング戦略に依存しているため、依然として懸念が残っている。
論文 参考訳(メタデータ) (2026-02-13T04:48:05Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。