論文の概要: DisasterM3: A Remote Sensing Vision-Language Dataset for Disaster Damage Assessment and Response
- arxiv url: http://arxiv.org/abs/2505.21089v1
- Date: Tue, 27 May 2025 12:16:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.631966
- Title: DisasterM3: A Remote Sensing Vision-Language Dataset for Disaster Damage Assessment and Response
- Title(参考訳): 災害M3:災害評価・対応のためのリモートセンシングビジョンランゲージデータセット
- Authors: Junjue Wang, Weihao Xuan, Heli Qi, Zhihao Liu, Kunyi Liu, Yuhan Wu, Hongruixuan Chen, Jian Song, Junshi Xia, Zhuo Zheng, Naoto Yokoya,
- Abstract要約: DisasterM3は、世界規模の災害評価と対応のためのビジョン言語データセットである。
災害M3には、26,988のバイテンポラル衛星画像と5大陸にまたがる123kの命令対が含まれる。
現実世界のシナリオに基づいて、DeramM3は9つの災害関連視覚認識と推論タスクを含んでいる。
- 参考スコア(独自算出の注目度): 20.208384252534657
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large vision-language models (VLMs) have made great achievements in Earth vision. However, complex disaster scenes with diverse disaster types, geographic regions, and satellite sensors have posed new challenges for VLM applications. To fill this gap, we curate a remote sensing vision-language dataset (DisasterM3) for global-scale disaster assessment and response. DisasterM3 includes 26,988 bi-temporal satellite images and 123k instruction pairs across 5 continents, with three characteristics: 1) Multi-hazard: DisasterM3 involves 36 historical disaster events with significant impacts, which are categorized into 10 common natural and man-made disasters. 2)Multi-sensor: Extreme weather during disasters often hinders optical sensor imaging, making it necessary to combine Synthetic Aperture Radar (SAR) imagery for post-disaster scenes. 3) Multi-task: Based on real-world scenarios, DisasterM3 includes 9 disaster-related visual perception and reasoning tasks, harnessing the full potential of VLM's reasoning ability with progressing from disaster-bearing body recognition to structural damage assessment and object relational reasoning, culminating in the generation of long-form disaster reports. We extensively evaluated 14 generic and remote sensing VLMs on our benchmark, revealing that state-of-the-art models struggle with the disaster tasks, largely due to the lack of a disaster-specific corpus, cross-sensor gap, and damage object counting insensitivity. Focusing on these issues, we fine-tune four VLMs using our dataset and achieve stable improvements across all tasks, with robust cross-sensor and cross-disaster generalization capabilities.
- Abstract(参考訳): 大型ビジョン言語モデル(VLM)は地球ビジョンにおいて大きな成果を上げている。
しかし, 多様な災害タイプ, 地理的地域, 衛星センサを備えた複雑な災害現場は, VLMの適用に新たな課題を提起している。
このギャップを埋めるために,リモートセンシングビジョン言語データセット(DisasterM3)を,世界規模の災害評価と対応のためにキュレートする。
災害M3には5大陸にまたがる26,988の衛星画像と123kの命令対が含まれており、その特徴は3つある: 1) 災害M3は36の歴史的災害と重大な影響があり、10の自然災害と人工災害に分類される。
2)Multi-Sensor:災害時の極端気象は、しばしば光学センサーイメージングを阻害し、災害後のシーンに合成開口レーダ(SAR)画像を組み合わせる必要がある。
3) マルチタスク: 現実のシナリオに基づいて,9つの災害関連視覚認識と推論タスクを包含し,VLMの推論能力の最大限の可能性を生かし, 防災体認識から構造的損傷評価, オブジェクト関係推論まで, 長期的災害報告の生成に寄与する。
その結果,災害対応型コーパスの欠如,クロスセンサギャップの欠如,損傷対象の感度の低下など,現在最先端のモデルでは災害対策に苦慮していることが判明した。
これらの問題に焦点をあてて、我々のデータセットを使用して4つのVLMを微調整し、堅牢なクロスセンサとクロスディザスタの一般化機能を備えた、すべてのタスクにわたって安定した改善を実現する。
関連論文リスト
- BRIGHT: A globally distributed multimodal building damage assessment dataset with very-high-resolution for all-weather disaster response [37.37991234180912]
ビル被害評価(BDA)は、人的被害を減らすために災害後の重要な能力である。
近年の研究では、目に見えない災害事象の正確なマッピングを実現するためのAIモデルの開発に焦点が当てられている。
本稿では, veRy-hIGH-resoluTion Optical and SAR image (BRIGHT) を用いたBDAデータセットを提案する。
論文 参考訳(メタデータ) (2025-01-10T14:57:18Z) - DAVE: Diverse Atomic Visual Elements Dataset with High Representation of Vulnerable Road Users in Complex and Unpredictable Environments [60.69159598130235]
Vulnerable Road Users (VRU) の高表現による認識手法の評価を目的とした新しいデータセット DAVE を提案する。
DAVEは16種類のアクターカテゴリー(動物、人間、車など)と16種類のアクションタイプ(カットイン、ジグザグ運動、Uターンなど、複雑で稀なケース)を手動でアノテートしたデータセットである。
実験の結果,既存の手法はDAVEで評価すると性能の劣化に悩まされ,将来的なビデオ認識研究のメリットを浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2024-12-28T06:13:44Z) - Generalizable Disaster Damage Assessment via Change Detection with Vision Foundation Model [17.016411785224317]
DAVI(Disaster Assessment with Vision foundation model)は,ドメインの格差に対処し,ターゲット領域に接地トラストラベルを必要とせずに建物レベルで構造的損傷を検出する手法である。
DAVIは、ソース領域で訓練されたモデルからのタスク固有の知識と、イメージセグメンテーションモデルからのタスク非依存の知識を組み合わせて、ターゲット領域の潜在的な損傷を示す擬似ラベルを生成する。
次に、2段階の精錬プロセスを使用し、ピクセルレベルと画像レベルの両方で動作し、災害被害地域の変化を正確に識別する。
論文 参考訳(メタデータ) (2024-06-12T09:21:28Z) - MonoTDP: Twin Depth Perception for Monocular 3D Object Detection in
Adverse Scenes [49.21187418886508]
本論文は,モノTDP(MonoTDP)と呼ばれる悪シーンにおける2つの深度を知覚するモノクル3次元検出モデルを提案する。
まず、制御不能な気象条件を扱うモデルを支援するための適応学習戦略を導入し、様々な劣化要因による劣化を著しく抑制する。
そこで本研究では, シーン深度と物体深度を同時に推定する新たな2つの深度認識モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-18T13:42:02Z) - Classification of structural building damage grades from multi-temporal
photogrammetric point clouds using a machine learning model trained on
virtual laser scanning data [58.720142291102135]
実世界の点雲からの多層建築物の損傷を自動的に評価する新しい手法を提案する。
我々は、仮想レーザースキャン(VLS)データに基づいて訓練された機械学習モデルを使用する。
このモデルでは、高いマルチターゲット分類精度(全精度:92.0% - 95.1%)が得られる。
論文 参考訳(メタデータ) (2023-02-24T12:04:46Z) - Physics-informed GANs for Coastal Flood Visualization [65.54626149826066]
我々は,現在および将来の沿岸洪水の衛星画像を生成する深層学習パイプラインを構築した。
物理に基づく洪水図と比較して画像を評価することにより,提案手法は物理的一貫性とフォトリアリズムの両方において,ベースラインモデルよりも優れていることがわかった。
この研究は沿岸の洪水の可視化に焦点が当てられているが、気候変動が地球をどう形作るかのグローバルな可視化を作成することを想定している。
論文 参考訳(メタデータ) (2020-10-16T02:15:34Z) - Learning from Multimodal and Multitemporal Earth Observation Data for
Building Damage Mapping [17.324397643429638]
我々は、損傷マッピングを構築するためのグローバルなマルチセンサとマルチテンポラルデータセットを開発した。
グローバルデータセットには、高解像度の光学画像と高解像度のマルチバンドSARデータが含まれている。
我々は、深層畳み込みニューラルネットワークアルゴリズムに基づいて、損傷建物の意味的セグメンテーションのための損傷マッピングフレームワークを定義した。
論文 参考訳(メタデータ) (2020-09-14T05:04:19Z) - Spatiotemporal Attacks for Embodied Agents [119.43832001301041]
我々は、エンボディエージェントに対する敵攻撃を研究するための第一歩を踏み出した。
特に,時間次元と空間次元の両方の相互作用履歴を利用する逆例を生成する。
我々の摂動は強力な攻撃力と一般化能力を持っている。
論文 参考訳(メタデータ) (2020-05-19T01:38:47Z) - RescueNet: Joint Building Segmentation and Damage Assessment from
Satellite Imagery [83.49145695899388]
RescueNetは、建物を同時に分割し、個々の建物に対する損傷レベルを評価し、エンドツーエンドでトレーニングできる統一モデルである。
RescueNetは大規模で多様なxBDデータセットでテストされており、従来の手法よりもはるかに優れたセグメンテーションと損傷分類性能を実現している。
論文 参考訳(メタデータ) (2020-04-15T19:52:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。