論文の概要: MCANet: A Multi-Scale Class-Specific Attention Network for Multi-Label Post-Hurricane Damage Assessment using UAV Imagery
- arxiv url: http://arxiv.org/abs/2509.04757v1
- Date: Fri, 05 Sep 2025 02:25:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.45299
- Title: MCANet: A Multi-Scale Class-Specific Attention Network for Multi-Label Post-Hurricane Damage Assessment using UAV Imagery
- Title(参考訳): MCANet:UAV画像を用いたマルチラベル後ハリケーン被害評価のためのマルチスケールクラス特化注意ネットワーク
- Authors: Zhangding Liu, Neda Mohammadi, John E. Taylor,
- Abstract要約: MCANetはマルチラベル分類フレームワークであり、マルチスケール表現を学習し、空間的に関係のある領域に適応的に参加する。
ハリケーン・マイケル後に収集された4,494個のUAV画像のRescueNetデータセット上でMCANetを評価する。
- 参考スコア(独自算出の注目度): 1.0323063834827415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rapid and accurate post-hurricane damage assessment is vital for disaster response and recovery. Yet existing CNN-based methods struggle to capture multi-scale spatial features and to distinguish visually similar or co-occurring damage types. To address these issues, we propose MCANet, a multi-label classification framework that learns multi-scale representations and adaptively attends to spatially relevant regions for each damage category. MCANet employs a Res2Net-based hierarchical backbone to enrich spatial context across scales and a multi-head class-specific residual attention module to enhance discrimination. Each attention branch focuses on different spatial granularities, balancing local detail with global context. We evaluate MCANet on the RescueNet dataset of 4,494 UAV images collected after Hurricane Michael. MCANet achieves a mean average precision (mAP) of 91.75%, outperforming ResNet, Res2Net, VGG, MobileNet, EfficientNet, and ViT. With eight attention heads, performance further improves to 92.35%, boosting average precision for challenging classes such as Road Blocked by over 6%. Class activation mapping confirms MCANet's ability to localize damage-relevant regions, supporting interpretability. Outputs from MCANet can inform post-disaster risk mapping, emergency routing, and digital twin-based disaster response. Future work could integrate disaster-specific knowledge graphs and multimodal large language models to improve adaptability to unseen disasters and enrich semantic understanding for real-world decision-making.
- Abstract(参考訳): ハリケーン後の被害の迅速かつ正確な評価は、災害対応と復旧に不可欠である。
しかし、既存のCNNベースの手法は、マルチスケールの空間的特徴を捉え、視覚的に類似または共起する損傷タイプを識別するのに苦労している。
これらの課題に対処するために,マルチスケール表現を学習し,各損傷カテゴリの空間的関連領域に適応的に参加するマルチラベル分類フレームワークであるMCANetを提案する。
MCANetは、Res2Netベースの階層バックボーンを使用して、スケールをまたいだ空間コンテキストを拡張し、識別を強化するために、マルチヘッドクラス固有の残留アテンションモジュールを使用する。
各注意領域は異なる空間的粒度に焦点を当て、局所的な詳細とグローバルな文脈のバランスをとる。
ハリケーン・マイケル後に収集された4,494個のUAV画像のRescueNetデータセット上でMCANetを評価する。
MCANetは平均平均精度(mAP)が91.75%に達し、ResNet、Res2Net、VGG、MobileNet、EfficientNet、ViTを上回っている。
8つの注目の的となり、パフォーマンスはさらに92.35%向上し、ロード・ブロックのような挑戦的なクラスの平均精度が6%以上向上した。
クラスアクティベーションマッピングは、MCANetの損傷関連領域のローカライズ能力を確認し、解釈可能性をサポートする。
MCANetからの出力は、災害後のリスクマッピング、緊急ルーティング、デジタルツインベースの災害対応を通知することができる。
今後の作業は、災害固有の知識グラフとマルチモーダルな大規模言語モデルを統合して、目に見えない災害への適応性を改善し、現実世界の意思決定に意味的理解を深めていくだろう。
関連論文リスト
- EMRA-proxy: Enhancing Multi-Class Region Semantic Segmentation in Remote Sensing Images with Attention Proxy [2.3727914512000714]
本稿では,CRA (Contextual Region Attention) とGCR (Global Class Refinement) の2つのコンポーネントからなる新しいアプローチであるRegional-Aware Proxy Network (RAPNet)を提案する。
RAPNetは、より柔軟なセグメンテーションのために、リージョンレベルで動作している。
3つの公開データセットの実験では、RAPNetは最先端の手法よりも優れ、より優れたマルチクラスのセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2025-05-23T09:30:45Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Spatial Layout Consistency for 3D Semantic Segmentation [0.7614628596146599]
本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-02T03:24:21Z) - Classification of structural building damage grades from multi-temporal
photogrammetric point clouds using a machine learning model trained on
virtual laser scanning data [58.720142291102135]
実世界の点雲からの多層建築物の損傷を自動的に評価する新しい手法を提案する。
我々は、仮想レーザースキャン(VLS)データに基づいて訓練された機械学習モデルを使用する。
このモデルでは、高いマルチターゲット分類精度(全精度:92.0% - 95.1%)が得られる。
論文 参考訳(メタデータ) (2023-02-24T12:04:46Z) - DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。
本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。
完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T06:23:58Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Multi-Glimpse Network: A Robust and Efficient Classification
Architecture based on Recurrent Downsampled Attention [12.710863521667015]
本稿では,高速計算の課題を解決するために,エンドツーエンドのトレーニング可能なマルチグリッドネットワーク(MGNet)を提案する。
具体的には、MGNetは、画像のタスク関連領域を順次選択し、最終予測のために収集されたすべての情報を適応的に結合する。
ImageNet100の実験では、単一のフィードフォワード方式を改善するために、繰り返しダウンサンプリングされたアテンションメカニズムの可能性を実証した。
論文 参考訳(メタデータ) (2021-11-03T04:46:26Z) - SOE-Net: A Self-Attention and Orientation Encoding Network for Point
Cloud based Place Recognition [50.9889997200743]
我々は、自己アテンション・指向性符号化ネットワーク(SOE-Net)を用いて、ポイントクラウドデータから位置認識する問題に取り組む。
SOE-Netは、ポイント間の関係を完全に探求し、長距離コンテキストをポイントワイドなローカル記述子に組み込む。
様々なベンチマークデータセットの実験では、現在の最先端アプローチよりも提案したネットワークの性能が優れていることが示されている。
論文 参考訳(メタデータ) (2020-11-24T22:28:25Z) - PENet: Object Detection using Points Estimation in Aerial Images [9.33900415971554]
これらの課題に対処するために,新しいネットワーク構造であるポイント推定ネットワーク(PENet)を提案する。
PENetはMask Resampling Module(MRM)を使用して、不均衡なデータセットを増大させ、粗いアンカーフリー検出器(CPEN)で小さなオブジェクトクラスタの中心点を効果的に予測し、微細なアンカーフリー検出器FPENで小さなオブジェクトの正確な位置を特定する。
航空データセット visDrone と UAVDT による実験により,PENet は既存の最先端手法よりも精度の高い結果を得た。
論文 参考訳(メタデータ) (2020-01-22T19:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。