論文の概要: Bridging Spatial And Frequency Views For Disaster Assessment: Benefits And Limitations
- arxiv url: http://arxiv.org/abs/2606.17403v1
- Date: Tue, 16 Jun 2026 01:35:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.198904
- Title: Bridging Spatial And Frequency Views For Disaster Assessment: Benefits And Limitations
- Title(参考訳): 防災評価のための空間・周波数ビューのブリッジ:便益と限界
- Authors: Shikha V. Chandel, Yadav Raj Ghimire, Timothy Agboada, Leila Hashemi-Beni,
- Abstract要約: 本研究では,建築被害分類のための空間領域,周波数領域,二重領域深層学習手法の比較を行った。
性能は、精度、マクロF1スコア、クラスごとのメトリクス、混乱行列を用いて評価される。
双対空間構成は最高テスト精度(0.4688)と最低損失(0.4254)を達成する一方、空間限定モデルは最高マクロF1スコア(0.4254)を達成する。
- 参考スコア(独自算出の注目度): 0.27185251060695437
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Rapid assessment of building damage from satellite imagery is essential for effective disaster response and recovery. While most deep learning methods rely on spatial-domain features, frequency-domain representations can capture complementary structural cues such as debris patterns and collapse-induced textures. This study presents a controlled comparison of spatial-domain, frequency-domain, and dual-domain deep learning approaches for multi-class building damage classification using post-disaster imagery from the xView2 (xBD) dataset. To ensure fairness, all models are built on an EfficientNet-B0 backbone and trained under identical settings, differing only in their input representations and fusion strategies. Performance is evaluated using accuracy, macro F1-score, per-class metrics, and confusion matrices. Results show that dual-domain models provide measurable improvements over single-domain approaches. The dual spatial configuration achieves the highest test accuracy (0.4688) and lowest loss, while the spatial-only model attains the best macro F1-score (0.4254), indicating more balanced class performance. In contrast, frequency-only models perform worst and exhibit overfitting, suggesting limited generalization. Despite these gains, all models struggle to detect subtle damage levels, particularly the Minor class, due to class imbalance and fine-grained visual ambiguity. While dual-domain approaches improve detection of severe damage, challenges remain. These findings highlight the benefits and limitations of hybrid representations and motivate future work on data balancing, advanced fusion, and regularization.
- Abstract(参考訳): 衛星画像による建物被害の迅速評価は, 災害対策と復旧に不可欠である。
ほとんどの深層学習法は空間領域の特徴に依存しているが、周波数領域表現は破片パターンや崩壊によって引き起こされるテクスチャのような補完的な構造的手がかりを捉えることができる。
本研究は,xView2(xBD)データセットから得られた災害後の画像を用いて,空間領域,周波数領域,二重領域の深層学習アプローチを多層建物被害分類のための制御された比較を行った。
公平性を確保するため、すべてのモデルはEfficientNet-B0バックボーン上に構築され、同じ設定でトレーニングされる。
性能は、精度、マクロF1スコア、クラスごとのメトリクス、混乱行列を用いて評価される。
結果は、二重ドメインモデルが単一ドメインアプローチよりも測定可能な改善を提供することを示している。
双対空間構成は高いテスト精度(0.4688)と最低損失(0.4254)を達成する一方、空間のみのモデルは最高のマクロF1スコア(0.4254)を達成し、よりバランスの取れたクラス性能を示す。
対照的に、周波数のみのモデルは最悪であり、過剰適合を示し、限定的な一般化を示唆している。
これらの上昇にもかかわらず、全てのモデルは微妙な損傷レベル、特にクラス不均衡ときめ細かい視覚的曖昧さのために、検出に苦慮している。
二重ドメインアプローチは深刻な損傷の検出を改善するが、課題は残る。
これらの知見は、ハイブリッド表現の利点と限界を強調し、データバランシング、高度な融合、正規化に関する将来の取り組みを動機付けている。
関連論文リスト
- Few-Shot Synthetic Data Generation with Diffusion Models for Downstream Vision Tasks [36.94429692322632]
クラス不均衡は視覚認識において永続的な課題である。
稀なクラスの20~50個の実画像にLoRAアダプタを微調整する,軽量な合成データ拡張パイプラインを提案する。
論文 参考訳(メタデータ) (2026-05-12T10:11:57Z) - Frequency-Enhanced Dual-Subspace Networks for Few-Shot Fine-Grained Image Classification [6.738210148449625]
微粒化の少ない画像分類は,注釈付きサンプルの限られた数だけを用いて,視覚的類似度の高いサブカテゴリを認識することを目的としている。
既存のメトリック学習ベースの手法は、通常、空間的領域の特徴のみに依存する。
本稿では、周波数拡張デュアルサブスペースネットワーク(FEDSNet)を提案する。
論文 参考訳(メタデータ) (2026-04-16T12:54:29Z) - Physically-Induced Atmospheric Adversarial Perturbations: Enhancing Transferability and Robustness in Remote Sensing Image Classification [54.952203312050564]
敵対的攻撃は、リモートセンシング(RS)画像分類におけるディープラーニングモデルの信頼性に深刻な脅威をもたらす。
本稿ではフォグフール(FogFool)を提案する。
2つのベンチマークRSデータセットの実験は、FogFoolが優れたパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-04-16T05:47:57Z) - Building Damage Detection using Satellite Images and Patch-Based Transformer Methods [0.0]
我々は、xBDデータセット上でビジョントランスフォーマー(ViT)モデルの性能を評価する。
本稿では,構造的特徴を分離し,背景雑音を最小限に抑えるパッチベースの前処理パイプラインを提案する。
そこで本研究では,災害分類のためのCNNベースラインと比較して,新しいトレーニング手法による小さなViTアーキテクチャが,競合するマクロ平均F1を実現することを示す。
論文 参考訳(メタデータ) (2026-02-08T20:45:58Z) - AI-Based Culvert-Sewer Inspection [0.0]
カルバートと下水道管は排水システムの重要な構成要素であり、その故障は公共の安全と環境に深刻なリスクをもたらす可能性がある。
この論文では、欠陥セグメント化を大幅に強化し、データの不足を処理する3つの方法を提案する。
ForTRESSは、奥行き分離可能な畳み込み、適応型コルモゴロフ・アルノルドネットワーク(KAN)、マルチスケールアテンション機構を組み合わせた新しいアーキテクチャである。
論文 参考訳(メタデータ) (2026-01-21T16:33:33Z) - Enhancing CLIP Robustness via Cross-Modality Alignment [54.01929554563447]
視覚言語モデルのための最適なトランスポートベースフレームワークであるクロスモダリティアライメントを提案する。
COLAは、グローバルな画像テキストアライメントと特徴空間における局所的な構造的一貫性を復元する。
COLAはトレーニングフリーで、既存の微調整モデルと互換性がある。
論文 参考訳(メタデータ) (2025-10-28T03:47:44Z) - AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - DeepDamageNet: A two-step deep-learning model for multi-disaster building damage segmentation and classification using satellite imagery [12.869300064524122]
本稿では, 損傷評価, セグメンテーション, 分類において, ディープラーニングモデルによる2つの重要な課題を遂行するソリューションを提案する。
我々の最良のモデルは、建物識別セマンティックセグメンテーション畳み込みニューラルネットワーク(CNN)と建物損傷分類CNNを組み合わせ、合計F1スコアは0.66である。
本モデルでは比較的精度の高い建物を同定することができたが,災害タイプによる被害の分類は困難であることが判明した。
論文 参考訳(メタデータ) (2024-05-08T04:21:03Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Assessing out-of-domain generalization for robust building damage
detection [78.6363825307044]
建築損傷検出は、衛星画像にコンピュータビジョン技術を適用することで自動化することができる。
モデルは、トレーニングで利用可能な災害画像と、新しいイベントの画像の間の分散の変化に対して堅牢でなければならない。
今後はOOD体制に重点を置くべきだと我々は主張する。
論文 参考訳(メタデータ) (2020-11-20T10:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。