論文の概要: MSCloudCAM: Cross-Attention with Multi-Scale Context for Multispectral Cloud Segmentation
- arxiv url: http://arxiv.org/abs/2510.10802v1
- Date: Sun, 12 Oct 2025 20:40:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.113074
- Title: MSCloudCAM: Cross-Attention with Multi-Scale Context for Multispectral Cloud Segmentation
- Title(参考訳): MSCloudCAM:マルチスペクトルクラウドセグメンテーションのためのマルチスケールコンテキストによるクロスアテンション
- Authors: Md Abdullah Al Mazid, Liangdong Deng, Naphtali Rishe,
- Abstract要約: MSCloudCAMはマルチスペクトルとマルチセンサークラウドセグメンテーションに適したマルチスケールコンテキストネットワークを備えたクロスアテンションである。
我々のフレームワークは、Sentinel-2とLandsat-8のデータによるスペクトル豊かさを利用して、明空、薄い雲、厚い雲、雲の影の4つの意味カテゴリーを分類する。
MSCloudCAMは階層的特徴抽出のためのSwin Transformerのバックボーンと、拡張スケール認識学習のためのマルチスケールコンテキストモジュールASPPとPSPを組み合わせたものだ。
- 参考スコア(独自算出の注目度): 0.15293427903448018
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clouds remain a critical challenge in optical satellite imagery, hindering reliable analysis for environmental monitoring, land cover mapping, and climate research. To overcome this, we propose MSCloudCAM, a Cross-Attention with Multi-Scale Context Network tailored for multispectral and multi-sensor cloud segmentation. Our framework exploits the spectral richness of Sentinel-2 (CloudSEN12) and Landsat-8 (L8Biome) data to classify four semantic categories: clear sky, thin cloud, thick cloud, and cloud shadow. MSCloudCAM combines a Swin Transformer backbone for hierarchical feature extraction with multi-scale context modules ASPP and PSP for enhanced scale-aware learning. A Cross-Attention block enables effective multisensor and multispectral feature fusion, while the integration of an Efficient Channel Attention Block (ECAB) and a Spatial Attention Module adaptively refine feature representations. Comprehensive experiments on CloudSEN12 and L8Biome demonstrate that MSCloudCAM delivers state-of-the-art segmentation accuracy, surpassing leading baseline architectures while maintaining competitive parameter efficiency and FLOPs. These results underscore the model's effectiveness and practicality, making it well-suited for large-scale Earth observation tasks and real-world applications.
- Abstract(参考訳): 雲は依然として光学衛星画像において重要な課題であり、環境モニタリング、土地被覆マッピング、気候研究の信頼性の高い分析を妨げる。
そこで本研究では,マルチスペクトルおよびマルチセンサクラウドセグメンテーションに適したマルチスケールコンテキストネットワークを用いたクロスアテンションMSCloudCAMを提案する。
筆者らのフレームワークは,Sentinel-2(CloudSEN12)とLandsat-8(L8Biome)のスペクトル密度を利用して,明空,薄い雲,厚い雲,雲影の4つの意味カテゴリーを分類する。
MSCloudCAMは階層的特徴抽出のためのSwin Transformerのバックボーンと、拡張スケール認識学習のためのマルチスケールコンテキストモジュールASPPとPSPを組み合わせたものだ。
クロスアテンションブロックは、効率的なマルチセンサとマルチスペクトル特徴融合を可能にし、ECAB(Efficient Channel Attention Block)と空間アテンションモジュール(Spatial Attention Module)を統合して、特徴表現を適応的に洗練する。
CloudSEN12とL8Biomeに関する総合的な実験は、MSCloudCAMが最先端のベースラインアーキテクチャを越えながら、競合パラメータ効率とFLOPを維持しながら、最先端のセグメンテーション精度を提供することを示した。
これらの結果はモデルの有効性と実用性を強調し、大規模な地球観測や実世界の応用に適している。
関連論文リスト
- Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy [8.008730702184803]
我々は高解像度センサのクラウドとクラウドのシャドウ検出問題に機械学習を用いて対処する。
先進的なディープラーニングアーキテクチャ,すなわちUNet と Spectral Channel Attention Network (SCAN) の手法を用いて,従来の手法をデプロイし,評価する。
その結果,従来の手法は空間的・境界的定義に苦慮し,雲や雲の影の検出に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2025-09-24T00:49:52Z) - GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection [53.03687787922032]
長距離モデリングと線形効率の優れたマンバモデルが注目されている。
本研究は,マルチクラス非教師付き異常検出へのMambaADの適用の先駆者であり,MambaADを提示する。
提案したLSSモジュールは、並列カスケード(Hybrid State Space) HSSブロックとマルチカーネル畳み込み操作を統合し、長距離情報とローカル情報の両方を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-04-09T18:28:55Z) - Distribution-aware Interactive Attention Network and Large-scale Cloud
Recognition Benchmark on FY-4A Satellite Image [24.09239785062109]
我々は,正確なクラウド認識のための新しいデータセットを開発した。
領域適応法を用いて,70,419個の画像ラベル対を投影,時間分解能,空間分解能の点で整列する。
また,高解像度ブランチと並列クロスブランチにより画素レベルの詳細を保存できる分散対応インタラクティブアテンションネットワーク(DIAnet)を導入する。
論文 参考訳(メタデータ) (2024-01-06T09:58:09Z) - CLiSA: A Hierarchical Hybrid Transformer Model using Orthogonal Cross
Attention for Satellite Image Cloud Segmentation [5.178465447325005]
ディープラーニングアルゴリズムは画像セグメンテーション問題を解決するための有望なアプローチとして登場してきた。
本稿では,Lipschitz Stable Attention NetworkによるCLiSA - Cloudセグメンテーションという,効果的なクラウドマスク生成のためのディープラーニングモデルを提案する。
Landsat-8, Sentinel-2, Cartosat-2sを含む複数の衛星画像データセットの質的および定量的な結果を示す。
論文 参考訳(メタデータ) (2023-11-29T09:31:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。