論文の概要: CLiSA: A Hierarchical Hybrid Transformer Model using Orthogonal Cross
Attention for Satellite Image Cloud Segmentation
- arxiv url: http://arxiv.org/abs/2311.17475v2
- Date: Fri, 1 Dec 2023 10:43:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 11:44:07.360203
- Title: CLiSA: A Hierarchical Hybrid Transformer Model using Orthogonal Cross
Attention for Satellite Image Cloud Segmentation
- Title(参考訳): CLiSA:衛星画像クラウドセグメンテーションのための直交交差注意を用いた階層型ハイブリッドトランスモデル
- Authors: Subhajit Paul, Ashutosh Gupta
- Abstract要約: ディープラーニングアルゴリズムは画像セグメンテーション問題を解決するための有望なアプローチとして登場してきた。
本稿では,Lipschitz Stable Attention NetworkによるCLiSA - Cloudセグメンテーションという,効果的なクラウドマスク生成のためのディープラーニングモデルを提案する。
Landsat-8, Sentinel-2, Cartosat-2sを含む複数の衛星画像データセットの質的および定量的な結果を示す。
- 参考スコア(独自算出の注目度): 5.178465447325005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clouds in optical satellite images are a major concern since their presence
hinders the ability to carry accurate analysis as well as processing. Presence
of clouds also affects the image tasking schedule and results in wastage of
valuable storage space on ground as well as space-based systems. Due to these
reasons, deriving accurate cloud masks from optical remote-sensing images is an
important task. Traditional methods such as threshold-based, spatial filtering
for cloud detection in satellite images suffer from lack of accuracy. In recent
years, deep learning algorithms have emerged as a promising approach to solve
image segmentation problems as it allows pixel-level classification and
semantic-level segmentation. In this paper, we introduce a deep-learning model
based on hybrid transformer architecture for effective cloud mask generation
named CLiSA - Cloud segmentation via Lipschitz Stable Attention network. In
this context, we propose an concept of orthogonal self-attention combined with
hierarchical cross attention model, and we validate its Lipschitz stability
theoretically and empirically. We design the whole setup under adversarial
setting in presence of Lov\'asz-Softmax loss. We demonstrate both qualitative
and quantitative outcomes for multiple satellite image datasets including
Landsat-8, Sentinel-2, and Cartosat-2s. Performing comparative study we show
that our model performs preferably against other state-of-the-art methods and
also provides better generalization in precise cloud extraction from satellite
multi-spectral (MX) images. We also showcase different ablation studies to
endorse our choices corresponding to different architectural elements and
objective functions.
- Abstract(参考訳): 光衛星画像内の雲は、その存在が正確な解析と処理の能力を妨げるため、主要な関心事である。
雲の存在は、イメージタスクのスケジュールにも影響し、地上および宇宙ベースのシステムで貴重なストレージスペースを浪費する。
これらの理由から、光学リモートセンシング画像から正確な雲マスクを抽出することが重要な課題である。
衛星画像における雲検出のためのしきい値に基づく空間フィルタリングのような従来の手法は精度の欠如に苦しむ。
近年,深層学習アルゴリズムは,画素レベルの分類と意味レベルのセグメンテーションを可能にするため,画像セグメンテーション問題を解決するための有望なアプローチとして出現している。
本稿では,ハイブリッドトランスフォーマーアーキテクチャに基づく,clisa - cloud segmentation via lipschitz stable attention network という,効果的なクラウドマスク生成のためのディープラーニングモデルを提案する。
本研究では,階層的クロスアテンションモデルと組み合わせた直交自己アテンションの概念を提案し,リプシッツの安定性を理論的および経験的に検証する。
我々は,Lov\'asz-Softmax損失を前提として,対向的な設定で全体の設定を設計する。
Landsat-8, Sentinel-2, Cartosat-2sを含む複数の衛星画像データセットの質的および定量的な結果を示す。
比較実験の結果,我々のモデルは,他の最先端手法に対して好適に動作し,衛星マルチスペクトル(MX)画像からの雲抽出の精度向上も図っている。
また,異なるアーキテクチャ要素と目的関数に対応する選択を推奨する,異なるアブレーション研究も紹介する。
関連論文リスト
- Edge-Cloud Collaborative Satellite Image Analysis for Efficient Man-Made Structure Recognition [2.110762118285028]
本稿では,エッジとクラウドコンピューティングを組み合わせた新しい衛星画像処理アーキテクチャを提案する。
エッジに軽量モデルを採用することで、当初は衛星画像から人造構造を特定できる。
これらの識別された画像はクラウドに送信され、より複雑なモデルによって分類が洗練される。
論文 参考訳(メタデータ) (2024-10-08T03:31:32Z) - Point Cloud Compression with Implicit Neural Representations: A Unified Framework [54.119415852585306]
我々は幾何学と属性の両方を扱える先駆的なクラウド圧縮フレームワークを提案する。
本フレームワークでは,2つの座標ベースニューラルネットワークを用いて,voxelized point cloudを暗黙的に表現する。
本手法は,既存の学習手法と比較して,高い普遍性を示す。
論文 参考訳(メタデータ) (2024-05-19T09:19:40Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - DiffCR: A Fast Conditional Diffusion Framework for Cloud Removal from
Optical Satellite Images [27.02507384522271]
本稿では,光衛星画像の高速クラウド除去に深部畳み込みネットワークを用いた条件付き拡散を利用したDiffCRという新しいフレームワークを提案する。
条件付き特徴抽出のための分離エンコーダを導入し、条件付き入力と合成出力との外観情報の密接な類似性を確保するために、ロバストな色表現を提供する。
論文 参考訳(メタデータ) (2023-08-08T17:34:28Z) - Detecting Cloud Presence in Satellite Images Using the RGB-based CLIP
Vision-Language Model [0.0]
この研究は、雲によって影響を受ける衛星画像を特定するために、事前訓練されたCLIPビジョン言語モデルの能力を探求する。
このモデルを用いて雲の存在検知を行うためのいくつかの手法を提案し,評価した。
以上の結果から,CLIPモデルで学習した表現は,雲を含む衛星画像処理作業に有用であることが示唆された。
論文 参考訳(メタデータ) (2023-08-01T13:36:46Z) - Exploring the Application of Large-scale Pre-trained Models on Adverse
Weather Removal [97.53040662243768]
ネットワークが異なる気象条件を適応的に処理できるようにするために,CLIP埋め込みモジュールを提案する。
このモジュールは、CLIP画像エンコーダによって抽出されたサンプル特定気象と、パラメータセットによって学習された分布特定情報を統合する。
論文 参考訳(メタデータ) (2023-06-15T10:06:13Z) - Cloud removal Using Atmosphere Model [7.259230333873744]
クラウド除去はリモートセンシングデータ分析において重要なタスクである。
本稿では,低階及びスパースモデルの枠組みにおける任意のシーンの画像の時間的シーケンスに散乱モデルを用いることを提案する。
本研究では,クラウドカバーを定量的に解析できる半現実的シミュレーション手法を開発した。
論文 参考訳(メタデータ) (2022-10-05T01:29:19Z) - SatMAE: Pre-training Transformers for Temporal and Multi-Spectral
Satellite Imagery [74.82821342249039]
Masked Autoencoder(MAE)に基づく時間・マルチスペクトル衛星画像の事前学習フレームワークであるSatMAEについて述べる。
時間的情報を活用するために、時間にわたって画像パッチを個別にマスキングする時間的埋め込みを含む。
論文 参考訳(メタデータ) (2022-07-17T01:35:29Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Multi-scale Cloud Detection in Remote Sensing Images using a Dual
Convolutional Neural Network [4.812718493682455]
CNNは、リモートセンシング画像のピクセルレベルの分類において、最先端の技術を進歩させた。
アンサンプとフル解像度の画像を逐次処理する2つのCNNモデルコンポーネントのアーキテクチャを提案する。
パッチによるCNNベースラインの画素精度は16%向上した。
論文 参考訳(メタデータ) (2020-06-01T10:27:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。