論文の概要: Frequency Decomposition-Driven Unsupervised Domain Adaptation for Remote Sensing Image Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2404.04531v1
- Date: Sat, 6 Apr 2024 07:13:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 20:49:00.351633
- Title: Frequency Decomposition-Driven Unsupervised Domain Adaptation for Remote Sensing Image Semantic Segmentation
- Title(参考訳): リモートセンシング画像セマンティックセグメンテーションのための周波数分解駆動非教師なし領域適応
- Authors: Xianping Ma, Xiaokang Zhang, Xingchen Ding, Man-On Pun, Siwei Ma,
- Abstract要約: 非教師なし領域適応(UDA)技術に基づくリモートセンシング(RS)画像のクロスドメインセマンティックセマンティックセマンティックセマンティックセマンティクスは、地球科学における深層学習を著しく進歩させた。
ドメイン間の空間的詳細とグローバルな文脈意味論を同時に維持することは依然として困難である。
クロスドメインセマンティックセグメンテーションにおける表現アライメントを誘導する新しい高周波数分解法(HLFD)を提案する。
- 参考スコア(独自算出の注目度): 30.606689882397223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-domain semantic segmentation of remote sensing (RS) imagery based on unsupervised domain adaptation (UDA) techniques has significantly advanced deep-learning applications in the geosciences. Recently, with its ingenious and versatile architecture, the Transformer model has been successfully applied in RS-UDA tasks. However, existing UDA methods mainly focus on domain alignment in the high-level feature space. It is still challenging to retain cross-domain local spatial details and global contextual semantics simultaneously, which is crucial for the RS image semantic segmentation task. To address these problems, we propose novel high/low-frequency decomposition (HLFD) techniques to guide representation alignment in cross-domain semantic segmentation. Specifically, HLFD attempts to decompose the feature maps into high- and low-frequency components before performing the domain alignment in the corresponding subspaces. Secondly, to further facilitate the alignment of decomposed features, we propose a fully global-local generative adversarial network, namely GLGAN, to learn domain-invariant detailed and semantic features across domains by leveraging global-local transformer blocks (GLTBs). By integrating HLFD techniques and the GLGAN, a novel UDA framework called FD-GLGAN is developed to improve the cross-domain transferability and generalization capability of semantic segmentation models. Extensive experiments on two fine-resolution benchmark datasets, namely ISPRS Potsdam and ISPRS Vaihingen, highlight the effectiveness and superiority of the proposed approach as compared to the state-of-the-art UDA methods. The source code for this work will be accessible at https://github.com/sstary/SSRS.
- Abstract(参考訳): 非教師なし領域適応(UDA)技術に基づくリモートセンシング(RS)画像のクロスドメインセマンティックセマンティックセマンティックセマンティックセマンティクスは、地球科学における深層学習を著しく進歩させた。
近年,トランスフォーマーモデルがRS-UDAタスクに適用されている。
しかし、既存のUDAメソッドは主に高レベルの特徴空間におけるドメインアライメントに焦点を当てている。
領域横断的な空間的詳細とグローバルな文脈的意味論を同時に維持することは、RS画像セマンティックセグメンテーションタスクにとって重要な課題である。
これらの問題に対処するために、クロスドメインセマンティックセグメンテーションにおける表現アライメントを導くための新しい高周波数分解法(HLFD)を提案する。
具体的には、HLFDは対応する部分空間でドメインアライメントを実行する前に、特徴写像を高周波数成分と低周波数成分に分解しようとする。
次に,グローバルローカルトランスフォーマーブロック(GLTB)を活用して,ドメイン間のドメイン不変な詳細および意味的特徴を学習するための,完全にグローバルな生成的敵ネットワークであるGLGANを提案する。
HLFD技術とGLGANを統合することで、セマンティックセグメンテーションモデルのクロスドメイン転送性と一般化能力を向上させるために、FD-GLGANと呼ばれる新しいUDAフレームワークを開発した。
ISPRS Potsdam と ISPRS Vaihingen の2つの詳細なベンチマークデータセットに対する大規模な実験は、提案手法の有効性と優位性を強調している。
この作業のソースコードはhttps://github.com/sstary/SSRS.comからアクセスできる。
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Unified Domain Adaptive Semantic Segmentation [96.74199626935294]
Unsupervised Adaptive Domain Semantic (UDA-SS)は、ラベル付きソースドメインからラベル付きターゲットドメインに監督を移すことを目的としている。
本稿では,特徴量と特徴量との相違に対処するQuad-directional Mixup(QuadMix)法を提案する。
提案手法は,4つの挑戦的UDA-SSベンチマークにおいて,最先端の成果を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2023-11-22T09:18:49Z) - Depth-Assisted ResiDualGAN for Cross-Domain Aerial Images Semantic
Segmentation [15.29253551096484]
教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ドメインギャップを最小化するためのアプローチである。
デジタルサーフェスモデル(DSM)は通常、ソースドメインとターゲットドメインの両方で利用可能である。
深度制御型ResiDualGAN (DRDG) を提案し, 深度制御型損失 (DCCL) を用いて生成モデルに深度情報をもたらす。
論文 参考訳(メタデータ) (2022-08-21T06:58:51Z) - Generative Domain Adaptation for Face Anti-Spoofing [38.12738183385737]
教師なしドメイン適応(UDA)に基づくアンチスプーフィングアプローチは、ターゲットシナリオに対する有望なパフォーマンスのために注目を集めている。
既存のUDA FASメソッドは、通常、セマンティックな高レベルの機能の分布を整列することで、トレーニングされたモデルをターゲットドメインに適合させる。
対象データをモデルに直接適合させ、画像翻訳により対象データをソースドメインスタイルにスタイリングし、さらに、訓練済みのソースモデルにスタイリングされたデータを入力して分類する、UDA FASの新しい視点を提案する。
論文 参考訳(メタデータ) (2022-07-20T16:24:57Z) - Curriculum-style Local-to-global Adaptation for Cross-domain Remote
Sensing Image Segmentation [11.650285884518208]
超高解像度(VHR)リモートセンシング画像(RSI)のクロスドメインセグメンテーションは2つの重要な課題に直面している。
多くの多様な対象カテゴリを持つ広い面積の土地は、深刻な局所的なパッチレベルのデータ分布のずれをもたらしている。
異なるVHRセンサタイプや動的に変化するモードは、同じ地理的位置であっても、VHRイメージが集中的なデータ分散の差を通り抜ける原因となる。
本稿では,VHR RSIのセグメンテーションのためのカリキュラム型ローカル・グローバル・クロスドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-03T06:33:46Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - HSVA: Hierarchical Semantic-Visual Adaptation for Zero-Shot Learning [74.76431541169342]
ゼロショット学習(ZSL)は、目に見えないクラス認識の問題に取り組み、目に見えないクラスから目に見えないクラスに意味的な知識を移す。
本稿では,意味領域と視覚領域を協調させる新しい階層型意味視覚適応(HSVA)フレームワークを提案する。
4つのベンチマークデータセットの実験では、HSVAは従来のZSLと一般的なZSLの両方で優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-30T14:27:50Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Domain Adaptive Object Detection via Feature Separation and Alignment [11.4768983507572]
対向型ドメイン適応オブジェクト検出法(DAOD)が急速に開発されている。
本稿では,grey-scale feature separation (gsfs) モジュール,local-global feature alignment (lgfa) モジュール,および region-instance-level alignment (rila) モジュールからなる特徴分離アライメントネットワーク (fsanet) を確立する。
私達のFSANetはターゲット ドメインの検出でよりよい性能を達成し、最先端の方法を超過します。
論文 参考訳(メタデータ) (2020-12-16T01:44:34Z) - Contextual-Relation Consistent Domain Adaptation for Semantic
Segmentation [44.19436340246248]
本稿では,革新的局所文脈相関整合ドメイン適応手法を提案する。
グローバルレベルのアライメントにおいて、地域レベルのコンピテンシーを達成することを目的としている。
実験では, 最先端手法と比較して, セグメンテーション性能が優れていることを示した。
論文 参考訳(メタデータ) (2020-07-05T19:00:46Z) - Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。
これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文 参考訳(メタデータ) (2020-05-14T04:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。