論文の概要: SiamSeg: Self-Training with Contrastive Learning for Unsupervised Domain Adaptation Semantic Segmentation in Remote Sensing
- arxiv url: http://arxiv.org/abs/2410.13471v2
- Date: Sat, 26 Oct 2024 08:11:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:13:48.160393
- Title: SiamSeg: Self-Training with Contrastive Learning for Unsupervised Domain Adaptation Semantic Segmentation in Remote Sensing
- Title(参考訳): SiamSeg:遠隔センシングにおける教師なしドメイン適応セマンティックセマンティックセグメンテーションのためのコントラスト学習による自己学習
- Authors: Bin Wang, Fei Deng, Shuang Wang, Wen Luo, Zhixuan Zhang, Gulan Zhang, Peifan Jiang,
- Abstract要約: UDAは、ラベル付きソースドメインデータをトレーニングしながら、ラベルなしのターゲットドメインデータからモデルを学習することを可能にする。
コントラスト学習を UDA に統合し,セマンティック情報を取得する能力を向上させることを提案する。
我々のSimSegメソッドは既存の手法より優れ、最先端の結果が得られます。
- 参考スコア(独自算出の注目度): 14.007392647145448
- License:
- Abstract: Semantic segmentation of remote sensing (RS) images is a challenging yet crucial task. While deep learning, particularly supervised learning with large-scale labeled datasets, has significantly advanced this field, acquiring high-quality labeled data is expensive and time-consuming. Additionally, variations in ground sampling distance, imaging equipment, and geographic differences cause domain shifts between datasets, which limit model performance across domains. Unsupervised domain adaptation (UDA) offers a solution by enabling models to learn from unlabeled target domain data while training on labeled source domain data. Recent self-supervised learning approaches using pseudo-label generation have shown promise in addressing domain discrepancies. Combining source and target images with their true and pseudo labels has proven effective in reducing domain bias. However, the use of pseudo-labeling for RS image segmentation is underexplored. Existing methods often rely on high-confidence pixel points as pseudo-labels, reducing supervision in low-confidence areas. Noise in pseudo-labels further weakens the model's ability to learn target domain semantics. While some methods assign confidence weights, noisy pseudo-labels remain an issue. To address these limitations, we propose integrating contrastive learning into UDA, enhancing the model's capacity to capture semantic information by maximizing the similarity between augmented views of the same image. This provides additional supervision to improve performance in the target domain. Extensive experiments on key RS datasets (Potsdam, Vaihingen, LoveDA) demonstrate that our SimSeg method outperforms existing approaches, achieving state-of-the-art results. Visualization and quantitative analyses confirm its superior ability to learn from the target domain. The code is available at \url{https://github.com/woldier/SiamSeg}.
- Abstract(参考訳): リモートセンシング(RS)画像のセマンティックセグメンテーションは難しいが重要な課題である。
ディープラーニング、特に大規模ラベル付きデータセットによる教師付き学習はこの分野を著しく進歩させてきたが、高品質ラベル付きデータの取得は高価で時間を要する。
さらに、地中サンプリング距離、撮像装置、地理的差異の変化は、ドメイン間のドメインシフトを引き起こし、ドメイン間のモデルパフォーマンスを制限する。
教師なしドメイン適応(UDA)は、ラベル付けされたソースドメインデータをトレーニングしながら、ラベル付けされていないターゲットドメインデータからモデルを学習可能にするソリューションを提供する。
擬似ラベル生成を用いた近年の自己教師型学習アプローチは,ドメインの相違に対処する上で有望であることを示す。
ソース画像とターゲット画像と、真のラベルと擬似ラベルを組み合わせることは、ドメインバイアスを減らすのに有効であることが証明されている。
しかし、RS画像のセグメント化に擬似ラベルを用いることは未定である。
既存の手法は、しばしば擬似ラベルとして高信頼画素点に依存し、低信頼領域の監督を減らす。
擬似ラベルのノイズは、ターゲットドメインの意味を学習するモデルの能力をさらに弱める。
信頼度を割り当てる手法もあるが、ノイズの多い擬似ラベルは依然として問題である。
これらの制約に対処するために、比較学習をUDAに統合し、同一画像の強化ビュー間の類似性を最大化することにより、意味情報を捕捉するモデルの能力を高めることを提案する。
これにより、ターゲットドメインのパフォーマンスを改善するための追加の監視が可能になる。
主要なRSデータセット(Potsdam、Vayhingen、LoveDA)に対する大規模な実験により、我々のSimSegメソッドは既存のアプローチよりも優れ、最先端の結果が得られます。
可視化と定量的分析により、対象領域から学習する優れた能力が確認される。
コードは \url{https://github.com/woldier/SiamSeg} で公開されている。
関連論文リスト
- AdaptDiff: Cross-Modality Domain Adaptation via Weak Conditional Semantic Diffusion for Retinal Vessel Segmentation [10.958821619282748]
本稿では、AdaptDiffという、教師なしドメイン適応(UDA)手法を提案する。
これにより、眼底撮影(FP)で訓練された網膜血管分割ネットワークが、目に見えないモダリティに対して満足な結果をもたらすことができる。
その結果,全データセットのセグメンテーション性能は大幅に向上した。
論文 参考訳(メタデータ) (2024-10-06T23:04:29Z) - Learning from Unlabelled Data with Transformers: Domain Adaptation for Semantic Segmentation of High Resolution Aerial Images [30.324252605889356]
我々は,未ラベル画像のセマンティックセグメンテーションのための新しいモデルを開発した。
NEOSは、ターゲットドメインが基底真理セマンティックセグメンテーションマスクを持っていないため、ドメイン適応を行う。
ターゲットドメインとソースドメイン間の不整合は、取得シーン、環境条件、センサー、時間の違いに起因する。
論文 参考訳(メタデータ) (2024-04-17T12:12:48Z) - Visual Foundation Models Boost Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation [17.875516787157018]
本研究では,2次元視覚基礎モデルから得られた知識を活用して,ラベルのない対象ドメインのより正確なラベルを生成する方法について検討する。
本手法は, 各種自律走行データセットを用いて評価し, 3次元セグメンテーションタスクにおいて有意な改善が得られた。
論文 参考訳(メタデータ) (2024-03-15T03:58:17Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Focus on Your Target: A Dual Teacher-Student Framework for
Domain-adaptive Semantic Segmentation [210.46684938698485]
意味的セグメンテーションのための教師なしドメイン適応(UDA)について検討する。
対象領域からのトレーニングサンプルの割合を減少・増加させることで,「学習能力」が強化・弱まることがわかった。
本稿では,DTS(Double teacher-student)フレームワークを提案し,双方向学習戦略を取り入れた。
論文 参考訳(メタデータ) (2023-03-16T05:04:10Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Contrastive Learning and Self-Training for Unsupervised Domain
Adaptation in Semantic Segmentation [71.77083272602525]
UDAはラベル付きソースドメインからラベルなしターゲットドメインへの効率的な知識伝達を試みている。
本稿では,領域にまたがるカテゴリ別センタロイドを適応させるコントラスト学習手法を提案する。
提案手法を自己学習で拡張し,メモリ効率の良い時間アンサンブルを用いて一貫性と信頼性の高い擬似ラベルを生成する。
論文 参考訳(メタデータ) (2021-05-05T11:55:53Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Domain Adaptation on Semantic Segmentation for Aerial Images [3.946367634483361]
セマンティックイメージセグメンテーションにおける領域シフトに対処する、新しい教師なしドメイン適応フレームワークを提案する。
また、ターゲット領域にエントロピー最小化を適用し、高信頼な予測を生成する。
様々な指標を用いて最先端手法の改善を示す。
論文 参考訳(メタデータ) (2020-12-03T20:58:27Z) - Emotional Semantics-Preserved and Feature-Aligned CycleGAN for Visual
Emotion Adaptation [85.20533077846606]
教師なしドメイン適応(UDA)は、あるラベル付きソースドメインで訓練されたモデルを別のラベル付きターゲットドメインに転送する問題を研究する。
本稿では,感情分布学習と支配的感情分類の両面での視覚的感情分析におけるUDAに着目した。
本稿では,CycleEmotionGAN++と呼ばれる,エンドツーエンドのサイクル整合対向モデルを提案する。
論文 参考訳(メタデータ) (2020-11-25T01:31:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。