論文の概要: Dual Path Learning for Domain Adaptation of Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2108.06337v1
- Date: Fri, 13 Aug 2021 17:59:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-16 13:05:59.980155
- Title: Dual Path Learning for Domain Adaptation of Semantic Segmentation
- Title(参考訳): 意味セグメンテーションの領域適応のためのデュアルパス学習
- Authors: Yiting Cheng, Fangyun Wei, Jianmin Bao, Dong Chen, Fang Wen, Wenqiang
Zhang
- Abstract要約: セマンティックセグメンテーションのためのドメイン適応は、大規模なピクセル単位のアノテーションの必要性を軽減することができる。
視覚的不整合を緩和する新しいデュアルパス学習(DPL)フレームワークを提案する。
GTA5$rightarrow$CityscapesとSynTHIA$rightarrow$Cityscapesのシナリオの実験は、最先端の手法よりもDPLモデルの方が優れていることを示している。
- 参考スコア(独自算出の注目度): 31.239900187539806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain adaptation for semantic segmentation enables to alleviate the need for
large-scale pixel-wise annotations. Recently, self-supervised learning (SSL)
with a combination of image-to-image translation shows great effectiveness in
adaptive segmentation. The most common practice is to perform SSL along with
image translation to well align a single domain (the source or target).
However, in this single-domain paradigm, unavoidable visual inconsistency
raised by image translation may affect subsequent learning. In this paper,
based on the observation that domain adaptation frameworks performed in the
source and target domain are almost complementary in terms of image translation
and SSL, we propose a novel dual path learning (DPL) framework to alleviate
visual inconsistency. Concretely, DPL contains two complementary and
interactive single-domain adaptation pipelines aligned in source and target
domain respectively. The inference of DPL is extremely simple, only one
segmentation model in the target domain is employed. Novel technologies such as
dual path image translation and dual path adaptive segmentation are proposed to
make two paths promote each other in an interactive manner. Experiments on
GTA5$\rightarrow$Cityscapes and SYNTHIA$\rightarrow$Cityscapes scenarios
demonstrate the superiority of our DPL model over the state-of-the-art methods.
The code and models are available at: \url{https://github.com/royee182/DPL}
- Abstract(参考訳): セマンティックセグメンテーションのためのドメイン適応は、大規模なピクセル単位のアノテーションの必要性を軽減することができる。
近年,画像と画像の翻訳を組み合わせた自己教師あり学習(SSL)が適応的セグメンテーションにおいて大きな効果を示している。
最も一般的なプラクティスは、イメージ翻訳とともにSSLを実行し、単一のドメイン(ソースまたはターゲット)を適切に整列させることである。
しかし、この単一ドメインパラダイムでは、画像翻訳によって引き起こされる不可避な視覚不整合は、その後の学習に影響を与える可能性がある。
本稿では,ソース領域とターゲット領域で実行されるドメイン適応フレームワークが画像変換とsslの観点からほぼ相補的であるという観測に基づいて,視覚不整合を緩和する新しいデュアルパス学習(dpl)フレームワークを提案する。
具体的には、dplはソースドメインとターゲットドメインの2つの補完的かつインタラクティブな1ドメイン適応パイプラインを含んでいる。
dplの推論は非常に単純で、対象領域内の1つのセグメンテーションモデルのみを採用する。
2経路画像変換や2経路適応セグメンテーションといった新しい技術が提案され、2経路を相互に対話的に促進する。
GTA5$\rightarrow$CityscapesとSynTHIA$\rightarrow$Cityscapesのシナリオの実験は、最先端の手法よりもDPLモデルの方が優れていることを示している。
コードとモデルは、 \url{https://github.com/royee182/dpl} で利用可能である。
関連論文リスト
- Domain-Scalable Unpaired Image Translation via Latent Space Anchoring [88.7642967393508]
Unpaired Image-to-image Translation (UNIT)は、2つの視覚領域間の画像をペアのトレーニングデータなしでマッピングすることを目的としている。
そこで本研究では、潜在空間アンカーと呼ばれる新しい領域スケーリング可能なUNIT手法を提案する。
本手法は, 軽量エンコーダと回帰器モデルを学習することにより, 異なる領域の画像を, 凍ったGANと同じ潜伏空間に固定する。
推論フェーズでは、異なるドメインの学習エンコーダとデコーダを任意に組み合わせて、微調整なしで任意の2つのドメイン間で画像を変換することができる。
論文 参考訳(メタデータ) (2023-06-26T17:50:02Z) - Contrast, Stylize and Adapt: Unsupervised Contrastive Learning Framework
for Domain Adaptive Semantic Segmentation [18.843639142342642]
画素レベルと特徴レベルの両方で領域ギャップを埋めるためのコントラストFEaTureとpIxelアライメントを提案する。
提案手法はDeepLabV2を用いて既存の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-15T12:50:46Z) - I2F: A Unified Image-to-Feature Approach for Domain Adaptive Semantic
Segmentation [55.633859439375044]
意味的セグメンテーションのための教師なしドメイン適応(UDA)は、重いアノテーション作業から人々を解放する有望なタスクである。
この問題に対処する主要なアイデアは、画像レベルと特徴レベルの両方を共同で実行することである。
本稿では,画像レベルと特徴レベルを統一したセマンティックセグメンテーションのための新しいUDAパイプラインを提案する。
論文 参考訳(メタデータ) (2023-01-03T15:19:48Z) - Multi-domain Unsupervised Image-to-Image Translation with Appearance
Adaptive Convolution [62.4972011636884]
本稿では,MDUIT(Multi-domain unsupervised image-to-image translation)フレームワークを提案する。
我々は、分解されたコンテンツ特徴と外観適応的畳み込みを利用して、画像をターゲットの外観に変換する。
提案手法は,最先端の手法と比較して,複数の領域で視覚的に多様かつ妥当な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-02-06T14:12:34Z) - DSP: Dual Soft-Paste for Unsupervised Domain Adaptive Semantic
Segmentation [97.74059510314554]
セグメンテーションのための教師なしドメイン適応(UDA)は、ラベル付きソースドメインで訓練されたセグメンテーションモデルをラベル付きターゲットドメインに適応させることを目的としている。
既存の手法では、大きなドメインギャップに悩まされながら、ドメイン不変の特徴を学習しようとする。
本稿では,新しいDual Soft-Paste (DSP)法を提案する。
論文 参考訳(メタデータ) (2021-07-20T16:22:40Z) - Deep Symmetric Adaptation Network for Cross-modality Medical Image
Segmentation [40.95845629932874]
監視されていないドメイン適応(UDA)手法は、クロスモダリティ医療イメージセグメンテーションタスクで有望なパフォーマンスを示しています。
医療用画像セグメンテーションのためのUDAの新しいディープシンメトリーアーキテクチャを提案する。セグメンテーションサブネットワークと2つのシンメトリーソースとターゲットドメイン翻訳サブネットワークからなる。
本手法は,Cardiac と BraTS のセグメンテーションタスクにおける最先端手法と比較して,顕著な利点がある。
論文 参考訳(メタデータ) (2021-01-18T02:54:30Z) - Pixel-Level Cycle Association: A New Perspective for Domain Adaptive
Semantic Segmentation [169.82760468633236]
本稿では,ソースとターゲットの画素ペア間の画素レベルサイクルの関連性を構築することを提案する。
我々の手法は1段階のエンドツーエンドで訓練でき、追加のパラメータは導入しない。
論文 参考訳(メタデータ) (2020-10-31T00:11:36Z) - GMM-UNIT: Unsupervised Multi-Domain and Multi-Modal Image-to-Image
Translation via Attribute Gaussian Mixture Modeling [66.50914391679375]
unsupervised image-to-image translation (UNIT) は、未経験の訓練画像を用いて、複数の視覚領域間のマッピングを学習することを目的としている。
最近の研究は、複数のドメインで顕著な成功を示しているが、それらは2つの主要な制限に悩まされている。
GMM-UNITという,空間にGMMを組み込むコンテンツ属性不整合表現に基づく手法を提案する。
論文 参考訳(メタデータ) (2020-03-15T10:18:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。