論文の概要: Semi-supervised domain adaptation with CycleGAN guided by a downstream
task loss
- arxiv url: http://arxiv.org/abs/2208.08815v1
- Date: Thu, 18 Aug 2022 13:13:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-19 13:46:57.812992
- Title: Semi-supervised domain adaptation with CycleGAN guided by a downstream
task loss
- Title(参考訳): 下流タスク損失によるCycleGANによる半教師付きドメイン適応
- Authors: Annika M\"utze, Matthias Rottmann, Hanno Gottschalk
- Abstract要約: ドメイン適応は、ラベル付けが高価でエラーを起こしやすいタスクであるため、非常に興味深い。
画像から画像へのアプローチは、入力のシフトを軽減するために使用することができる。
本稿では、画像から画像へのドメイン適応アプローチにおいて、GANの「タスク認識」バージョンを提案する。
- 参考スコア(独自算出の注目度): 4.941630596191806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain adaptation is of huge interest as labeling is an expensive and
error-prone task, especially when labels are needed on pixel-level like in
semantic segmentation. Therefore, one would like to be able to train neural
networks on synthetic domains, where data is abundant and labels are precise.
However, these models often perform poorly on out-of-domain images. To mitigate
the shift in the input, image-to-image approaches can be used. Nevertheless,
standard image-to-image approaches that bridge the domain of deployment with
the synthetic training domain do not focus on the downstream task but only on
the visual inspection level. We therefore propose a "task aware" version of a
GAN in an image-to-image domain adaptation approach. With the help of a small
amount of labeled ground truth data, we guide the image-to-image translation to
a more suitable input image for a semantic segmentation network trained on
synthetic data (synthetic-domain expert). The main contributions of this work
are 1) a modular semi-supervised domain adaptation method for semantic
segmentation by training a downstream task aware CycleGAN while refraining from
adapting the synthetic semantic segmentation expert 2) the demonstration that
the method is applicable to complex domain adaptation tasks and 3) a less
biased domain gap analysis by using from scratch networks. We evaluate our
method on a classification task as well as on semantic segmentation. Our
experiments demonstrate that our method outperforms CycleGAN - a standard
image-to-image approach - by 7 percent points in accuracy in a classification
task using only 70 (10%) ground truth images. For semantic segmentation we can
show an improvement of about 4 to 7 percent points in mean Intersection over
union on the Cityscapes evaluation dataset with only 14 ground truth images
during training.
- Abstract(参考訳): ドメイン適応は、特にセマンティックセグメンテーションのようなピクセルレベルでラベルを必要とする場合、ラベル付けは高価でエラーを起こしやすいタスクであるため、非常に興味深い。
したがって、データが豊富でラベルが正確である合成ドメイン上でニューラルネットワークをトレーニングできることを望んでいる。
しかし、これらのモデルはドメイン外の画像ではよく機能しない。
入力のシフトを緩和するために、画像から画像へのアプローチが使用できる。
それでも、デプロイドメインを合成トレーニングドメインにブリッジする標準的なイメージ・ツー・イメージのアプローチは、下流タスクではなく、視覚検査レベルにのみフォーカスする。
そこで我々は、画像から画像へのドメイン適応アプローチにおいて、GANの「タスク認識」バージョンを提案する。
合成データ(合成ドメインエキスパート)を訓練した意味セグメンテーションネットワークにおいて,少量のラベル付き基底真理データを用いて,画像から画像への変換をより適切な入力画像に導く。
この作品の主な貢献は
1) セマンティックセグメンテーションの専門家の適応を避けつつ、下流タスク意識のCycleGANを訓練し、セマンティックセグメンテーションのためのモジュール型半教師付きドメイン適応法
2 この方法が複雑な領域適応作業に適用可能であるという実演及び
3)スクラッチネットワークを用いた偏りの少ないドメインギャップ解析。
分類タスクとセマンティックセグメンテーションに基づいて,本手法の評価を行った。
提案手法は,70(10%)の真理画像のみを用いた分類作業において,標準的なイメージ・イメージ・アプローチであるCycleGANの精度を7%向上させることを示した。
セマンティックセグメンテーションでは、トレーニング中に14の真理画像しか持たないCityscapes評価データセットの結合よりも平均4~7%の改善点を示すことができる。
関連論文リスト
- I2F: A Unified Image-to-Feature Approach for Domain Adaptive Semantic
Segmentation [55.633859439375044]
意味的セグメンテーションのための教師なしドメイン適応(UDA)は、重いアノテーション作業から人々を解放する有望なタスクである。
この問題に対処する主要なアイデアは、画像レベルと特徴レベルの両方を共同で実行することである。
本稿では,画像レベルと特徴レベルを統一したセマンティックセグメンテーションのための新しいUDAパイプラインを提案する。
論文 参考訳(メタデータ) (2023-01-03T15:19:48Z) - Unsupervised Domain Adaptation for Semantic Segmentation using One-shot
Image-to-Image Translation via Latent Representation Mixing [9.118706387430883]
超高解像度画像のセマンティックセグメンテーションのための新しい教師なし領域適応法を提案する。
潜在コンテンツ表現をドメイン間で混合するエンコーダ・デコーダの原理に基づいて,画像から画像への変換パラダイムを提案する。
都市間比較実験により,提案手法は最先端領域適応法より優れていることが示された。
論文 参考訳(メタデータ) (2022-12-07T18:16:17Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Edge-preserving Domain Adaptation for semantic segmentation of Medical
Images [0.0]
ドメイン適応は、目に見えない環境で大量のラベル付きデータの不足に対処する技術である。
本稿では,元の画像のエッジの詳細を維持しつつ,サイクル一貫性損失を用いてドメイン間を適応するモデルを提案する。
2つの眼底血管セグメンテーションデータセットの他のアプローチと比較することにより,本アルゴリズムの有効性を実証する。
論文 参考訳(メタデータ) (2021-11-18T18:14:33Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Consistency Regularization with High-dimensional Non-adversarial
Source-guided Perturbation for Unsupervised Domain Adaptation in Segmentation [15.428323201750144]
BiSIDAは、未ラベルのターゲットデータセットからの情報を効率的に活用するために、一貫性の正則化を採用している。
BiSIDAは、一般的に使われている2つの合成-実領域適応ベンチマーク上で、新しい最先端を実現する。
論文 参考訳(メタデータ) (2020-09-18T03:26:44Z) - Semantically Adaptive Image-to-image Translation for Domain Adaptation
of Semantic Segmentation [1.8275108630751844]
街路シーンのセマンティックセグメンテーションにおけるドメイン適応の問題に対処する。
最先端のアプローチの多くは、結果が入力とセマンティックに一致していることを示しながら、ソースイメージの翻訳に重点を置いている。
画像のセマンティクスを利用して翻訳アルゴリズムを導くことも提案する。
論文 参考訳(メタデータ) (2020-09-02T16:16:50Z) - FDA: Fourier Domain Adaptation for Semantic Segmentation [82.4963423086097]
本稿では,教師なし領域適応の簡易な手法について述べる。一方の低周波スペクトルを他方と交換することにより,音源と対象分布の相違を低減できる。
本手法を意味的セグメンテーション(semantic segmentation, 意味的セグメンテーション, 意味的セグメンテーション)で説明する。
以上の結果から,より高度な手法が学習に苦しむデータにおいて,単純な手順であってもニュアンス変動を低減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-11T22:20:48Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。