論文の概要: Asymmetric GANs for Image-to-Image Translation
- arxiv url: http://arxiv.org/abs/1912.06931v2
- Date: Fri, 12 Jul 2024 12:34:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 05:46:45.338272
- Title: Asymmetric GANs for Image-to-Image Translation
- Title(参考訳): 画像間変換のための非対称GAN
- Authors: Hao Tang, Nicu Sebe,
- Abstract要約: GAN(Generative Adversarial Networks)の既存のモデルは、サイクル一貫性損失を使用して、ソースドメインからターゲットドメインへのマッピングを学習する。
非対称GANモデルを提案し、不等サイズと異なるパラメータ共有戦略の変換と再構成の両方を行う。
8つのデータセットを用いた教師付きおよび教師なし生成タスクの実験は、非対称GANが優れたモデルキャパシティとより良い生成性能を達成することを示す。
- 参考スコア(独自算出の注目度): 62.49892218126542
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing models for unsupervised image translation with Generative Adversarial Networks (GANs) can learn the mapping from the source domain to the target domain using a cycle-consistency loss. However, these methods always adopt a symmetric network architecture to learn both forward and backward cycles. Because of the task complexity and cycle input difference between the source and target domains, the inequality in bidirectional forward-backward cycle translations is significant and the amount of information between two domains is different. In this paper, we analyze the limitation of existing symmetric GANs in asymmetric translation tasks, and propose an AsymmetricGAN model with both translation and reconstruction generators of unequal sizes and different parameter-sharing strategy to adapt to the asymmetric need in both unsupervised and supervised image translation tasks. Moreover, the training stage of existing methods has the common problem of model collapse that degrades the quality of the generated images, thus we explore different optimization losses for better training of AsymmetricGAN, making image translation with higher consistency and better stability. Extensive experiments on both supervised and unsupervised generative tasks with 8 datasets show that AsymmetricGAN achieves superior model capacity and better generation performance compared with existing GANs. To the best of our knowledge, we are the first to investigate the asymmetric GAN structure on both unsupervised and supervised image translation tasks.
- Abstract(参考訳): GAN(Generative Adversarial Networks)による教師なし画像翻訳の既存のモデルは、サイクル一貫性損失を用いて、ソースドメインからターゲットドメインへのマッピングを学習することができる。
しかし、これらの手法は常に対称なネットワークアーキテクチャを採用し、前方と後方の両方のサイクルを学習する。
ソースとターゲットドメイン間のタスク複雑性とサイクル入力差のため、双方向の前後のサイクル翻訳の不等式が重要であり、2つのドメイン間の情報量が異なる。
本稿では、非対称翻訳タスクにおける既存の対称GANの制限を解析し、非対称画像翻訳タスクと教師なし画像翻訳タスクの両方において非対称的なニーズに対応するために、非対称GANモデルを提案する。
さらに、既存の手法の訓練段階には、生成した画像の品質を劣化させるようなモデル崩壊の一般的な問題があり、したがって、非対称GANのトレーニングを改善するために、異なる最適化損失を探索し、一貫性と安定性を向上する。
8つのデータセットを用いた教師付きおよび教師なし生成タスクの広範な実験は、AsymmetricGANが既存のGANと比較して優れたモデルキャパシティと生成性能を達成することを示す。
我々の知る限りでは、教師なしと教師なしの両方の画像翻訳タスクにおいて、非対称なGAN構造を調査するのは初めてである。
関連論文リスト
- On the Importance of Asymmetry for Siamese Representation Learning [53.86929387179092]
シームズネットワークは、2つの並列エンコーダと概念的に対称である。
ネットワーク内の2つのエンコーダを明確に区別することで,非対称性の重要性について検討する。
非対称設計による改善は、より長いトレーニングスケジュール、複数の他のフレームワーク、より新しいバックボーンに一般化されている。
論文 参考訳(メタデータ) (2022-04-01T17:57:24Z) - ResiDualGAN: Resize-Residual DualGAN for Cross-Domain Remote Sensing
Images Semantic Segmentation [15.177834801688979]
アノテーション付きデータセットで事前訓練されたリモートセンシング(RS)画像のセマンティックセグメンテーションモデルの性能は、ドメインギャップのため、他のアノテーションなしデータセットでテストすると大幅に低下する。
画素レベルのドメインギャップを最小限に抑えるために、DualGANなどの逆生成法が未ペア画像から画像への変換に利用される。
本稿では,RS画像の変換においてResiDualGANを提案する。
論文 参考訳(メタデータ) (2022-01-27T13:56:54Z) - Adverse Weather Image Translation with Asymmetric and Uncertainty-aware
GAN [16.80284837186338]
逆気象画像変換は、教師なし画像画像変換タスク(I2I)に属する。
Geneversarative Adrial Networks (GAN) はI2I翻訳において顕著な成功を収めた。
本稿では,非対称なドメイン翻訳アーキテクチャを持つ新しいGANモデル,すなわちAU-GANを提案する。
論文 参考訳(メタデータ) (2021-12-08T13:41:24Z) - Unsupervised Image-to-Image Translation via Pre-trained StyleGAN2
Network [73.5062435623908]
本稿では,一連のモデル変換によって対象領域に新たなモデルを生成する新しいI2I翻訳手法を提案する。
潜在ベクトルを生成されたモデルに入力することで、ソースドメインとターゲットドメインの間でI2I翻訳を行うことができる。
論文 参考訳(メタデータ) (2020-10-12T13:51:40Z) - StereoGAN: Bridging Synthetic-to-Real Domain Gap by Joint Optimization
of Domain Translation and Stereo Matching [56.95846963856928]
大規模な合成データセットはステレオマッチングに有用であるが、通常は既知のドメインバイアスを導入する。
本稿では,ドメイン翻訳とステレオマッチングネットワークを用いたエンドツーエンドのトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-05T03:11:38Z) - Group Equivariant Generative Adversarial Networks [7.734726150561089]
本研究では,グループ同変畳み込みネットワークを通じて,帰納的対称性をネットワークアーキテクチャに明示的に組み込む。
群変換はより表現力が高く、サンプルが少ないため、ジェネレータと判別器の間の勾配フィードバックが向上する。
論文 参考訳(メタデータ) (2020-05-04T17:38:49Z) - Structured Domain Adaptation with Online Relation Regularization for
Unsupervised Person Re-ID [62.90727103061876]
Unsupervised Domain adapt(UDA)は、ラベル付きソースドメインデータセットでトレーニングされたモデルを、ラベルなしのターゲットドメインデータセットに適応させることを目的としている。
本稿では,オンライン関係整合性正規化項を用いたエンドツーエンドなドメイン適応フレームワークを提案する。
提案手法は,複数のUDAタスクにおける人物再IDの最先端性能を実現することを目的としている。
論文 参考訳(メタデータ) (2020-03-14T14:45:18Z) - Augmented Cyclic Consistency Regularization for Unpaired Image-to-Image
Translation [22.51574923085135]
CCR(Augmented Cyclic Consistency Regularization)は、未ペアI2I翻訳の新しい正規化手法である。
本手法は実世界の翻訳における整合性正規化GAN(CR-GAN)よりも優れる。
論文 参考訳(メタデータ) (2020-02-29T06:20:20Z) - Structured GANs [91.3755431537592]
対称的なGANを顔画像合成に適用して、異なる量の対称性を持つ新しい顔を生成する。
また,ワンショットファインチューニングという新しい概念に基づいて,教師なしの顔回転機能を提案する。
論文 参考訳(メタデータ) (2020-01-15T10:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。