論文の概要: Augmented Cyclic Consistency Regularization for Unpaired Image-to-Image
Translation
- arxiv url: http://arxiv.org/abs/2003.00187v2
- Date: Mon, 12 Oct 2020 16:07:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 20:15:54.352659
- Title: Augmented Cyclic Consistency Regularization for Unpaired Image-to-Image
Translation
- Title(参考訳): アンペア画像から画像への変換のための周期整合規則化
- Authors: Takehiko Ohkawa, Naoto Inoue, Hirokatsu Kataoka, Nakamasa Inoue
- Abstract要約: CCR(Augmented Cyclic Consistency Regularization)は、未ペアI2I翻訳の新しい正規化手法である。
本手法は実世界の翻訳における整合性正規化GAN(CR-GAN)よりも優れる。
- 参考スコア(独自算出の注目度): 22.51574923085135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unpaired image-to-image (I2I) translation has received considerable attention
in pattern recognition and computer vision because of recent advancements in
generative adversarial networks (GANs). However, due to the lack of explicit
supervision, unpaired I2I models often fail to generate realistic images,
especially in challenging datasets with different backgrounds and poses. Hence,
stabilization is indispensable for GANs and applications of I2I translation.
Herein, we propose Augmented Cyclic Consistency Regularization (ACCR), a novel
regularization method for unpaired I2I translation. Our main idea is to enforce
consistency regularization originating from semi-supervised learning on the
discriminators leveraging real, fake, reconstructed, and augmented samples. We
regularize the discriminators to output similar predictions when fed pairs of
original and perturbed images. We qualitatively clarify why consistency
regularization on fake and reconstructed samples works well. Quantitatively,
our method outperforms the consistency regularized GAN (CR-GAN) in real-world
translations and demonstrates efficacy against several data augmentation
variants and cycle-consistent constraints.
- Abstract(参考訳): I2I翻訳はGAN(Generative Adversarial Network)の最近の進歩により,パターン認識とコンピュータビジョンに大きな注目を集めている。
しかしながら、明示的な監督が欠如しているため、未ペアのI2Iモデルは、特に異なる背景とポーズを持つ挑戦的なデータセットにおいて、現実的なイメージの生成に失敗することが多い。
したがって、GANやI2I翻訳の応用には安定化が不可欠である。
本稿では、未ペアI2I翻訳の新しい正規化手法であるAugmented Cyclic Consistency Regularization (ACCR)を提案する。
我々の基本的な考え方は、実際の、偽の、再構築された、強化されたサンプルを活用する識別器に関する半教師付き学習から生じる一貫性の規則化を強制することである。
識別器を正則化し、オリジナル画像と摂動画像のペアを供給した場合に類似の予測を出力する。
疑似サンプルと再構成サンプルの整合正則化がうまく機能する理由を質的に明らかにする。
本手法は実世界の翻訳における整合性正規化GAN(CR-GAN)よりも優れ,複数のデータ拡張変異とサイクル一貫性制約に対して有効であることを示す。
関連論文リスト
- UTSGAN: Unseen Transition Suss GAN for Transition-Aware Image-to-image
Translation [57.99923293611923]
我々はI2Iトランスフォーメーションに対してトランジッションアウェアアプローチを導入し、データトランスフォーメーションマッピングをトランジッション変数で明示的にパラメータ化する。
本稿では、遷移変数に定義された遷移整合性を利用することにより、観測されていない翻訳における整合性の正規化を可能にする。
これらの知見に基づき、遷移エンコーダを用いた遷移のための多様体を構成する生成フレームワークである Unseen transition Suss GAN (UTSGAN) を提案する。
論文 参考訳(メタデータ) (2023-04-24T09:47:34Z) - Spectral Normalization and Dual Contrastive Regularization for
Image-to-Image Translation [9.029227024451506]
二重コントラスト正規化とスペクトル正規化に基づく新しい未ペアI2I翻訳フレームワークを提案する。
SN-DCRの有効性を評価するための総合的な実験を行い、本手法が複数のタスクにおいてSOTAを実現することを実証した。
論文 参考訳(メタデータ) (2023-04-22T05:22:24Z) - Anticipating the Unseen Discrepancy for Vision and Language Navigation [63.399180481818405]
視覚言語ナビゲーションでは、エージェントは特定のターゲットに到達するために自然言語命令に従う必要がある。
目に見える環境と目に見えない環境の間に大きな違いがあるため、エージェントがうまく一般化することは困難である。
本研究では,テストタイムの視覚的整合性を促進することによって,未知の環境への一般化を学習する,未知の離散性予測ビジョンと言語ナビゲーション(DAVIS)を提案する。
論文 参考訳(メタデータ) (2022-09-10T19:04:40Z) - ResiDualGAN: Resize-Residual DualGAN for Cross-Domain Remote Sensing
Images Semantic Segmentation [15.177834801688979]
アノテーション付きデータセットで事前訓練されたリモートセンシング(RS)画像のセマンティックセグメンテーションモデルの性能は、ドメインギャップのため、他のアノテーションなしデータセットでテストすると大幅に低下する。
画素レベルのドメインギャップを最小限に抑えるために、DualGANなどの逆生成法が未ペア画像から画像への変換に利用される。
本稿では,RS画像の変換においてResiDualGANを提案する。
論文 参考訳(メタデータ) (2022-01-27T13:56:54Z) - Smoothing the Disentangled Latent Style Space for Unsupervised
Image-to-Image Translation [56.55178339375146]
イメージ・ツー・イメージ(I2I)マルチドメイン翻訳モデルは通常、セマンティックな結果の品質を用いて評価される。
本稿では,翻訳ネットワークがスムーズでゆがみのあるラテントスタイル空間を学習するのに役立つ,3つの特定の損失に基づく新たなトレーニングプロトコルを提案する。
論文 参考訳(メタデータ) (2021-06-16T17:58:21Z) - Generative Transition Mechanism to Image-to-Image Translation via
Encoded Transformation [40.11493448767101]
I2I(Image-to-Image)翻訳問題をトランジション整合性で再検討する。
既存のI2I翻訳モデルは、主に結果の一貫性の維持に焦点を当てています。
i2i翻訳では結果整合性とトランジッション一貫性を両立させる。
論文 参考訳(メタデータ) (2021-03-09T02:56:03Z) - Structured Domain Adaptation with Online Relation Regularization for
Unsupervised Person Re-ID [62.90727103061876]
Unsupervised Domain adapt(UDA)は、ラベル付きソースドメインデータセットでトレーニングされたモデルを、ラベルなしのターゲットドメインデータセットに適応させることを目的としている。
本稿では,オンライン関係整合性正規化項を用いたエンドツーエンドなドメイン適応フレームワークを提案する。
提案手法は,複数のUDAタスクにおける人物再IDの最先端性能を実現することを目的としている。
論文 参考訳(メタデータ) (2020-03-14T14:45:18Z) - When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である
本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。
ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-02-24T11:35:28Z) - Asymmetric GANs for Image-to-Image Translation [62.49892218126542]
GAN(Generative Adversarial Networks)の既存のモデルは、サイクル一貫性損失を使用して、ソースドメインからターゲットドメインへのマッピングを学習する。
非対称GANモデルを提案し、不等サイズと異なるパラメータ共有戦略の変換と再構成の両方を行う。
8つのデータセットを用いた教師付きおよび教師なし生成タスクの実験は、非対称GANが優れたモデルキャパシティとより良い生成性能を達成することを示す。
論文 参考訳(メタデータ) (2019-12-14T21:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。