論文の概要: dp-GAN : Alleviating Mode Collapse in GAN via Diversity Penalty Module
- arxiv url: http://arxiv.org/abs/2108.02353v1
- Date: Thu, 5 Aug 2021 03:41:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-07 00:06:31.633071
- Title: dp-GAN : Alleviating Mode Collapse in GAN via Diversity Penalty Module
- Title(参考訳): dp-GAN : ダイバーシティペナルティモジュールによるGANのモード崩壊軽減
- Authors: Sen Pei, Richard Yi Da Xu, Gaofeng Meng
- Abstract要約: 我々は,GANのモード崩壊を軽減するために,多様性ペナルティ(dp)と呼ばれるプラグ可能なブロックを導入する。
特徴空間における画像対の類似性、すなわち2つの潜在ベクトルが異なる場合、生成元に異なる特徴を持つ2つの画像を生成するように強制する。
- 参考スコア(独自算出の注目度): 24.857322699576997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The vanilla GAN [5] suffers from mode collapse deeply, which usually
manifests as that the images generated by generators tend to have a high
similarity amongst them, even though their corresponding latent vectors have
been very different. In this paper, we introduce a pluggable block called
diversity penalty (dp) to alleviate mode collapse of GANs. It is used to reduce
the similarity of image pairs in feature space, i.e., if two latent vectors are
different, then we enforce the generator to generate two images with different
features. The normalized Gram Matrix is used to measure the similarity. We
compare the proposed method with Unrolled GAN [17], BourGAN [26], PacGAN [14],
VEEGAN [23] and ALI [4] on 2D synthetic dataset, and results show that our
proposed method can help GAN capture more modes of the data distribution.
Further, we apply this penalty term into image data augmentation on MNIST,
Fashion-MNIST and CIFAR-10, and the testing accuracy is improved by 0.24%,
1.34% and 0.52% compared with WGAN GP [6], respectively. Finally, we
quantitatively evaluate the proposed method with IS and FID on CelebA,
CIFAR-10, MNIST and Fashion-MNIST. Results show that our method gets much
higher IS and lower FID compared with some current GAN architectures.
- Abstract(参考訳): バニラ GAN [5] はモード崩壊に深く悩まされ、通常、ジェネレータによって生成された画像は、対応する潜伏ベクトルが非常に異なるにもかかわらず、それらの間に高い類似性を持つ傾向にある。
本稿では,GANのモード崩壊を軽減するために,多様性ペナルティ(dp)と呼ばれるプラグ可能なブロックを導入する。
特徴空間における画像対の類似性、すなわち2つの潜在ベクトルが異なる場合、生成元に異なる特徴を持つ2つの画像を生成するように強制する。
正規化グラム行列は類似度を測定するために用いられる。
提案手法を2次元合成データセット上で,Unrolled GAN [17], BourGAN [26], PacGAN [14], VEEGAN [23], ALI [4]と比較し, 提案手法がデータ分布のより多くのモードを捉えるのに役立つことを示す。
さらに, このペナルティ項をMNIST, Fashion-MNIST, CIFAR-10上の画像データ拡張に適用し, WGAN GP [6] と比較して0.24%, 1.34%, 0.52%の改善を行った。
最後に,提案手法をCelebA, CIFAR-10, MNIST, Fashion-MNISTで定量的に評価した。
その結果,本手法は現在のGANアーキテクチャと比較して,ISとFIDがはるかに高いことがわかった。
関連論文リスト
- One-step Diffusion with Distribution Matching Distillation [54.723565605974294]
本稿では,拡散モデルを1ステップ画像生成器に変換する手法である分散マッチング蒸留(DMD)を紹介する。
約KLの発散を最小化することにより,拡散モデルと分布レベルで一致した一段階画像生成装置を強制する。
提案手法は,イメージネット64x64では2.62 FID,ゼロショットCOCO-30kでは11.49 FIDに到達した。
論文 参考訳(メタデータ) (2023-11-30T18:59:20Z) - Gaussian Mixture Solvers for Diffusion Models [84.83349474361204]
本稿では,拡散モデルのためのGMSと呼ばれる,SDEに基づく新しい解法について紹介する。
画像生成およびストロークベース合成におけるサンプル品質の観点から,SDEに基づく多くの解法よりも優れる。
論文 参考訳(メタデータ) (2023-11-02T02:05:38Z) - SDDM: Score-Decomposed Diffusion Models on Manifolds for Unpaired
Image-to-Image Translation [96.11061713135385]
本研究は,画像生成時の絡み合った分布を明示的に最適化する,新しいスコア分解拡散モデルを提案する。
我々は、スコア関数の精製部分とエネルギー誘導を等しくし、多様体上の多目的最適化を可能にする。
SDDMは既存のSBDMベースの手法よりも優れており、I2Iベンチマークでは拡散ステップがはるかに少ない。
論文 参考訳(メタデータ) (2023-08-04T06:21:57Z) - CHIMLE: Conditional Hierarchical IMLE for Multimodal Conditional Image
Synthesis [5.7789164588489035]
条件付き画像合成における永続的な課題は、同じ入力画像から多様な出力画像を生成することである。
モード崩壊を克服できるImplicit Conditional Likelihood Estimation Maximum(IMLE)を利用する。
高忠実度画像を生成するために、従来のIMLEベースの手法では大量のサンプルを必要とするが、これは高価である。
画像の忠実度とモードカバレッジの点で,CHIMLEは,先行する最高のIMLE,GAN,拡散に基づく手法よりも優れていた。
論文 参考訳(メタデータ) (2022-11-25T18:41:44Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - New Perspective on Progressive GANs Distillation for One-class Novelty
Detection [21.90786581579228]
Thecoder-Decoder-Encoder scheme (EDE-GAN) に基づくジェネレーティブ・アドバイサル・ネットワークは最先端の性能を実現する。
新しい技術、P-KDGAN(Progressive Knowledge Distillation with GAN)は、設計された蒸留損失を通じて2つの標準GANを接続する。
2段階のプログレッシブ・ラーニングは、シングルステップ・アプローチよりも成績が向上し、学生のGANのパフォーマンスを継続的に向上させる。
論文 参考訳(メタデータ) (2021-09-15T13:45:30Z) - GANs with Variational Entropy Regularizers: Applications in Mitigating
the Mode-Collapse Issue [95.23775347605923]
深層学習の成功に基づいて、GAN(Generative Adversarial Networks)は、観測されたサンプルから確率分布を学習するための現代的なアプローチを提供する。
GANはしばしば、ジェネレータが入力分布の既存のすべてのモードをキャプチャできないモード崩壊問題に悩まされる。
情報理論のアプローチを採り、生成したサンプルのエントロピーの変動的下限を最大化し、それらの多様性を増大させる。
論文 参考訳(メタデータ) (2020-09-24T19:34:37Z) - Discriminator Contrastive Divergence: Semi-Amortized Generative Modeling
by Exploring Energy of the Discriminator [85.68825725223873]
GAN(Generative Adversarial Networks)は、高次元データのモデリングにおいて大きな可能性を秘めている。
本稿では,WGANの識別器の特性を活かした識別器コントラストの多様性について紹介する。
我々は、合成データと実世界の画像生成ベンチマークの両方において、大幅に改善された生成の利点を実証する。
論文 参考訳(メタデータ) (2020-04-05T01:50:16Z) - Hierarchical Modes Exploring in Generative Adversarial Networks [14.557204104822215]
条件付き生成逆数ネットワーク(cGAN)では、2つの異なる初期ノイズが同じ条件情報とペアリングされた場合、マイナーモードは大きなモードに崩壊する可能性がある。
正規化項として目的関数に多様性測定を導入することにより,cGANのモード崩壊を軽減する階層型モード探索法を提案する。
論文 参考訳(メタデータ) (2020-03-05T10:43:50Z) - Conditional Deep Gaussian Processes: multi-fidelity kernel learning [6.599344783327053]
固定された低忠実度データにより遅延GPを直接支持する条件付きDGPモデルを提案する。
合成および高次元データを用いた実験は、他の多次元回帰法と同等の性能を示す。
低忠実度データと階層DGP構造により、実効カーネルは真関数の帰納バイアスを符号化する。
論文 参考訳(メタデータ) (2020-02-07T14:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。