論文の概要: GMM-Based Generative Adversarial Encoder Learning
- arxiv url: http://arxiv.org/abs/2012.04525v1
- Date: Tue, 8 Dec 2020 16:12:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:34:31.749691
- Title: GMM-Based Generative Adversarial Encoder Learning
- Title(参考訳): GMMに基づく生成逆エンコーダ学習
- Authors: Yuri Feigin and Hedva Spitzer and Raja Giryes
- Abstract要約: GANのジェネレーション機能とエンコーダを組み合わせたシンプルなアーキテクチャのセットアップを紹介します。
GMMを介してエンコーダ潜時空間の出力をモデル化し、この潜時空間を用いた良好なクラスタリングとGANによる画像生成の改善の両方をもたらす。
- 参考スコア(独自算出の注目度): 39.57350884615545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While GAN is a powerful model for generating images, its inability to infer a
latent space directly limits its use in applications requiring an encoder. Our
paper presents a simple architectural setup that combines the generative
capabilities of GAN with an encoder. We accomplish this by combining the
encoder with the discriminator using shared weights, then training them
simultaneously using a new loss term. We model the output of the encoder latent
space via a GMM, which leads to both good clustering using this latent space
and improved image generation by the GAN. Our framework is generic and can be
easily plugged into any GAN strategy. In particular, we demonstrate it both
with Vanilla GAN and Wasserstein GAN, where in both it leads to an improvement
in the generated images in terms of both the IS and FID scores. Moreover, we
show that our encoder learns a meaningful representation as its clustering
results are competitive with the current GAN-based state-of-the-art in
clustering.
- Abstract(参考訳): GANは画像を生成する強力なモデルであるが、遅延空間を推論できないため、エンコーダを必要とするアプリケーションでは直接使用が制限される。
本稿では,ganの生成能力とエンコーダを組み合わせたシンプルなアーキテクチャ構成を提案する。
共有重みを用いてエンコーダと判別器を組み合わせることでこれを達成し、新たな損失項を用いて同時に訓練する。
GMMを用いてエンコーダ潜在空間の出力をモデル化し、この潜在空間を用いた優れたクラスタリングと、GANによる画像生成の改善を両立させる。
私たちのフレームワークは汎用的で、あらゆるgan戦略に簡単にプラグインできます。
特に、我々はVanilla GAN と Wasserstein GAN でこれを実証し、どちらもIS と FID のスコアで生成された画像の改善につながっている。
さらに,クラスタ化の結果が現在のganベースのクラスタリングの最先端と競合するため,エンコーダは有意義な表現を学習することを示した。
関連論文リスト
- In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - GIU-GANs: Global Information Utilization for Generative Adversarial
Networks [3.3945834638760948]
本稿では,Involution Generative Adversarial Networks (GIU-GANs) と呼ばれる新しいGANを提案する。
GIU-GANは、Squeeze-and-Excitation Networks (SENet)とInvolutionを統合したGlobal Information utilization (GIU)モジュールと呼ばれる新しいモジュールを利用している。
バッチ正規化(BN)は、ジェネレータがサンプリングしたノイズ間の表現差を必然的に無視し、生成した画質を劣化させる。
論文 参考訳(メタデータ) (2022-01-25T17:17:15Z) - Information-theoretic stochastic contrastive conditional GAN:
InfoSCC-GAN [6.201770337181472]
本稿では,探索可能な潜伏空間を有するコントラスト条件生成対向ネットワーク(Info SCC-GAN)を提案する。
インフォメーションSCC-GANは、入力データと潜時空間表現の間の相互情報の情報理論的定式化に基づいて導出される。
実験により、Info SCC-GANはAFHQとCelebAデータセットの画像生成において、"vanilla" EigenGANよりも優れていることが示された。
論文 参考訳(メタデータ) (2021-12-17T17:56:30Z) - DGL-GAN: Discriminator Guided Learning for GAN Compression [57.6150859067392]
高計算コストのGAN(Generative Adversarial Networks)は、ランダムノイズから高分解能画像を合成する際、顕著な成果を上げている。
本稿では,bf DGL-GAN と呼ばれるバニラ bf GAN を圧縮するための,新しい単純な bf 識別器 bf 誘導 bf 学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-13T09:24:45Z) - DO-GAN: A Double Oracle Framework for Generative Adversarial Networks [28.904057977044374]
GAN(Generative Adversarial Networks)を育成するための新しいアプローチを提案します。
私たちはgeneratorとdiscriminator oraclesを使ってダブルoracleフレームワークをデプロイします。
我々は、バニラGAN、ディープ・コンボリューショナルGAN、スペクトル正規化GAN、スタックドGANなどの確立されたGANアーキテクチャに適用する。
論文 参考訳(メタデータ) (2021-02-17T05:11:18Z) - Positional Encoding as Spatial Inductive Bias in GANs [97.6622154941448]
SinGANは限られた有効な受容器分野にもかかわらず内部パッチ配分の学習の印象的な機能を示します。
本研究では,発電機のパディングゼロ時における暗黙的位置符号化によって,このような能力が大幅にもたらされることを示した。
本稿では,新しいマルチスケール学習戦略を提案し,その効果を最新型無条件発電機stylegan2で実証する。
論文 参考訳(メタデータ) (2020-12-09T18:27:16Z) - Generate High Resolution Images With Generative Variational Autoencoder [0.0]
本稿では,高解像度画像を生成する新しいニューラルネットワークを提案する。
エンコーダをそのまま使用しながら,VAEのデコーダを識別器に置き換える。
我々は、MNIST、LSUN、CelebAの3つの異なるデータセットでネットワークを評価した。
論文 参考訳(メタデータ) (2020-08-12T20:15:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。