論文の概要: A Unified f-divergence Framework Generalizing VAE and GAN
- arxiv url: http://arxiv.org/abs/2205.05214v1
- Date: Wed, 11 May 2022 00:20:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-13 08:34:37.271826
- Title: A Unified f-divergence Framework Generalizing VAE and GAN
- Title(参考訳): VAEとGANを一般化した統一f分割フレームワーク
- Authors: Jaime Roquero Gimenez and James Zou
- Abstract要約: f-GMはf-ダイバージェンス生成モデルのための統一的なフレームワークである。
VAEとf-GANの両方を組み込み、一般のf-ディバージェンスによる学習を可能にする。
- 参考スコア(独自算出の注目度): 16.84514071516379
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing deep generative models that flexibly incorporate diverse measures
of probability distance is an important area of research. Here we develop an
unified mathematical framework of f-divergence generative model, f-GM, that
incorporates both VAE and f-GAN, and enables tractable learning with general
f-divergences. f-GM allows the experimenter to flexibly design the f-divergence
function without changing the structure of the networks or the learning
procedure. f-GM jointly models three components: a generator, a inference
network and a density estimator. Therefore it simultaneously enables sampling,
posterior inference of the latent variable as well as evaluation of the
likelihood of an arbitrary datum. f-GM belongs to the class of encoder-decoder
GANs: our density estimator can be interpreted as playing the role of a
discriminator between samples in the joint space of latent code and observed
space. We prove that f-GM naturally simplifies to the standard VAE and to f-GAN
as special cases, and illustrates the connections between different
encoder-decoder GAN architectures. f-GM is compatible with general network
architecture and optimizer. We leverage it to experimentally explore the
effects -- e.g. mode collapse and image sharpness -- of different choices of
f-divergence.
- Abstract(参考訳): 確率距離の多様な尺度を柔軟に取り入れる深層生成モデルの開発は重要な研究分野である。
本稿では, VAEとf-GANの両方を組み込んだf-divergence生成モデルの統一的な数学的枠組みを開発し,一般のf-divergencesによる学習を可能にする。
f-GMにより、ネットワークの構造や学習手順を変更することなく、実験者がf分割関数を柔軟に設計することができる。
f-GMは、ジェネレータ、推論ネットワーク、密度推定器の3つのコンポーネントを共同でモデル化する。
したがって、潜在変数のサンプリング、後方推定、および任意のデータムの可能性の評価を同時に行うことができる。
f-GM はエンコーダ・デコーダ GAN のクラスに属する:我々の密度推定器は、潜在符号と観測空間の結合空間におけるサンプル間の判別器の役割を担っていると解釈できる。
本稿では,f-GM が標準 VAE と f-GAN を特殊ケースとして自然に単純化し,異なるエンコーダ・デコーダ GAN アーキテクチャ間の接続を示す。
f-GMは一般的なネットワークアーキテクチャとオプティマイザと互換性がある。
我々はこれを応用して、f-発散の異なる選択のモード崩壊や画像のシャープネスといった効果を実験的に探索する。
関連論文リスト
- Unified Generation, Reconstruction, and Representation: Generalized Diffusion with Adaptive Latent Encoding-Decoding [90.77521413857448]
深層生成モデルは,3つのコア機能 – 新たなインスタンスの生成,入力の再構築,コンパクト表現の学習 – に固定されている。
一般化逆変換拡散確率モデル(EDDPM)を導入する。
EDDPMはパラメタライズされた符号化復号を導入することで標準拡散におけるガウス雑音化を一般化する。
テキスト、タンパク質、画像の実験は、多様なデータやタスクを扱う柔軟性を示している。
論文 参考訳(メタデータ) (2024-02-29T10:08:57Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - The Transitive Information Theory and its Application to Deep Generative
Models [0.0]
変分オートエンコーダ(VAE)は2つの反対方向に押される。
既存の方法では、圧縮と再構成の間のレート歪みのトレードオフに問題を絞り込む。
一般化のために学習した表現を再結合する機構とともに,非交叉表現の階層構造を学習するシステムを開発する。
論文 参考訳(メタデータ) (2022-03-09T22:35:02Z) - A Method for Evaluating Deep Generative Models of Images via Assessing
the Reproduction of High-order Spatial Context [9.00018232117916]
GAN(Generative Adversarial Network)は、広く使われているDGMの一種である。
本稿では,2つのGANアーキテクチャによって出力される画像の客観的なテストについて述べる。
我々は、訓練されたGANによって生成した画像の特徴を再現できるいくつかのコンテキストモデル(SCM)を設計した。
論文 参考訳(メタデータ) (2021-11-24T15:58:10Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z) - Deep Autoencoding Topic Model with Scalable Hybrid Bayesian Inference [55.35176938713946]
我々は、ガンマ分布の階層構造を用いて、その多確率層生成ネットワークを構築するディープ・オートエンコーディング・トピック・モデル(DATM)を開発した。
Weibull上向き変分エンコーダを提案する。このエンコーダは深層ニューラルネットワークを介して情報を上向きに伝播し,次いで下向き生成モデルを提案する。
大規模コーパス上での教師なしおよび教師なしの学習タスクにおいて,モデルの有効性とスケーラビリティを実証した。
論文 参考訳(メタデータ) (2020-06-15T22:22:56Z) - Reciprocal Adversarial Learning via Characteristic Functions [12.961770002117142]
GAN(Generative Adversarial Nets)は、複雑な分散を伴うタスクに好まれるツールである。
特徴関数(CF)を用いて分布を時間ではなく時間的に比較する方法を示す。
次に、逆数が存在する場合の埋め込み領域とデータ領域の等価性を証明し、自動エンコーダ構造で自然にGANを開発する。
この効率的な構造は、単純なトレーニング戦略とともに2つのモジュールのみを使用して、双方向で鮮明な画像を生成する。
論文 参考訳(メタデータ) (2020-06-15T14:04:55Z) - Generalized Adversarially Learned Inference [42.40405470084505]
我々は、画像生成器とエンコーダを逆向きにトレーニングし、画像と潜時ベクトル対の2つの結合分布を一致させることにより、GAN内の潜時変数を推定する方法を開発した。
我々は、望まれるソリューションに関する事前または学習知識に基づいて、再構築、自己監督、その他の形式の監督に関する複数のフィードバック層を組み込んだ。
論文 参考訳(メタデータ) (2020-06-15T02:18:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。