論文の概要: Hierarchical VAE with a Diffusion-based VampPrior
- arxiv url: http://arxiv.org/abs/2412.01373v1
- Date: Mon, 02 Dec 2024 10:58:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:50:19.240232
- Title: Hierarchical VAE with a Diffusion-based VampPrior
- Title(参考訳): 拡散型VampPriorを用いた階層型VAE
- Authors: Anna Kuzina, Jakub M. Tomczak,
- Abstract要約: 拡散に基づく後方前葉の変動混合(VampPrior)を用いた階層型VAEの導入
提案手法により,従来の VampPrior の動作や,その他の階層的なVAE と比較して,パフォーマンスが向上する。
提案手法を標準ベンチマークデータセット上で実証的に検証し,トレーニング安定性の向上と遅延空間利用の実証を行った。
- 参考スコア(独自算出の注目度): 16.482333106552794
- License:
- Abstract: Deep hierarchical variational autoencoders (VAEs) are powerful latent variable generative models. In this paper, we introduce Hierarchical VAE with Diffusion-based Variational Mixture of the Posterior Prior (VampPrior). We apply amortization to scale the VampPrior to models with many stochastic layers. The proposed approach allows us to achieve better performance compared to the original VampPrior work and other deep hierarchical VAEs, while using fewer parameters. We empirically validate our method on standard benchmark datasets (MNIST, OMNIGLOT, CIFAR10) and demonstrate improved training stability and latent space utilization.
- Abstract(参考訳): 深層階層的変分オートエンコーダ(VAE)は強力な潜在変数生成モデルである。
本稿では,拡散に基づく後方前(VampPrior)の変動混合を伴う階層型VAEを紹介する。
VampPriorを多くの確率層を持つモデルに適用する。
提案手法により,従来のVampPriorの動作や,その他の階層的なVAEと比較して,パラメータが少なくて優れた性能を実現することができる。
提案手法を標準ベンチマークデータセット(MNIST, OMNIGLOT, CIFAR10)上で実証的に検証し, トレーニング安定性の向上と遅延空間利用の実証を行った。
関連論文リスト
- Variational Autoencoder for Anomaly Detection: A Comparative Study [1.9131868049527914]
本稿では,同時代の変分オートエンコーダ(VAE)アーキテクチャを異常検出に用い比較解析することを目的とする。
検討中のアーキテクチャ構成には、元々のVAEベースライン、ガウスランダムフィールド(VAE-GRF)を持つVAE、ビジョントランスフォーマー(ViT-VAE)を搭載したVAEが含まれる。
論文 参考訳(メタデータ) (2024-08-24T12:07:57Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - The VampPrior Mixture Model [1.9943074894669663]
深層潜伏変数モデル(DLVM)のクラスタ化には、a-prioriのクラスタ数を定義する必要がある。
We adapt the VampPrior process into a Dirichlet Mixture Model, result to the VampPrior Mixture Model (VMM, a novel for DLVMs。
本稿では,変分推論と経験的ベイズを交互に交互に交互に行う推論手法を提案する。
論文 参考訳(メタデータ) (2024-02-06T21:18:34Z) - Discouraging posterior collapse in hierarchical Variational Autoencoders
using context [19.47169312443202]
トップダウン階層のVAEは、深い潜伏構造を効果的に学習し、後部崩壊のような問題を回避できるという意見が一致している。
ここでは,必ずしもそうではないことを示すとともに,後方崩壊の問題も残る。
具体的には、離散コサイン変換を用いて最後の潜伏変数を得る。
論文 参考訳(メタデータ) (2023-02-20T13:44:47Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Diffusion Priors In Variational Autoencoders [10.934606664066518]
可変オートエンコーダ(VAEs)は、スケーラブルなアモータイズされた後部推論と高速サンプリングを提供する。
VAEは、正規化フロー(NF)、ディープエネルギーモデル、あるいは新しい拡散確率モデル(DDPM)といった競合モデルにより、ますます性能が向上している。
論文 参考訳(メタデータ) (2021-06-29T18:33:23Z) - Adversarial and Contrastive Variational Autoencoder for Sequential
Recommendation [25.37244686572865]
本稿では、逐次レコメンデーションのためのAdversarial and Contrastive Variational Autoencoder (ACVAE) と呼ばれる新しい手法を提案する。
まず,本モデルが高品質な潜在変数を生成することを可能にするadversarial variational bayesフレームワークの下で,シーケンス生成のためのadversarial trainingを導入する。
さらに、シーケンスをエンコードする場合、シーケンス内のグローバルおよびローカルの関係をキャプチャするために、繰り返しおよび畳み込み構造を適用します。
論文 参考訳(メタデータ) (2021-03-19T09:01:14Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z) - A Contrastive Learning Approach for Training Variational Autoencoder
Priors [137.62674958536712]
変分オートエンコーダ(VAE)は、多くの領域で応用される強力な可能性に基づく生成モデルの一つである。
VAEsが生成性に乏しいことの1つの説明は、事前の分布が集合の近似的な後部と一致しないという、事前の穴の問題である。
本研究では, 基底分布の積と再重み付け係数によって定義されるエネルギーベースの事前定義を行い, 基底を集合体後部へ近づけるようにした。
論文 参考訳(メタデータ) (2020-10-06T17:59:02Z) - Generalized Zero-Shot Learning via VAE-Conditioned Generative Flow [83.27681781274406]
一般化されたゼロショット学習は、意味的記述から視覚的表現へ知識を移すことによって、目に見えないクラスと見えないクラスの両方を認識することを目的としている。
近年のGZSLはデータ不足問題として定式化されており、主にGANやVAEを採用して、目に見えないクラスの視覚的特徴を生成する。
GZSLのための条件付き生成フロー,すなわちVAE-Conditioned Generative Flow (VAE-cFlow)を提案する。
論文 参考訳(メタデータ) (2020-09-01T09:12:31Z) - NVAE: A Deep Hierarchical Variational Autoencoder [102.29977384039805]
本稿では,深度ワイド分離可能な畳み込みとバッチ正規化を用いた画像生成のための階層型VAEを提案する。
NVAEは非自己回帰的確率ベースモデルにおいて最先端の結果が得られることを示す。
我々の知る限りでは、NVAEは256$times $256ピクセルの自然画像に適用された最初のVAEである。
論文 参考訳(メタデータ) (2020-07-08T04:56:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。