論文の概要: Sampling From Autoencoders' Latent Space via Quantization And
Probability Mass Function Concepts
- arxiv url: http://arxiv.org/abs/2308.10704v1
- Date: Mon, 21 Aug 2023 13:18:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 13:29:33.247948
- Title: Sampling From Autoencoders' Latent Space via Quantization And
Probability Mass Function Concepts
- Title(参考訳): 量子化と確率質量関数の概念によるオートエンコーダの潜在空間からのサンプリング
- Authors: Aymene Mohammed Bouayed and Adrian Iaccovelli and David Naccache
- Abstract要約: 本稿では,確率質量関数の概念に根ざした新しい学習後サンプリングアルゴリズムと量子化プロセスを紹介する。
提案アルゴリズムは,入力データから各潜伏ベクトルの近傍を定め,その近傍からサンプルを抽出する。
この戦略的なアプローチは、サンプル化された潜伏ベクトルが主に高確率領域に居住することを保証する。
- 参考スコア(独自算出の注目度): 1.534667887016089
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this study, we focus on sampling from the latent space of generative
models built upon autoencoders so as the reconstructed samples are lifelike
images. To do to, we introduce a novel post-training sampling algorithm rooted
in the concept of probability mass functions, coupled with a quantization
process. Our proposed algorithm establishes a vicinity around each latent
vector from the input data and then proceeds to draw samples from these defined
neighborhoods. This strategic approach ensures that the sampled latent vectors
predominantly inhabit high-probability regions, which, in turn, can be
effectively transformed into authentic real-world images. A noteworthy point of
comparison for our sampling algorithm is the sampling technique based on
Gaussian mixture models (GMM), owing to its inherent capability to represent
clusters. Remarkably, we manage to improve the time complexity from the
previous $\mathcal{O}(n\times d \times k \times i)$ associated with GMM
sampling to a much more streamlined $\mathcal{O}(n\times d)$, thereby resulting
in substantial speedup during runtime. Moreover, our experimental results,
gauged through the Fr\'echet inception distance (FID) for image generation,
underscore the superior performance of our sampling algorithm across a diverse
range of models and datasets. On the MNIST benchmark dataset, our approach
outperforms GMM sampling by yielding a noteworthy improvement of up to $0.89$
in FID value. Furthermore, when it comes to generating images of faces and
ocular images, our approach showcases substantial enhancements with FID
improvements of $1.69$ and $0.87$ respectively, as compared to GMM sampling, as
evidenced on the CelebA and MOBIUS datasets. Lastly, we substantiate our
methodology's efficacy in estimating latent space distributions in contrast to
GMM sampling, particularly through the lens of the Wasserstein distance.
- Abstract(参考訳): 本研究では, 自己エンコーダ上に構築された生成モデルの潜時空間からのサンプリングに着目し, 再構成したサンプルがライフライクな画像であることを示す。
そこで本研究では,確率質量関数の概念と量子化過程を組み合わせた,新しい学習後サンプリングアルゴリズムを提案する。
提案アルゴリズムは,入力データから各潜伏ベクトルの近傍を確立し,その近傍からサンプルを抽出する。
この戦略的なアプローチは、サンプル化された潜伏ベクトルが主に高確率領域に居住することを保証する。
サンプリングアルゴリズムの注目すべき点は,ガウス混合モデル(GMM)に基づくサンプリング手法である。
注目すべきは、前回の $\mathcal{O}(n\times d \times k \times i)$ から GMM サンプリングに関連付けられた時間複雑性を、より合理化された $\mathcal{O}(n\times d)$ に改善することで、実行時の大幅なスピードアップを実現したことです。
さらに,画像生成のためのfr\'echetインセプション距離 (fid) を用いて測定した実験結果から,様々なモデルやデータセットを対象としたサンプリングアルゴリズムの性能を検証した。
MNISTベンチマークデータセットでは、最大0.89ドルのFID値の改善により、GMMサンプリングよりも優れている。
さらに,顔画像と眼像の画像の生成に関しては,CelebAデータセットとMOBIUSデータセットに示されているGMMサンプリングと比較して,FIDの改善が1.69ドルと0.87ドルと大きく向上している。
最後に,特にwasserstein距離のレンズを通してのgmmサンプリングとは対照的に,潜在空間分布の推定における本手法の有効性を検証した。
関連論文リスト
- Align Your Steps: Optimizing Sampling Schedules in Diffusion Models [63.927438959502226]
拡散モデル(DM)は、視覚領域以降における最先端の生成モデリングアプローチとして確立されている。
DMの重大な欠点は、サンプリング速度の遅いことであり、大規模なニューラルネットワークによる多くのシーケンシャルな関数評価に依存している。
本稿では,DMのサンプリングスケジュールを高品質な出力に最適化する汎用的,原理的な手法を提案する。
論文 参考訳(メタデータ) (2024-04-22T18:18:41Z) - Deep Gaussian mixture model for unsupervised image segmentation [1.3654846342364308]
多くのタスクにおいて、十分なピクセルレベルのラベルを得るのは非常に困難である。
本稿では,ガウス混合モデル(GMM)と教師なしディープラーニング技術を組み合わせた手法を提案する。
マルチシーケンスMRI画像における梗塞領域分割の例について, 様々な実験において本手法の利点を実証する。
論文 参考訳(メタデータ) (2024-04-18T15:20:59Z) - Deep Generative Sampling in the Dual Divergence Space: A Data-efficient & Interpretative Approach for Generative AI [29.13807697733638]
自然画像の生成的サンプリングにおける顕著な成果の上に構築する。
我々は、画像に似たサンプルを生成するという、画期的な挑戦を、潜在的に過度に野心的に提案する。
統計上の課題は、小さなサンプルサイズであり、時には数百人の被験者で構成されている。
論文 参考訳(メタデータ) (2024-04-10T22:35:06Z) - Iterated Denoising Energy Matching for Sampling from Boltzmann Densities [109.23137009609519]
反復Denoising Energy Matching (iDEM)
iDEMは,拡散型サンプリング装置から高モデル密度のサンプリング領域を (I) 交換し, (II) それらのサンプルをマッチング目的に使用した。
提案手法は,全測定値の最先端性能を達成し,2~5倍の速さでトレーニングを行う。
論文 参考訳(メタデータ) (2024-02-09T01:11:23Z) - MB-RACS: Measurement-Bounds-based Rate-Adaptive Image Compressed Sensing Network [65.1004435124796]
本稿では,MB-RACS(Message-Bounds-based Rate-Adaptive Image Compressed Sensing Network)フレームワークを提案する。
実験により,提案手法が現在の先行手法を超越していることが実証された。
論文 参考訳(メタデータ) (2024-01-19T04:40:20Z) - Improved DDIM Sampling with Moment Matching Gaussian Mixtures [1.450405446885067]
本稿では,Gaussian Mixture Model (GMM) を逆遷移演算子 (カーネル) として,DDIM(Denoising Diffusion Implicit Models) フレームワーク内で提案する。
我々は,GMMのパラメータを制約することにより,DDPMフォワードの1次と2次の中心モーメントを一致させる。
以上の結果から, GMMカーネルを使用すれば, サンプリングステップ数が少ない場合に, 生成したサンプルの品質が大幅に向上することが示唆された。
論文 参考訳(メタデータ) (2023-11-08T00:24:50Z) - Incremental Multimodal Surface Mapping via Self-Organizing Gaussian
Mixture Models [1.0878040851638]
本文では,環境を連続確率モデルとして表わすインクリメンタルなマルチモーダル表面マッピング手法について述べる。
この研究で使用される戦略は環境を表現するためにガウス混合モデル(GMM)を用いる。
このギャップを埋めるために,高速GMMサブマップ抽出のための空間ハッシュマップを導入する。
論文 参考訳(メタデータ) (2023-09-19T19:49:03Z) - Constrained Probabilistic Mask Learning for Task-specific Undersampled
MRI Reconstruction [8.44194619347218]
アンダーサンプリング(アンダーサンプリング)は、磁気共鳴イメージング(MRI)において、k空間内のデータ点数をサブサンプリングする一般的な方法である。
データポイントからアンダーサンプリングマスクを直接学習する手法を提案する。
解剖学的に異なる部位で最適なアンダーサンプリングマスクが認められた。
論文 参考訳(メタデータ) (2023-05-25T14:42:04Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - Learning Energy-Based Models by Diffusion Recovery Likelihood [61.069760183331745]
本稿では,エネルギーベースモデルから気軽に学習・サンプルできる拡散回復可能性法を提案する。
学習後、ガウスの白色雑音分布から初期化するサンプリングプロセスにより合成画像を生成することができる。
非条件 CIFAR-10 では,本手法は FID 9.58 と開始スコア 8.30 を達成する。
論文 参考訳(メタデータ) (2020-12-15T07:09:02Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。