論文の概要: Disentanglement with Hyperspherical Latent Spaces using Diffusion
Variational Autoencoders
- arxiv url: http://arxiv.org/abs/2003.08996v1
- Date: Thu, 19 Mar 2020 19:36:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 03:48:48.445551
- Title: Disentanglement with Hyperspherical Latent Spaces using Diffusion
Variational Autoencoders
- Title(参考訳): 拡散変分オートエンコーダを用いた超球面ラテント空間の遠絡
- Authors: Luis A. P\'erez Rey
- Abstract要約: データセットの不整合表現は、それを生成した根本的要因を回復する能力を持つべきである。
1つの疑問は、潜在変数モデルにユークリッド空間を用いることで、下層の生成因子が特定の幾何学的構造を持つとき、非交叉表現を生成できるかどうかである。
NeurIPS 2019 Disentanglement Challengeの第1ステージで提示された提出書類は、拡散変分オートエンコーダ(Delta$VAE)と超球面潜在空間(例えば、周期的真の要因を回復できる)で構成されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A disentangled representation of a data set should be capable of recovering
the underlying factors that generated it. One question that arises is whether
using Euclidean space for latent variable models can produce a disentangled
representation when the underlying generating factors have a certain
geometrical structure. Take for example the images of a car seen from different
angles. The angle has a periodic structure but a 1-dimensional representation
would fail to capture this topology. How can we address this problem? The
submissions presented for the first stage of the NeurIPS2019 Disentanglement
Challenge consist of a Diffusion Variational Autoencoder ($\Delta$VAE) with a
hyperspherical latent space which can, for example, recover periodic true
factors. The training of the $\Delta$VAE is enhanced by incorporating a
modified version of the Evidence Lower Bound (ELBO) for tailoring the encoding
capacity of the posterior approximate.
- Abstract(参考訳): データセットの不連続な表現は、それを生成する基盤となる要因を回復する能力を持つべきである。
一つの疑問は、潜在変数モデルに対するユークリッド空間の使用が、基礎となる生成因子が幾何構造を持つとき、不等角表現を生成することができるかどうかである。
例えば、異なる角度から見た車の画像を見てみましょう。
角度は周期構造を持つが、1次元の表現はこの位相を捉えない。
どうやってこの問題に対処できるのか?
NeurIPS2019 Disentanglement Challengeの最初の段階で提示された提案は、拡散変分オートエンコーダ(\Delta$VAE)と超球面ラテント空間(例えば周期的真の因子を回復できる)から構成される。
後方近似の符号化能力を調整するためにエビデンス下限(elbo)の修正版を組み込むことにより、$\delta$vaeの訓練を強化する。
関連論文リスト
- Warped Diffusion: Solving Video Inverse Problems with Image Diffusion Models [56.691967706131]
我々は、フレームを2次元空間における連続関数と見なし、ビデオは異なるフレーム間の連続的なワープ変換の列と見なす。
この観点から,画像上でのみ関数空間拡散モデルを訓練し,時間的に相関した逆問題を解くことができる。
本手法により,ビデオ逆問題を解決するために,安定拡散XLのような最先端の潜伏拡散モデルを展開することができる。
論文 参考訳(メタデータ) (2024-10-21T16:19:34Z) - Topological degree as a discrete diagnostic for disentanglement, with applications to the $Δ$VAE [4.749155557874305]
本稿では,データ多様体から潜在空間への写像であるエンコーダの位相次数,すなわちエンコーダの位相次数を導入する。
実験の結果,$Delta$VAEはLSBDスコアが比較的小さいことがわかった。
論文 参考訳(メタデータ) (2024-09-02T14:51:31Z) - Grounding Continuous Representations in Geometry: Equivariant Neural Fields [26.567143650213225]
そこで我々は,幾何インフォームド・クロスアテンションを用いた新しいCNFアーキテクチャを提案する。
このアプローチは、フィールドと潜伏剤の両方を幾何学的にグラウンド化することによって、ステアビリティ特性を誘導することを示す。
分類,セグメンテーション,予測,再構築など,様々なタスクにおいて,これらの主な特性を検証する。
論文 参考訳(メタデータ) (2024-06-09T12:16:30Z) - Motion2VecSets: 4D Latent Vector Set Diffusion for Non-rigid Shape Reconstruction and Tracking [52.393359791978035]
Motion2VecSetsは点雲列からの動的表面再構成のための4次元拡散モデルである。
グローバルな潜在符号の代わりに、潜在集合で4Dダイナミクスをパラメータ化する。
時間的コヒーレントな物体追跡のために、変形潜在集合を同期的に認知し、複数のフレーム間で情報を交換する。
論文 参考訳(メタデータ) (2024-01-12T15:05:08Z) - Topological Obstructions and How to Avoid Them [22.45861345237023]
局所最適性は特異点や不正確な次数や巻数によって生じる可能性があることを示す。
本稿では,データポイントを幾何学空間上のマルチモーダル分布にマッピングするフローベースモデルを提案する。
論文 参考訳(メタデータ) (2023-12-12T18:56:14Z) - Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。
これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文 参考訳(メタデータ) (2023-07-11T16:51:38Z) - Variational Diffusion Auto-encoder: Latent Space Extraction from
Pre-trained Diffusion Models [0.0]
可変オートエンコーダ(VAE)は、生成された画像の品質の問題に直面し、しばしば目立った曖昧さを示す。
この問題は、条件付きデータ分布を近似する非現実的な仮定である $p(textbfx | textbfz)$ が等方ガウス的であることに由来する。
本稿では,エンコーダを最適化することにより,既存の拡散モデルから潜在空間を抽出し,限界データのログ化を最大化する方法について述べる。
論文 参考訳(メタデータ) (2023-04-24T14:44:47Z) - Posterior Collapse and Latent Variable Non-identifiability [54.842098835445]
柔軟性を犠牲にすることなく識別性を強制する深層生成モデルである,潜時同定可能な変分オートエンコーダのクラスを提案する。
合成および実データ全体にわたって、潜在識別可能な変分オートエンコーダは、後方崩壊を緩和し、データの有意義な表現を提供する既存の方法より優れている。
論文 参考訳(メタデータ) (2023-01-02T06:16:56Z) - Diffusion models as plug-and-play priors [98.16404662526101]
我々は、事前の$p(mathbfx)$と補助的な制約である$c(mathbfx,mathbfy)$からなるモデルにおいて、高次元データ$mathbfx$を推論する問題を考える。
拡散モデルの構造は,異なるノイズ量に富んだ定性デノナイジングネットワークを通じて,微分を反復することで近似推論を行うことができる。
論文 参考訳(メタデータ) (2022-06-17T21:11:36Z) - Do Generative Models Know Disentanglement? Contrastive Learning is All
You Need [59.033559925639075]
本論文では,変数空間におけるコントラスト(DisCo)による非監視的,モデル非依存的手法を提案する。
DisCoは、GAN、VAE、およびフローを含む、事前訓練された非解離生成モデルに与えられた最先端の解離を達成します。
論文 参考訳(メタデータ) (2021-02-21T08:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。