論文の概要: Attribute-based Regularization of Latent Spaces for Variational
Auto-Encoders
- arxiv url: http://arxiv.org/abs/2004.05485v3
- Date: Wed, 29 Jul 2020 01:16:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 10:18:06.048216
- Title: Attribute-based Regularization of Latent Spaces for Variational
Auto-Encoders
- Title(参考訳): 変分オートエンコーダのための潜在空間の属性に基づく正規化
- Authors: Ashis Pati, Alexander Lerch
- Abstract要約: 本稿では,変分オートエンコーダ(VAE)の潜時空間を,連続値の異なる属性を明示的に符号化する新しい手法を提案する。
これは属性の正規化損失を使用して、属性値と属性が符号化される次元の潜在符号との単調な関係を強制する。
- 参考スコア(独自算出の注目度): 79.68916470119743
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Selective manipulation of data attributes using deep generative models is an
active area of research. In this paper, we present a novel method to structure
the latent space of a Variational Auto-Encoder (VAE) to encode different
continuous-valued attributes explicitly. This is accomplished by using an
attribute regularization loss which enforces a monotonic relationship between
the attribute values and the latent code of the dimension along which the
attribute is to be encoded. Consequently, post-training, the model can be used
to manipulate the attribute by simply changing the latent code of the
corresponding regularized dimension. The results obtained from several
quantitative and qualitative experiments show that the proposed method leads to
disentangled and interpretable latent spaces that can be used to effectively
manipulate a wide range of data attributes spanning image and symbolic music
domains.
- Abstract(参考訳): 深層生成モデルを用いたデータ属性の選択的操作は研究の活発な領域である。
本稿では,変分オートエンコーダ(VAE)の潜時空間を,連続値の異なる属性を明示的に符号化する新しい手法を提案する。
これは属性の正規化損失を使用して、属性値と属性が符号化される次元の潜在符号との単調な関係を強制する。
したがって、トレーニング後、モデルは対応する正規化次元の潜在コードを変更するだけで属性を操作することができる。
複数の定量的・定性的な実験から得られた結果から,提案手法は画像領域と記号的音楽領域にまたがる幅広いデータ属性を効果的に操作できる不整合かつ解釈可能な潜在空間を導出することが示された。
関連論文リスト
- Text Attribute Control via Closed-Loop Disentanglement [72.2786244367634]
本稿では,コンテンツ保存性を高めつつ,属性のロバストな制御を実現するための新しい手法を提案する。
本稿では,半教師付きコントラスト学習法を用いて,潜在空間における属性のアンタングル化を促進する。
Yelp Serviceレビューデータセット、Amazon Product Reviewデータセット、GoEmotionsデータセットを含む3つのテキストデータセットの実験を行った。
論文 参考訳(メタデータ) (2023-12-01T01:26:38Z) - Exploring Attribute Variations in Style-based GANs using Diffusion
Models [48.98081892627042]
属性編集の多次元的性質をモデル化し,テキスト多元属性編集のタスクを定式化する。
我々は、事前訓練されたGANの非絡み合った潜伏空間を利用して、様々な編集のための潜伏分布を学習するために、Denoising Diffusion Probabilistic Model (DDPM)を訓練する。
論文 参考訳(メタデータ) (2023-11-27T18:14:03Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Attri-VAE: attribute-based, disentangled and interpretable
representations of medical images with variational autoencoders [0.5451140334681147]
本稿では, 属性正規化項を含むVAEアプローチを提案し, 臨床像と医像像の属性を, 生成された潜伏空間の異なる正則化次元に関連付ける。
提案モデルでは, 復元忠実度, ゆがみ, 解釈可能性のトレードオフが良好であり, 最先端のVAE手法よりも優れていた。
論文 参考訳(メタデータ) (2022-03-20T00:19:40Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Multi-Attribute Balanced Sampling for Disentangled GAN Controls [0.0]
予め訓練されたGANの潜伏空間から、生成されたデータに対する様々な制御を抽出することができる。
提案手法は,非絡み付き後処理の不要さを回避しつつ,最先端の分類器に基づく手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-10-28T08:44:13Z) - Disentangled Face Attribute Editing via Instance-Aware Latent Space
Search [30.17338705964925]
GAN(Generative Adversarial Networks)の潜在空間には、意味的な方向性の豊富な集合が存在する。
既存のメソッドは属性のばらつきが弱いため、望ましい属性を変更する際には、他の属性が望ましくない変更になる可能性がある。
本稿では,不整合属性編集のセマンティックな方向を求めるために,インスタンス認識遅延空間探索を行う新しいフレームワーク(IALS)を提案する。
論文 参考訳(メタデータ) (2021-05-26T16:19:08Z) - Improve Variational Autoencoder for Text Generationwith Discrete Latent
Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。
VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。
よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-22T14:41:37Z) - MulGAN: Facial Attribute Editing by Exemplar [2.272764591035106]
遅延特徴空間の予め定義された領域に画像の属性関連情報をエンコードする手法では、逆の属性を持つ一対の画像を列車モデルへの入力として利用する。
それらには、3つの制限がある:(1)モデルが入力として反対の属性を持つ一対のイメージを使用して訓練されなければならない;(2)複数の属性を例によって編集する能力の弱い;(3)画像生成の質が悪い。
論文 参考訳(メタデータ) (2019-12-28T04:02:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。