論文の概要: Multilinear Latent Conditioning for Generating Unseen Attribute
Combinations
- arxiv url: http://arxiv.org/abs/2009.04075v1
- Date: Wed, 9 Sep 2020 02:23:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 08:46:56.125192
- Title: Multilinear Latent Conditioning for Generating Unseen Attribute
Combinations
- Title(参考訳): unseen属性の組み合わせ生成のためのマルチリニア潜時条件付け
- Authors: Markos Georgopoulos, Grigorios Chrysos, Maja Pantic, Yannis Panagakis
- Abstract要約: 本研究では, 変異自己エンコーダ(VAE)とGAN(Generative Adversarial Network)が, 人間の知覚において自然に発生する一般化能力を欠いていることを示す。
本稿では,属性間の乗法的相互作用をキャプチャする多線形潜在条件付けフレームワークを提案する。
また,どのアーキテクチャでも使用可能な新しい条件付けフレームワークを設計し,未知の属性の組み合わせを合成する。
- 参考スコア(独自算出の注目度): 61.686839319971334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative models rely on their inductive bias to facilitate
generalization, especially for problems with high dimensional data, like
images. However, empirical studies have shown that variational autoencoders
(VAE) and generative adversarial networks (GAN) lack the generalization ability
that occurs naturally in human perception. For example, humans can visualize a
woman smiling after only seeing a smiling man. On the contrary, the standard
conditional VAE (cVAE) is unable to generate unseen attribute combinations. To
this end, we extend cVAE by introducing a multilinear latent conditioning
framework that captures the multiplicative interactions between the attributes.
We implement two variants of our model and demonstrate their efficacy on MNIST,
Fashion-MNIST and CelebA. Altogether, we design a novel conditioning framework
that can be used with any architecture to synthesize unseen attribute
combinations.
- Abstract(参考訳): 深部生成モデルは、特に画像のような高次元データを扱う問題に対して、一般化を促進するために誘導バイアスに依存する。
しかし、実証的な研究により、変異自己エンコーダ(VAE)と生成敵対ネットワーク(GAN)は人間の知覚において自然に起こる一般化能力を欠いていることが示されている。
例えば、笑顔の男性を見ただけで笑顔の女性を可視化することができる。
逆に、標準条件vae(cvae)は、見当たらない属性の組み合わせを生成することができない。
この目的のために,属性間の乗法的相互作用をキャプチャする多線形潜在条件付きフレームワークを導入することにより,cVAEを拡張する。
MNIST, Fashion-MNIST, CelebAの2種類のモデルを実装し, 有効性を示す。
また,どのアーキテクチャでも使用可能な新しい条件付けフレームワークを設計し,未知の属性の組み合わせを合成する。
関連論文リスト
- Distributionally Generative Augmentation for Fair Facial Attribute Classification [69.97710556164698]
Facial Attribute Classification (FAC) は広く応用されている。
従来の手法で訓練されたFACモデルは、様々なデータサブポピュレーションにまたがる精度の不整合を示すことによって不公平である可能性がある。
本研究は,付加アノテーションなしでバイアスデータ上で公正なFACモデルをトレーニングするための,新しい世代ベースの2段階フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-11T10:50:53Z) - Curve Your Enthusiasm: Concurvity Regularization in Differentiable
Generalized Additive Models [5.519653885553456]
GAM(Generalized Additive Models)はその解釈可能性のために最近人気が回復した。
我々は,GAMの解釈可能性の低下がいかに深刻かを示す。
線形変換しない特徴変数の相互相関をペナルティ化した,概念的には単純だが効果的な正則化器を提案する。
論文 参考訳(メタデータ) (2023-05-19T06:55:49Z) - StyleGenes: Discrete and Efficient Latent Distributions for GANs [149.0290830305808]
GAN(Generative Adversarial Networks)のための離散潜在分布を提案する。
連続的な先行点から潜在ベクトルを描く代わりに、学習可能な潜在点の有限集合からサンプリングする。
私たちは生物の情報のエンコーディングからインスピレーションを得ます。
論文 参考訳(メタデータ) (2023-04-30T23:28:46Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Diversity vs. Recognizability: Human-like generalization in one-shot
generative models [5.964436882344729]
サンプル認識可能性と多様性の2つの軸に沿った1ショット生成モデルを評価するための新しい枠組みを提案する。
まず、GANのようなモデルとVAEのようなモデルが多様性認識性空間の反対側にあることを示す。
対照的に、非絡み合いは、認識可能性の最大化に使用できるパラボラ曲線に沿ってモデルを輸送する。
論文 参考訳(メタデータ) (2022-05-20T13:17:08Z) - Defending Variational Autoencoders from Adversarial Attacks with MCMC [74.36233246536459]
変分オートエンコーダ(VAE)は、様々な領域で使用される深部生成モデルである。
以前の研究が示すように、視覚的にわずかに修正された入力に対する予期せぬ潜在表現と再構成を生成するために、VAEを簡単に騙すことができる。
本稿では, 敵攻撃構築のための目的関数について検討し, モデルのロバスト性を評価する指標を提案し, 解決策を提案する。
論文 参考訳(メタデータ) (2022-03-18T13:25:18Z) - Controllable and Compositional Generation with Latent-Space Energy-Based
Models [60.87740144816278]
制御可能な生成は、現実世界のアプリケーションで深層生成モデルの採用を成功させる上で重要な要件の1つである。
本研究では, エネルギーモデル(EBM)を用いて, 属性の集合上での合成生成を扱う。
エネルギー関数を論理演算子と合成することにより、分解能1024x1024のフォトリアリスティック画像を生成する際に、このような構成性を実現するのはこれが初めてである。
論文 参考訳(メタデータ) (2021-10-21T03:31:45Z) - PluGeN: Multi-Label Conditional Generation From Pre-Trained Models [1.4777718769290524]
PluGeNは単純だが効果的な生成技術であり、事前訓練された生成モデルのプラグインとして使用できる。
PluGeNは、ラベル付き属性の値を制御する機能を加えながら、バックボーンモデルの品質を保っていることを示す。
論文 参考訳(メタデータ) (2021-09-18T21:02:24Z) - Directly Training Joint Energy-Based Models for Conditional Synthesis
and Calibrated Prediction of Multi-Attribute Data [9.389098132764431]
マルチ属性予測のためのアーキテクチャは,エネルギーモデルとして再解釈可能であることを示す。
本研究では,ESMの精度を向上し,正確な条件付きサンプルを生成するための簡単な拡張を提案する。
我々のモデルは、正確で校正された予測と、新しい属性の組み合わせの高品質な条件合成の両方が可能である。
論文 参考訳(メタデータ) (2021-07-19T22:19:41Z) - AVAE: Adversarial Variational Auto Encoder [2.1485350418225244]
VAEとGANを新規かつ補完的な方法で組み合わせ、自動符号化モデルを作成する新しいフレームワークを紹介します。
5つの画像データセットを質的かつ定量的に評価した。
論文 参考訳(メタデータ) (2020-12-21T18:29:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。