論文の概要: PCAAE: Principal Component Analysis Autoencoder for organising the
latent space of generative networks
- arxiv url: http://arxiv.org/abs/2006.07827v1
- Date: Sun, 14 Jun 2020 07:40:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 13:14:51.527296
- Title: PCAAE: Principal Component Analysis Autoencoder for organising the
latent space of generative networks
- Title(参考訳): PCAAE: 生成ネットワークの潜在空間を整理するための主成分分析オートエンコーダ
- Authors: Chi-Hieu Pham and Sa\"id Ladjal and Alasdair Newson
- Abstract要約: 潜在空間が2つの性質を検証できる新しいオートエンコーダを提案する。
潜在空間の成分は統計的に独立である。
形状の合成例と最先端のGANについて結果を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoencoders and generative models produce some of the most spectacular deep
learning results to date. However, understanding and controlling the latent
space of these models presents a considerable challenge. Drawing inspiration
from principal component analysis and autoencoder, we propose the Principal
Component Analysis Autoencoder (PCAAE). This is a novel autoencoder whose
latent space verifies two properties. Firstly, the dimensions are organised in
decreasing importance with respect to the data at hand. Secondly, the
components of the latent space are statistically independent. We achieve this
by progressively increasing the latent space during training, and with a
covariance loss applied to the latent codes. The resulting autoencoder produces
a latent space which separates the intrinsic attributes of the data into
different components of the latent space, in a completely unsupervised manner.
We also describe an extension of our approach to the case of powerful,
pre-trained GANs. We show results on both synthetic examples of shapes and on a
state-of-the-art GAN. For example, we are able to separate the color shade
scale of hair and skin, pose of faces and the gender in the CelebA, without
accessing any labels. We compare the PCAAE with other state-of-the-art
approaches, in particular with respect to the ability to disentangle attributes
in the latent space. We hope that this approach will contribute to better
understanding of the intrinsic latent spaces of powerful deep generative
models.
- Abstract(参考訳): オートエンコーダと生成モデルは、これまでで最も素晴らしいディープラーニング結果を生み出します。
しかし、これらのモデルの潜在空間の理解と制御には大きな課題がある。
主成分分析とオートエンコーダからインスピレーションを得て,主成分分析オートエンコーダ(pcaae)を提案する。
これは、潜在空間が2つの性質を検証する新しいオートエンコーダである。
まず、目の前のデータに対する重要性を低下させるように次元を整理する。
第二に、潜在空間の成分は統計的に独立である。
我々は、トレーニング中に潜在空間を徐々に増やし、潜在コードに共分散損失を適用することでこれを達成する。
結果のオートエンコーダは、データ固有の属性を、完全に教師なしの方法で、潜在空間の異なるコンポーネントに分離する潜在空間を生成する。
我々はまた、強力で事前訓練されたGANのケースに対する我々のアプローチの拡張についても述べる。
形状の合成例と最先端のGANについて結果を示す。
例えば、私たちはラベルにアクセスすることなく、髪と肌の色合い、顔のポーズ、およびCelebAの性別を分離することができます。
我々はPCAAEを他の最先端のアプローチと比較し、特に潜在空間の属性をアンタングルする能力について述べる。
このアプローチが強力な深層生成モデルの本質的な潜在空間の理解に寄与することを期待する。
関連論文リスト
- GraCo: Granularity-Controllable Interactive Segmentation [52.9695642626127]
Granularity-Controllable Interactive (GraCo) は、入力に追加パラメータを導入することによって、予測粒度の正確な制御を可能にする新しいアプローチである。
GraCoは、事前訓練されたISモデルのセマンティック特性を利用して、豊富なマスクとグラニュラリティのペアを自動的に生成する。
オブジェクトと部分レベルの複雑なシナリオの実験は、GraCoが以前の方法よりも大きな利点があることを示しています。
論文 参考訳(メタデータ) (2024-05-01T15:50:16Z) - N2F2: Hierarchical Scene Understanding with Nested Neural Feature Fields [112.02885337510716]
Nested Neural Feature Fields (N2F2)は、階層的な監視を用いて単一機能フィールドを学習する新しいアプローチである。
画像空間の任意のスケールで意味的に意味のある画素群を提供するために、2次元クラス非依存セグメンテーションモデルを利用する。
オープンな3次元セグメンテーションやローカライゼーションといったタスクにおいて,最先端のフィールド蒸留法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-03-16T18:50:44Z) - A Compact and Semantic Latent Space for Disentangled and Controllable
Image Editing [4.8201607588546]
本稿では,StyleGANの潜在空間を再編成するオートエンコーダを提案する。
提案手法は,同一性に関して元の画像に対する忠実さを維持しつつ,競合する手法よりも不整合性が高いことを示す。
論文 参考訳(メタデータ) (2023-12-13T16:18:45Z) - SC2GAN: Rethinking Entanglement by Self-correcting Correlated GAN Space [16.040942072859075]
ある属性の編集方向に従う遺伝子ネットワークは、他の属性と絡み合った変更をもたらす可能性がある。
本稿では,低密度の潜伏コードサンプルを元の潜伏空間に再プロジェクションすることで,SC$2$GANのアンタングル化を実現する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-10T14:42:32Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Spatial Steerability of GANs via Self-Supervision from Discriminator [123.27117057804732]
本稿では,GANの空間的ステアビリティを向上させるための自己教師型アプローチを提案する。
具体的には、空間帰納バイアスとして生成モデルの中間層に符号化されるランダムなガウス熱マップを設計する。
推論中、ユーザは直感的に空間のヒートマップと対話し、シーンのレイアウトを調整したり、移動したり、オブジェクトを削除したりすることで、出力画像を編集することができる。
論文 参考訳(メタデータ) (2023-01-20T07:36:29Z) - Disentangling Variational Autoencoders [0.0]
変分オートエンコーダ(VAE)は、高次元データの入力セットを低次元の潜在空間に投影する。
文献から3つの異なるVAEモデルを実装し、6万枚の手書き数字のデータセットでそれらをトレーニングする。
本稿では,復号化画像の品質と遅延空間の歪みレベルとのトレードオフについて検討する。
論文 参考訳(メタデータ) (2022-11-14T19:22:41Z) - Closed-Loop Data Transcription to an LDR via Minimaxing Rate Reduction [27.020835928724775]
本研究では,実世界のデータセットに対する明示的な生成モデル学習のための新しい計算フレームワークを提案する。
特に,多次元多次元データ分布と特徴空間における線形識別表現(LDR)の間の閉ループ転写を学習することを提案する。
多くのベンチマークデータセットに対する実験は、この新しいクローズドループの定式化の可能性を示している。
論文 参考訳(メタデータ) (2021-11-12T10:06:08Z) - Is Disentanglement enough? On Latent Representations for Controllable
Music Generation [78.8942067357231]
強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
論文 参考訳(メタデータ) (2021-08-01T18:37:43Z) - IntroVAC: Introspective Variational Classifiers for Learning
Interpretable Latent Subspaces [6.574517227976925]
IntroVACは、追加ラベルから情報を活用することで、解釈可能な潜在部分空間を学習する。
IntroVACは、画像属性の微調整を可能にする潜在空間における意味のある方向を学習可能であることを示す。
論文 参考訳(メタデータ) (2020-08-03T10:21:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。