論文の概要: Interpreting the Latent Space of GANs via Correlation Analysis for
Controllable Concept Manipulation
- arxiv url: http://arxiv.org/abs/2006.10132v2
- Date: Thu, 23 Jul 2020 15:07:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:19:58.373572
- Title: Interpreting the Latent Space of GANs via Correlation Analysis for
Controllable Concept Manipulation
- Title(参考訳): 相関解析によるganの潜在空間の解釈と制御可能な概念操作
- Authors: Ziqiang Li, Rentuo Tao, Hongjing Niu, Bin Li
- Abstract要約: GAN(Generative Adversarial Nets)は、画像生成、塗装、超解像、薬物発見など、多くの分野で成功している。
本稿では,生成画像中の潜伏変数と対応する意味内容との相関を解析することにより,GANの潜伏空間を解釈する手法を提案する。
- 参考スコア(独自算出の注目度): 9.207806788490057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial nets (GANs) have been successfully applied in many
fields like image generation, inpainting, super-resolution and drug discovery,
etc., by now, the inner process of GANs is far from been understood. To get
deeper insight of the intrinsic mechanism of GANs, in this paper, a method for
interpreting the latent space of GANs by analyzing the correlation between
latent variables and the corresponding semantic contents in generated images is
proposed. Unlike previous methods that focus on dissecting models via feature
visualization, the emphasis of this work is put on the variables in latent
space, i.e. how the latent variables affect the quantitative analysis of
generated results. Given a pretrained GAN model with weights fixed, the latent
variables are intervened to analyze their effect on the semantic content in
generated images. A set of controlling latent variables can be derived for
specific content generation, and the controllable semantic content manipulation
be achieved. The proposed method is testified on the datasets Fashion-MNIST and
UT Zappos50K, experiment results show its effectiveness.
- Abstract(参考訳): 画像生成、インペインティング、超解像、薬物発見など多くの分野でgan(generative adversarial nets)がうまく適用されており、現在までにganの内部プロセスは理解されていない。
本稿では,GANの内在的メカニズムを深く理解するために,生成画像中の潜伏変数と対応する意味内容との相関を解析して,GANの潜伏空間を解釈する手法を提案する。
特徴視覚化によるモデル分割に焦点を当てた従来の手法とは異なり、この研究の重点は潜在空間の変数、すなわち潜在変数が生成した結果の定量的解析にどのように影響するかに置かれる。
重みが固定された事前学習されたGANモデルにより、潜伏変数を介在させて、生成された画像のセマンティック内容に対する影響を分析する。
特定のコンテンツ生成のために潜在変数のセットを導出することができ、制御可能なセマンティックコンテンツ操作を実現する。
提案手法は,Fashion-MNIST と UT Zappos50K のデータセット上で検証され,その有効性を示す。
関連論文リスト
- Learning In-between Imagery Dynamics via Physical Latent Spaces [0.7366405857677226]
本稿では,連続した時間ステップで観察される2つの画像間の基礎となるダイナミクスを学習するためのフレームワークを提案する。
偏微分方程式(PDE)で表される物理モデルに従う潜在変数を組み込むことにより,本手法は学習モデルの解釈可能性を保証する。
地質画像データを用いた数値実験により,学習フレームワークの堅牢性と有効性を示す。
論文 参考訳(メタデータ) (2023-10-14T05:14:51Z) - Discovering Class-Specific GAN Controls for Semantic Image Synthesis [73.91655061467988]
本稿では,事前訓練されたSISモデルの潜在空間において,空間的に不整合なクラス固有方向を求める新しい手法を提案する。
提案手法によって検出される潜在方向は,セマンティッククラスの局所的な外観を効果的に制御できることを示す。
論文 参考訳(メタデータ) (2022-12-02T21:39:26Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Self-Supervised Learning with Data Augmentations Provably Isolates
Content from Style [32.20957709045773]
我々は拡張過程を潜在変数モデルとして定式化する。
本研究では,2対の観測結果に基づいて,潜在表現の識別可能性について検討した。
Causal3DIdentは、因果関係が豊富な高次元、視覚的に複雑な画像のデータセットである。
論文 参考訳(メタデータ) (2021-06-08T18:18:09Z) - Learning Exponential Family Graphical Models with Latent Variables using
Regularized Conditional Likelihood [10.21814909876358]
遅延可変グラフィカルモデリングのための正規化条件付き確率に基づく新しい凸緩和フレームワークを提案する。
我々は、実データだけでなく、合成に関する数値実験を通じて、我々のフレームワークの有用性と柔軟性を実証する。
論文 参考訳(メタデータ) (2020-10-19T11:16:26Z) - Learning Disentangled Representations with Latent Variation
Predictability [102.4163768995288]
本稿では,潜在不整合表現の変動予測可能性について述べる。
逆生成プロセス内では、潜時変動と対応する画像対の相互情報を最大化することにより、変動予測可能性を高める。
本研究では,潜在表現の絡み合いを測るために,基礎的構造的生成因子に依存しない評価指標を開発する。
論文 参考訳(メタデータ) (2020-07-25T08:54:26Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。