論文の概要: Unsupervised Disentanglement of Linear-Encoded Facial Semantics
- arxiv url: http://arxiv.org/abs/2103.16605v1
- Date: Tue, 30 Mar 2021 18:23:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 14:37:46.347610
- Title: Unsupervised Disentanglement of Linear-Encoded Facial Semantics
- Title(参考訳): 線形符号化顔面意味論の教師なし解離
- Authors: Yutong Zheng, Yu-Kai Huang, Ran Tao, Zhiqiang Shen and Marios Savvides
- Abstract要約: 本論文では,STYPEGANから線形エンコードされた顔認識を外部の監督なく切り離す手法を提案する。
この手法は線形回帰とスパース表現学習の概念から導かれ、非絡み合った潜在表現も容易に解釈できる。
- 参考スコア(独自算出の注目度): 39.84231302832999
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a method to disentangle linear-encoded facial semantics from
StyleGAN without external supervision. The method derives from linear
regression and sparse representation learning concepts to make the disentangled
latent representations easily interpreted as well. We start by coupling
StyleGAN with a stabilized 3D deformable facial reconstruction method to
decompose single-view GAN generations into multiple semantics. Latent
representations are then extracted to capture interpretable facial semantics.
In this work, we make it possible to get rid of labels for disentangling
meaningful facial semantics. Also, we demonstrate that the guided extrapolation
along the disentangled representations can help with data augmentation, which
sheds light on handling unbalanced data. Finally, we provide an analysis of our
learned localized facial representations and illustrate that the semantic
information is encoded, which surprisingly complies with human intuition. The
overall unsupervised design brings more flexibility to representation learning
in the wild.
- Abstract(参考訳): 本稿では,外部監視を伴わずに,線形符号化された顔のセマンティクスをStyleGANから切り離す手法を提案する。
この手法は線形回帰とスパース表現学習の概念から導かれ、非絡み合った潜在表現も容易に解釈できる。
まず,スタイルガンを安定3次元変形可能な顔面再建法と結合し,単一視点のgan世代を複数のセマンティクスに分解する。
潜在表現は、解釈可能な顔意味論をキャプチャするために抽出される。
本研究は,意味ある顔のセマンティクスを解消するためのラベルの除去を可能にする。
また、不整合表現に沿った導出外挿がデータ増大に役立ち、不整合データの扱いに光を当てることを示した。
最後に,学習した局所的な表情表現の分析を行い,その意味情報がエンコードされていることを示す。
全体的な教師なしの設計は、野生での表現学習に柔軟性をもたらす。
関連論文リスト
- Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。
タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。
我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文 参考訳(メタデータ) (2024-02-13T02:46:45Z) - Discovering Interpretable Directions in the Semantic Latent Space of Diffusion Models [21.173910627285338]
DDM(Denoising Diffusion Models)は、GAN(Generative Adversarial Networks)の強力な競合相手として登場した。
本稿では,h-spaceの特性について検討し,その中に意味のある意味的方向を求めるための新しい手法を提案する。
私たちのアプローチは、アーキテクチャの変更、テキストベースのガイダンス、CLIPベースの最適化、モデル微調整を必要とせずに適用できます。
論文 参考訳(メタデータ) (2023-03-20T12:59:32Z) - Extracting Semantic Knowledge from GANs with Unsupervised Learning [65.32631025780631]
GAN(Generative Adversarial Networks)は、特徴写像のセマンティクスを線形に分離可能な形でエンコードする。
本稿では,線形分離性を利用してGANの特徴をクラスタリングする新しいクラスタリングアルゴリズムKLiSHを提案する。
KLiSHは、さまざまなオブジェクトのデータセットに基づいてトレーニングされたGANのきめ細かいセマンティクスの抽出に成功している。
論文 参考訳(メタデータ) (2022-11-30T03:18:16Z) - SD-GAN: Semantic Decomposition for Face Image Synthesis with Discrete
Attribute [0.0]
本稿では,SD-GANと呼ばれる意味的分解による顔の離散属性合成に挑戦する革新的な枠組みを提案する。
融合ネットワークは、より優れたアイデンティティ保存と離散属性合成のために3D埋め込みを統合する。
既存のデータセットにおける離散属性の欠如を解消するための,大規模で価値のあるデータセットMEGNを構築した。
論文 参考訳(メタデータ) (2022-07-12T04:23:38Z) - SNARF: Differentiable Forward Skinning for Animating Non-Rigid Neural
Implicit Shapes [117.76767853430243]
SNARFは多角形メッシュに対する線形ブレンドスキンの利点とニューラル暗黙表面の利点を組み合わせたものである。
反復ルート探索を用いて任意の変形点のすべての正準対応を探索するフォワードスキンモデルを提案する。
最先端のニューラルネットワークの暗黙的表現と比較すると,このアプローチは,精度を維持しつつ,未認識のポーズを一般化する。
論文 参考訳(メタデータ) (2021-04-08T17:54:59Z) - Where and What? Examining Interpretable Disentangled Representations [96.32813624341833]
解釈可能なバリエーションの獲得は、長い間、絡み合い学習の目標の1つだった。
独立性の仮定と異なり、解釈性は教師なしの設定での絡み合いを促進するために使われることは滅多にない。
本論文では, 解釈対象と解釈対象の2つの質問について検討し, 離散表現の解釈可能性を検討する。
論文 参考訳(メタデータ) (2021-04-07T11:22:02Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。