論文の概要: Semantic Latent Decomposition with Normalizing Flows for Face Editing
- arxiv url: http://arxiv.org/abs/2309.05314v1
- Date: Mon, 11 Sep 2023 08:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 13:18:59.083633
- Title: Semantic Latent Decomposition with Normalizing Flows for Face Editing
- Title(参考訳): 顔編集のための正規化フローを用いた意味的潜時分解
- Authors: Binglei Li, Zhizhong Huang, Hongming Shan, Junping Zhang
- Abstract要約: StyleGANの潜伏空間でのナビゲーションは、顔編集に有効であることが示されている。
結果として得られる手法は通常、潜伏空間における異なる属性間の絡み合いによる複雑なナビゲーションの課題に直面する。
本稿では,SDFlowと呼ばれる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 43.41509627246366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating in the latent space of StyleGAN has shown effectiveness for face
editing. However, the resulting methods usually encounter challenges in
complicated navigation due to the entanglement among different attributes in
the latent space. To address this issue, this paper proposes a novel framework,
termed SDFlow, with a semantic decomposition in original latent space using
continuous conditional normalizing flows. Specifically, SDFlow decomposes the
original latent code into different irrelevant variables by jointly optimizing
two components: (i) a semantic encoder to estimate semantic variables from
input faces and (ii) a flow-based transformation module to map the latent code
into a semantic-irrelevant variable in Gaussian distribution, conditioned on
the learned semantic variables. To eliminate the entanglement between
variables, we employ a disentangled learning strategy under a mutual
information framework, thereby providing precise manipulation controls.
Experimental results demonstrate that SDFlow outperforms existing
state-of-the-art face editing methods both qualitatively and quantitatively.
The source code is made available at https://github.com/phil329/SDFlow.
- Abstract(参考訳): styleganの潜在空間でのナビゲートは、顔編集に有効性を示している。
しかし、結果として得られる手法は通常、潜伏空間における異なる属性間の絡み合いによって複雑なナビゲーションの課題に直面する。
この問題に対処するため,本論文では,連続条件正規化フローを用いた元の潜在空間における意味分解を用いた新しいフレームワークであるsdflowを提案する。
具体的には、SDFlowは2つのコンポーネントを共同で最適化することで、元の潜在コードを異なる無関係変数に分解する。
(i)入力面から意味変数を推定する意味エンコーダ、及び
(II) 学習した意味変数を条件としたフローベース変換モジュールにより,潜時コードをガウス分布の意味非関連変数にマッピングする。
変数間の絡み合いを解消するために,相互情報枠組みの下での絡み合い学習戦略を採用し,正確な操作制御を行う。
実験の結果,SDFlowは既存の顔編集方法よりも質的,定量的に優れていることがわかった。
ソースコードはhttps://github.com/phil329/SDFlowで公開されている。
関連論文リスト
- Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - Entropy-Informed Weighting Channel Normalizing Flow [7.751853409569806]
正規化および機能依存の$mathttShuffle$演算を提案し,それをバニラマルチスケールアーキテクチャに統合する。
このような操作はエントロピー増加方向の変数を誘導するので、$mathttShuffle$演算をemphEntropy-Informed Weighting Channel Normalizing Flow (EIW-Flow)と呼ぶNFを参照する。
論文 参考訳(メタデータ) (2024-07-06T04:46:41Z) - ContextFlow++: Generalist-Specialist Flow-based Generative Models with Mixed-Variable Context Encoding [0.8192907805418583]
本稿では,明示的なジェネラリストと特殊主義の知識を分離した付加的条件付けを用いて,制約を克服するContextFlow++を提案する。
MNIST-R, 破損したCIFAR-10C, 現実世界のATMの予測保守, およびSMAPの教師なし異常検出ベンチマーク実験により, 提案したContextFlow++はより高速な安定トレーニングを提供し, 高性能なメトリクスを実現することを示す。
論文 参考訳(メタデータ) (2024-06-02T00:00:00Z) - PaddingFlow: Improving Normalizing Flows with Padding-Dimensional Noise [4.762593660623934]
パディングフロー(PaddingFlow)は,パディング次元雑音による正規化フローを改善する新しいデクエント化法である。
非条件密度推定の主ベンチマークで本手法の有効性を検証した。
この結果から,PaddingFlowはすべての実験において優れた性能を発揮できることがわかった。
論文 参考訳(メタデータ) (2024-03-13T03:28:39Z) - Improving the Sample-Complexity of Deep Classification Networks with
Invariant Integration [77.99182201815763]
変換によるクラス内分散に関する事前知識を活用することは、ディープニューラルネットワークのサンプル複雑性を改善するための強力な方法である。
そこで本研究では,アプリケーションの複雑な問題に対処するために,プルーニング法に基づく新しい単項選択アルゴリズムを提案する。
本稿では,Rotated-MNIST,SVHN,CIFAR-10データセットにおけるサンプルの複雑さの改善について述べる。
論文 参考訳(メタデータ) (2022-02-08T16:16:11Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Layout-to-Image Translation with Double Pooling Generative Adversarial
Networks [76.83075646527521]
入力レイアウトからフォトリアリスティックでセマンティックに一貫性のある結果を生成するための新しいDouble Pooing GAN(DPGAN)を提案する。
また,角形プールモジュール (SPM) と矩形プールモジュール (RPM) からなる新しい二重プールモジュール (DPM) を提案する。
論文 参考訳(メタデータ) (2021-08-29T19:55:14Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z) - Mask-Guided Discovery of Semantic Manifolds in Generative Models [0.0]
StyleGAN2は、低次元の潜在空間内のランダムベクトルから人間の顔の画像を生成する。
モデルはブラックボックスとして動作し、出力の制御も、データから学んだ構造についての洞察も提供しない。
顔の空間的局所化領域の変化の多様体を探索する手法を提案する。
論文 参考訳(メタデータ) (2021-05-15T18:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。