論文の概要: Face Identity Disentanglement via Latent Space Mapping
- arxiv url: http://arxiv.org/abs/2005.07728v3
- Date: Mon, 19 Oct 2020 12:24:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 23:02:43.586440
- Title: Face Identity Disentanglement via Latent Space Mapping
- Title(参考訳): 潜時空間マッピングによる顔同一性障害
- Authors: Yotam Nitzan, Amit Bermano, Yangyan Li, Daniel Cohen-Or
- Abstract要約: 本稿では,データ表現を最小限に抑えながら,不整合な方法で表現する方法を学習する手法を提案する。
我々の重要な洞察は、StyleGANのような先行訓練済みの未条件画像生成装置を利用することで、アンタングル化と合成のプロセスを切り離すことである。
提案手法は,既存の手法を超越して,他の顔属性と同一性を切り離すことに成功した。
- 参考スコア(独自算出の注目度): 47.27253184341152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning disentangled representations of data is a fundamental problem in
artificial intelligence. Specifically, disentangled latent representations
allow generative models to control and compose the disentangled factors in the
synthesis process. Current methods, however, require extensive supervision and
training, or instead, noticeably compromise quality. In this paper, we present
a method that learns how to represent data in a disentangled way, with minimal
supervision, manifested solely using available pre-trained networks. Our key
insight is to decouple the processes of disentanglement and synthesis, by
employing a leading pre-trained unconditional image generator, such as
StyleGAN. By learning to map into its latent space, we leverage both its
state-of-the-art quality, and its rich and expressive latent space, without the
burden of training it. We demonstrate our approach on the complex and high
dimensional domain of human heads. We evaluate our method qualitatively and
quantitatively, and exhibit its success with de-identification operations and
with temporal identity coherency in image sequences. Through extensive
experimentation, we show that our method successfully disentangles identity
from other facial attributes, surpassing existing methods, even though they
require more training and supervision.
- Abstract(参考訳): データの絡み合った表現の学習は、人工知能における根本的な問題である。
具体的には、不等角化潜在表現は生成モデルが合成過程における不等角化因子を制御および構成することを可能にする。
しかし、現在の方法には広範な監督と訓練が必要か、あるいは明らかに品質を損なう必要がある。
本稿では,利用可能な事前学習ネットワークのみを用いて,最小限の監督でデータ表現の仕方を学習する手法を提案する。
私たちの重要な洞察は、スタイルガンのような事前訓練された無条件画像生成器を駆使して、絡み合いと合成のプロセスを切り離すことです。
潜伏空間にマップすることを学ぶことで、その最先端の品質と、その豊かで表現力豊かな潜伏空間の両方を、訓練の負担なく活用する。
我々は,人間の頭部の複雑かつ高次元領域に対するアプローチを実証する。
提案手法を質的,定量的に評価し,画像列の非識別操作と時間的同一性でその成功を示す。
広範な実験を通じて,本手法は他の顔属性と同一性を分離し,より訓練や監督を必要とするにもかかわらず,既存の手法を上回ることに成功していることを示す。
関連論文リスト
- Self-Explainable Affordance Learning with Embodied Caption [63.88435741872204]
具体的キャプションを具現化したSelf-Explainable Affordance Learning (SEA)を紹介する。
SEAは、ロボットが意図を明確に表現し、説明可能な視覚言語キャプションと視覚能力学習のギャップを埋めることを可能にする。
本稿では, 簡便かつ効率的な方法で, 空き地と自己説明を効果的に組み合わせた新しいモデルを提案する。
論文 参考訳(メタデータ) (2024-04-08T15:22:38Z) - Multi Positive Contrastive Learning with Pose-Consistent Generated Images [0.873811641236639]
我々は、同一の人間のポーズで視覚的に異なる画像を生成することを提案する。
そこで我々は,これまで生成した画像を最適に活用する,新しいマルチ陽性コントラスト学習を提案する。
GenPoCCLは、現在の最先端技術に比べて1%未満のデータしか利用していないが、人間の身体の構造的特徴をより効果的に捉えている。
論文 参考訳(メタデータ) (2024-04-04T07:26:26Z) - Segue: Side-information Guided Generative Unlearnable Examples for
Facial Privacy Protection in Real World [64.4289385463226]
生成不可能な例としては、Segue: Side-information guided Generative unlearnable Exampleを提案する。
転送性を向上させるために,真のラベルや擬似ラベルなどの側面情報を導入する。
JPEG圧縮、敵対的トレーニング、およびいくつかの標準的なデータ拡張に抵抗することができる。
論文 参考訳(メタデータ) (2023-10-24T06:22:37Z) - URLOST: Unsupervised Representation Learning without Stationarity or
Topology [26.17135629579595]
定常性やトポロジに欠ける高次元データから学習する新しいフレームワークを提案する。
我々のモデルは学習可能な自己組織化層、密度調整されたスペクトルクラスタリング、マスク付きオートエンコーダを組み合わせる。
本研究は,生体視覚データ,一次視覚野からの神経記録,遺伝子発現データセットにおいて有効性を評価する。
論文 参考訳(メタデータ) (2023-10-06T18:00:02Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - Self-supervised Transformer for Deepfake Detection [112.81127845409002]
現実世界のシナリオにおけるディープフェイク技術は、顔偽造検知器のより強力な一般化能力を必要とする。
転送学習に触発されて、他の大規模な顔関連タスクで事前訓練されたニューラルネットワークは、ディープフェイク検出に有用な機能を提供する可能性がある。
本稿では,自己教師型変換器を用いた音声視覚コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-02T17:44:40Z) - Learning a Deep Reinforcement Learning Policy Over the Latent Space of a
Pre-trained GAN for Semantic Age Manipulation [4.306143768014157]
我々は、定義されたアイデンティティ境界の下で、特定の属性に沿って意味操作を行うための条件ポリシーを学習する。
以上の結果から,学習方針は年齢変化を伴う高忠実度画像のサンプルであることがわかった。
論文 参考訳(メタデータ) (2020-11-02T13:15:18Z) - Disentangled and Controllable Face Image Generation via 3D
Imitative-Contrastive Learning [43.53235319568048]
本研究では,不整合かつ正確に制御可能な潜伏表現を持つ仮想人物の顔画像生成手法であるDiscoFaceGANを提案する。
解析的3次元顔の変形・描画過程のイメージ形成を模倣するために,3次元前処理を逆学習に組み込んでネットワークを訓練する。
論文 参考訳(メタデータ) (2020-04-24T11:21:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。