論文の概要: A naive method to discover directions in the StyleGAN2 latent space
- arxiv url: http://arxiv.org/abs/2203.10373v1
- Date: Sat, 19 Mar 2022 18:43:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-26 15:44:29.341908
- Title: A naive method to discover directions in the StyleGAN2 latent space
- Title(参考訳): stylegan2潜在空間における方向検出のためのナイーブ法
- Authors: Andrea Giardina, Soumya Subhra Paria, Adhikari Kaustubh
- Abstract要約: 本稿では,画像のリアルな顔を生成することが可能なGANアーキテクチャであるStyleGAN2の出力を制御するために,インバージョンプロセスをどのように簡単に利用することができるかを示す。
本稿では,CelebA-HQデータベースから抽出した画像に提案手法を適用した結果を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Several research groups have shown that Generative Adversarial Networks
(GANs) can generate photo-realistic images in recent years. Using the GANs, a
map is created between a latent code and a photo-realistic image. This process
can also be reversed: given a photo as input, it is possible to obtain the
corresponding latent code. In this paper, we will show how the inversion
process can be easily exploited to interpret the latent space and control the
output of StyleGAN2, a GAN architecture capable of generating photo-realistic
faces. From a biological perspective, facial features such as nose size depend
on important genetic factors, and we explore the latent spaces that correspond
to such biological features, including masculinity and eye colour. We show the
results obtained by applying the proposed method to a set of photos extracted
from the CelebA-HQ database. We quantify some of these measures by utilizing
two landmarking protocols, and evaluate their robustness through statistical
analysis. Finally we correlate these measures with the input parameters used to
perturb the latent spaces along those interpretable directions. Our results
contribute towards building the groundwork of using such GAN architecture in
forensics to generate photo-realistic faces that satisfy certain biological
attributes.
- Abstract(参考訳): いくつかの研究グループが、GAN(Generative Adversarial Networks)は近年、フォトリアリスティックな画像を生成することができることを示した。
GANを使用して、潜在コードとフォトリアリスティック画像の間にマップを作成する。
この処理は逆転することもできる:写真が入力として与えられると、対応する潜在コードを取得することができる。
本稿では, 潜在空間を解釈し, フォトリアリスティックな顔を生成するganアーキテクチャであるstylegan2の出力を制御するために, インバージョンプロセスが容易に利用できることを示す。
生物学的観点からは, 鼻の大きさなどの顔の特徴は重要な遺伝的要因に依存し, このような生物学的特徴に対応する潜伏空間を探索する。
本稿では,CelebA-HQデータベースから抽出した画像に提案手法を適用した結果を示す。
2つのランドマークプロトコルを利用していくつかの指標を定量化し,統計解析によりロバスト性を評価する。
最後に、これらの測度をこれらの解釈可能な方向に沿って潜在空間を摂動させる入力パラメータと関連付ける。
本研究は, 生物特性を満足するフォトリアリスティックな顔を生成するために, このようなGANアーキテクチャを法医学で活用する基盤構築に寄与する。
関連論文リスト
- Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。
CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文 参考訳(メタデータ) (2024-07-29T18:00:10Z) - GH-Feat: Learning Versatile Generative Hierarchical Features from GANs [61.208757845344074]
画像合成から学習した生成機能は、幅広いコンピュータビジョンタスクを解く上で大きな可能性を秘めていることを示す。
まず,事前学習したStyleGANジェネレータを学習損失関数として考慮し,エンコーダを訓練する。
GH-Feat(Generative Hierarchical Features)と呼ばれるエンコーダが生成する視覚的特徴は、階層的なGAN表現と高度に一致している。
論文 参考訳(メタデータ) (2023-01-12T21:59:46Z) - Detecting High-Quality GAN-Generated Face Images using Neural Networks [23.388645531702597]
本稿では,スペクトル帯域差を利用したGAN生成画像と実画像との区別手法を提案する。
特に,クロスバンド共起行列と空間共起行列を用いて,顔画像のデジタル保存を可能にする。
性能向上は特に重要であり、異なる後処理環境において92%以上を達成することを示す。
論文 参考訳(メタデータ) (2022-03-03T13:53:27Z) - Low-Rank Subspaces in GANs [101.48350547067628]
この研究は、GAN生成をより正確に制御できる低ランクな部分空間を導入している。
LowRankGAN は属性多様体の低次元表現を見つけることができる。
さまざまなデータセットでトレーニングされた最先端のGANモデル(StyleGAN2やBigGANなど)の実験は、私たちのLowRankGANの有効性を示しています。
論文 参考訳(メタデータ) (2021-06-08T16:16:32Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - CNN Detection of GAN-Generated Face Images based on Cross-Band
Co-occurrences Analysis [34.41021278275805]
最終世代のGANモデルでは、自然と視覚的に区別できない合成画像を生成することができる。
本稿では、スペクトル帯域間の不整合を利用して、自然画像とGAN生成物を区別する手法を提案する。
論文 参考訳(メタデータ) (2020-07-25T10:55:04Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z) - Deep Snow: Synthesizing Remote Sensing Imagery with Generative
Adversarial Nets [0.5249805590164901]
GAN(Generative Adversarial Network)は、リモートセンシング画像における現実的な広汎な変化を生成するために用いられる。
生成画像と実画像の深い埋め込みに基づく変換品質指標について検討する。
論文 参考訳(メタデータ) (2020-05-18T17:05:00Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。