論文の概要: Worst-Case Morphs using Wasserstein ALI and Improved MIPGAN
- arxiv url: http://arxiv.org/abs/2310.08371v1
- Date: Thu, 12 Oct 2023 14:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 09:14:38.560485
- Title: Worst-Case Morphs using Wasserstein ALI and Improved MIPGAN
- Title(参考訳): wasserstein ali と mipgan による最悪の形態変化
- Authors: Una M. Kelly, Meike Nauta, Lu Liu, Luuk J. Spreeuwers, Raymond N. J.
Veldhuis
- Abstract要約: GANの潜在空間から画像空間へのマッピングには3つのネットワークが必要である。
これら3つのネットワークは、スクラッチから同時にトレーニングできる(逆学習推論)か、あるいは、画像がテキスト事前学習されたGANモデルの潜在空間にマッピングされるネットワーク(逆GAN)をトレーニングすることができる。
後者の場合、ネットワークは連続的にトレーニングされるので、デコーダは、GANトレーニング中にデコーダが学んだモデルに関係なくてはいけない。
2つの異なるアプローチを比較し、同時に3つのネットワークをトレーニングするのに余分な労力がかかるかどうかについて議論する。
- 参考スコア(独自算出の注目度): 5.1899190294312385
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A lot of progress has been made in the last years on using Generative
Adversarial Networks (GAN) to create realistic images. However, to be able
reconstruct images or to generate images using real data as input, an Encoder
is needed that reverses the mapping from the GAN's latent space to image space.
This means that three networks are needed: an Encoder, a Decoder (called
Generator in a normal GAN) and a Discriminator. These three networks can be
trained from scratch simultaneously (Adversarially Learned Inference), or
alternatively an Encoder network can be trained that maps images into the
latent space of a \textit{pretrained} GAN model (Inverse GAN). In the latter
case, the networks are trained consecutively, so the Encoder has to make do
with whatever model the Decoder learned during GAN training. Training three
networks simultaneously is more unstable and therefore more challenging, but it
is possible that the Encoder and Decoder benefit from interacting with each
other during training. We compare the two different approaches and discuss
whether it is worth the extra effort to train all three networks
simultaneously.
- Abstract(参考訳): 近年,GAN(Generative Adversarial Networks)による現実的なイメージ作成において,多くの進歩がなされている。
しかし、実際のデータを入力として再構成したり、画像を生成するためには、GANの潜在空間から画像空間へのマッピングを反転させるエンコーダが必要である。
これは、エンコーダ、デコーダ(通常のGANではジェネレータと呼ばれる)、ディスクリミネータの3つのネットワークが必要であることを意味する。
これら3つのネットワークは、同時にスクラッチから(逆学習による推論)トレーニングしたり、あるいは、イメージを \textit{pretrained} ganモデル(逆gan)の潜在空間にマッピングするエンコーダネットワークをトレーニングすることができる。
後者の場合、ネットワークは連続的にトレーニングされるので、Encoderは、GANトレーニング中にデコーダが学んだモデルに関係なくてはいけない。
同時に3つのネットワークをトレーニングすることは不安定であり、そのためより難しいが、EncoderとDecoderはトレーニング中に相互に通信する利点がある。
2つの異なるアプローチを比較し、同時に3つのネットワークをトレーニングする余分な労力に値するかどうかを議論する。
関連論文リスト
- dc-GAN: Dual-Conditioned GAN for Face Demorphing From a Single Morph [10.902536447343465]
そこで本研究では, モーフィック画像に条件付き新規なGANデモルフィック法であるdc-GANを提案する。
提案手法は, 形態の再現性を克服し, ボナフィド画像の高品質な再構成を行う。
論文 参考訳(メタデータ) (2024-11-20T19:24:30Z) - LADIMO: Face Morph Generation through Biometric Template Inversion with Latent Diffusion [5.602947425285195]
顔改ざん攻撃は、顔認識システムに深刻なセキュリティ脅威をもたらす。
本稿では,2つの顔認識の埋め込みにおいて,表現レベルの顔形態形成手法であるLADIMOを提案する。
顔形態変種は個々の攻撃成功率を持ち、形態的攻撃ポテンシャルを最大化できることを示す。
論文 参考訳(メタデータ) (2024-10-10T14:41:37Z) - SDeMorph: Towards Better Facial De-morphing from Single Morph [0.0]
顔認識システム(FRS)はモルヒネ攻撃に対して脆弱である。
現在のMorph Detection (MAD)は、その形態を検出できるが、その形態を生成するために使われるアイデンティティを回復できない。
SDeMorphは参照のない新しいデモルフィング法であり,ボナファイドのアイデンティティを復元する。
論文 参考訳(メタデータ) (2023-08-22T13:46:12Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - MorphGANFormer: Transformer-based Face Morphing and De-Morphing [55.211984079735196]
顔変形に対するスタイルGANベースのアプローチが主要な技術である。
本稿では,顔の変形に対する変換器ベースの代替手段を提案し,その利点をStyleGANベースの方法と比較した。
論文 参考訳(メタデータ) (2023-02-18T19:09:11Z) - StyleSwap: Style-Based Generator Empowers Robust Face Swapping [90.05775519962303]
StyleSwapという簡潔で効果的なフレームワークを紹介します。
私たちの中核となる考え方は、スタイルベースのジェネレータを活用して、高忠実で堅牢な顔交換を可能にすることです。
最小限の変更だけで、StyleGAN2アーキテクチャはソースとターゲットの両方から望まれる情報をうまく処理できる。
論文 参考訳(メタデータ) (2022-09-27T16:35:16Z) - MobileFaceSwap: A Lightweight Framework for Video Face Swapping [56.87690462046143]
主観的顔交換のための軽量IDN(IDN)を提案する。
提示されたIDNは0.50Mパラメータのみを含み、1フレームあたり0.33GのFLOPを必要とするため、携帯電話でリアルタイムのビデオ顔交換が可能である。
論文 参考訳(メタデータ) (2022-01-11T06:48:12Z) - A Face Recognition System's Worst Morph Nightmare, Theoretically [0.0]
顔認識システム(FRS)はモルヒネ攻撃に弱いが、ほとんどの研究はランドマークベースのモルヒネに重点を置いている。
本稿では,学習の容易さの利点を生かした,第3の異なる形態を創出する手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T14:09:47Z) - My Body is a Cage: the Role of Morphology in Graph-Based Incompatible
Control [65.77164390203396]
本稿では,グラフにエンコードされた形態情報により,その性能が向上しないことを示す既存手法に関する一連のアブリケーションを示す。
グラフ構造からGNNが抽出した利益は、メッセージパッシングのために生じる困難によって上回っているという仮説により、Amorpheusも提案する。
論文 参考訳(メタデータ) (2020-10-05T08:37:11Z) - Can GAN Generated Morphs Threaten Face Recognition Systems Equally as
Landmark Based Morphs? -- Vulnerability and Detection [22.220940043294334]
本稿では,新たなGAN(Generative Adversarial Network)-StyleGANを用いた顔形態生成フレームワークを提案する。
2500枚の顔画像が新たに作成された形態データセットでは、この研究に批判的な疑問が浮かび上がっている。
論文 参考訳(メタデータ) (2020-07-07T16:52:56Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。