論文の概要: Multi-Channel Cross Modal Detection of Synthetic Face Images
- arxiv url: http://arxiv.org/abs/2311.16773v1
- Date: Tue, 28 Nov 2023 13:30:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-29 18:16:48.927121
- Title: Multi-Channel Cross Modal Detection of Synthetic Face Images
- Title(参考訳): 合成顔画像のマルチチャネルクロスモーダル検出
- Authors: M. Ibsen, C. Rathgeb, S. Marcel, C. Busch
- Abstract要約: 合成生成された顔画像は、人間による実際の画像と区別できないことが示されている。
高速かつ任意の画像後処理が可能な新しい生成モデルを提案する。
完全に合成された顔画像を検出するためのマルチチャネルアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetically generated face images have shown to be indistinguishable from
real images by humans and as such can lead to a lack of trust in digital
content as they can, for instance, be used to spread misinformation. Therefore,
the need to develop algorithms for detecting entirely synthetic face images is
apparent. Of interest are images generated by state-of-the-art deep
learning-based models, as these exhibit a high level of visual realism. Recent
works have demonstrated that detecting such synthetic face images under
realistic circumstances remains difficult as new and improved generative models
are proposed with rapid speed and arbitrary image post-processing can be
applied. In this work, we propose a multi-channel architecture for detecting
entirely synthetic face images which analyses information both in the frequency
and visible spectra using Cross Modal Focal Loss. We compare the proposed
architecture with several related architectures trained using Binary Cross
Entropy and show in cross-model experiments that the proposed architecture
supervised using Cross Modal Focal Loss, in general, achieves most competitive
performance.
- Abstract(参考訳): 人工的に生成された顔画像は、人間によって実際の画像と区別できないことが示されており、例えば誤情報の拡散に使用できるデジタルコンテンツに対する信頼の欠如につながる可能性がある。
したがって、完全に合成された顔画像を検出するアルゴリズムを開発する必要がある。
興味深いのは、最先端のディープラーニングベースのモデルによって生成された画像である。
近年の研究では, 高速で改良された生成モデルが提案され, 任意の後処理を適用できるため, 実環境下での合成顔画像の検出は依然として困難であることが示された。
本研究では,周波数スペクトルと可視スペクトルの両方の情報をクロスモーダル焦点損失を用いて解析する,完全合成顔画像を検出するマルチチャネルアーキテクチャを提案する。
提案アーキテクチャをバイナリクロスエントロピーを用いてトレーニングしたいくつかの関連するアーキテクチャと比較し,クロスモーダル焦点損失を用いたクロスモデル実験において,提案アーキテクチャが最も競争力の高い性能が得られることを示す。
関連論文リスト
- Detection of Synthetic Face Images: Accuracy, Robustness, Generalization [1.757194730633422]
合成画像と実画像の分離において,特定の画像生成装置で訓練した簡単なモデルでほぼ完璧な精度が得られることがわかった。
このモデルは敵の攻撃に弱いことが判明し、目に見えない発電機には一般化されなかった。
論文 参考訳(メタデータ) (2024-06-25T13:34:50Z) - Generalizable Synthetic Image Detection via Language-guided Contrastive
Learning [22.4158195581231]
偽ニュースの拡散や偽のプロフィールの作成などの合成画像の真偽の使用は、画像の真正性に関する重要な懸念を提起する。
本稿では,言語指導によるコントラスト学習と検出問題の新たな定式化による,シンプルで効果的な合成画像検出手法を提案する。
提案したLanguAge-guided SynThEsis Detection (LASTED) モデルでは,画像生成モデルに対する一般化性が大幅に向上していることが示されている。
論文 参考訳(メタデータ) (2023-05-23T08:13:27Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Joint Learning of Deep Texture and High-Frequency Features for
Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。
セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。
原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文 参考訳(メタデータ) (2022-09-07T17:30:40Z) - SynFace: Face Recognition with Synthetic Data [83.15838126703719]
我々は、ID混在(IM)とドメイン混在(DM)を併用したSynFaceを考案し、パフォーマンスギャップを緩和する。
また、合成顔画像の系統的実験分析を行い、合成データを顔認識に効果的に活用する方法についての知見を提供する。
論文 参考訳(メタデータ) (2021-08-18T03:41:54Z) - Identity-Aware CycleGAN for Face Photo-Sketch Synthesis and Recognition [61.87842307164351]
まず,画像生成ネットワークの監視に新たな知覚損失を適用したIACycleGAN(Identity-Aware CycleGAN)モデルを提案する。
眼や鼻などの重要な顔領域の合成により多くの注意を払うことで、フォトエッチング合成におけるサイクガンを改善する。
IACycleGANによる画像の合成を反復的に行う合成モデルと認識モデルとの相互最適化手法を開発した。
論文 参考訳(メタデータ) (2021-03-30T01:30:08Z) - CNN Detection of GAN-Generated Face Images based on Cross-Band
Co-occurrences Analysis [34.41021278275805]
最終世代のGANモデルでは、自然と視覚的に区別できない合成画像を生成することができる。
本稿では、スペクトル帯域間の不整合を利用して、自然画像とGAN生成物を区別する手法を提案する。
論文 参考訳(メタデータ) (2020-07-25T10:55:04Z) - Intrinsic Autoencoders for Joint Neural Rendering and Intrinsic Image
Decomposition [67.9464567157846]
合成3Dモデルからリアルな画像を生成するためのオートエンコーダを提案し,同時に実像を本質的な形状と外観特性に分解する。
実験により, レンダリングと分解の併用処理が有益であることが確認され, 画像から画像への翻訳の質的, 定量的なベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2020-06-29T12:53:58Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z) - Learning Inverse Rendering of Faces from Real-world Videos [52.313931830408386]
既存の方法は、顔画像を3つの構成要素(アルベド、ノーマル、照明)に分解する。
本稿では,アルベドと正常の整合性の仮定に基づいて,我々のモデルを実顔ビデオでトレーニングするための弱い教師付きトレーニング手法を提案する。
私たちのネットワークは、実データと合成データの両方で訓練されています。
論文 参考訳(メタデータ) (2020-03-26T17:26:40Z) - Leveraging Frequency Analysis for Deep Fake Image Recognition [35.1862941141084]
ディープニューラルネットワークは驚くべきほどリアルな画像を生成することができるため、人間が実際の写真と区別するのはしばしば困難である。
これらの成果は主にGAN(Generative Adversarial Networks)によって実現されている。
本稿では、周波数空間において、GAN生成した画像は、容易に識別できる重いアーティファクトを示すことを示す。
論文 参考訳(メタデータ) (2020-03-19T11:06:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。