論文の概要: Diffusion Facial Forgery Detection
- arxiv url: http://arxiv.org/abs/2401.15859v1
- Date: Mon, 29 Jan 2024 03:20:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 16:16:32.596015
- Title: Diffusion Facial Forgery Detection
- Title(参考訳): 拡散顔の偽造検出
- Authors: Harry Cheng and Yangyang Guo and Tianyi Wang and Liqiang Nie and Mohan
Kankanhalli
- Abstract要約: 本稿では,顔に焦点をあてた拡散生成画像を対象とした包括的データセットであるDiFFを紹介する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果、人間の観察者と自動検出者の2値検出精度は30%以下であることが判明した。
- 参考スコア(独自算出の注目度): 56.69763252655695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting diffusion-generated images has recently grown into an emerging
research area. Existing diffusion-based datasets predominantly focus on general
image generation. However, facial forgeries, which pose a more severe social
risk, have remained less explored thus far. To address this gap, this paper
introduces DiFF, a comprehensive dataset dedicated to face-focused
diffusion-generated images. DiFF comprises over 500,000 images that are
synthesized using thirteen distinct generation methods under four conditions.
In particular, this dataset leverages 30,000 carefully collected textual and
visual prompts, ensuring the synthesis of images with both high fidelity and
semantic consistency. We conduct extensive experiments on the DiFF dataset via
a human test and several representative forgery detection methods. The results
demonstrate that the binary detection accuracy of both human observers and
automated detectors often falls below 30%, shedding light on the challenges in
detecting diffusion-generated facial forgeries. Furthermore, we propose an edge
graph regularization approach to effectively enhance the generalization
capability of existing detectors.
- Abstract(参考訳): 拡散生成画像の検出は近年,新たな研究領域に成長している。
既存の拡散に基づくデータセットは主に一般的な画像生成に焦点を当てている。
しかし、より深刻な社会的リスクをもたらす顔の偽造は、これまであまり研究されていない。
そこで本稿では,顔に焦点をあてた拡散生成画像のための総合データセットdiffを提案する。
DiFFは4つの条件下で13個の異なる生成法を用いて合成される50,000以上の画像からなる。
特に、このデータセットは3万件の注意深く収集されたテキストと視覚的プロンプトを活用し、高い忠実度とセマンティック一貫性を持つ画像の合成を保証する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果,人間の観察者と自動検出者の両方の2値検出精度は30%以下に低下し,拡散生成顔偽造検出の課題に光を当てた。
さらに,既存検出器の一般化能力を効果的に向上するためのエッジグラフ正規化手法を提案する。
関連論文リスト
- Semi-Truths: A Large-Scale Dataset of AI-Augmented Images for Evaluating Robustness of AI-Generated Image detectors [62.63467652611788]
実画像27,600枚、223,400枚、AI拡張画像1,472,700枚を含むSEMI-TRUTHSを紹介する。
それぞれの画像には、検出器のロバスト性の標準化と目標評価のためのメタデータが添付されている。
以上の結果から,現状の検出器は摂動の種類や程度,データ分布,拡張方法に様々な感度を示すことが示唆された。
論文 参考訳(メタデータ) (2024-11-12T01:17:27Z) - UGAD: Universal Generative AI Detector utilizing Frequency Fingerprints [18.47018538990973]
本研究では,AI生成画像を検出するための新しいマルチモーダル手法を提案する。
提案手法は,実画像とAI画像の識別精度を大幅に向上させる。
論文 参考訳(メタデータ) (2024-09-12T10:29:37Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Text Modality Oriented Image Feature Extraction for Detecting Diffusion-based DeepFake [32.237169711785896]
拡散ベースのDeepFakesは、オンライン情報の完全性と安全性に重大なリスクをもたらす。
テキストモダリティ指向の特徴抽出手法TOFEを提案する。
10種類の拡散型を対象に実験を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-05-28T11:29:30Z) - Trinity Detector:text-assisted and attention mechanisms based spectral fusion for diffusion generation image detection [3.8473504915778745]
Trinity Detectorは、CLIPエンコーダを通じて粗粒度のテキスト機能を組み込んで、ピクセル領域の細粒度のアーティファクトとコヒーレントに統合して、包括的なマルチモーダル検出を行う。
当社のパフォーマンスは、すべてのデータセットで競争力があり、拡散データセットの転送性は最大17.6%向上しています。
論文 参考訳(メタデータ) (2024-04-26T08:50:35Z) - DiffusionFace: Towards a Comprehensive Dataset for Diffusion-Based Face Forgery Analysis [71.40724659748787]
DiffusionFaceは、最初の拡散ベースのフェイスフォージェリーデータセットである。
非条件およびテキストガイドの顔画像生成、Img2Img、Inpaint、Diffusionベースの顔交換アルゴリズムなど、さまざまなフォージェリーカテゴリをカバーする。
重要なメタデータと、評価のための実世界のインターネットソースの偽顔画像データセットを提供する。
論文 参考訳(メタデータ) (2024-03-27T11:32:44Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Detecting Images Generated by Deep Diffusion Models using their Local
Intrinsic Dimensionality [8.968599131722023]
拡散モデルは驚くほどリアルな画像の視覚合成に成功している。
これにより、悪意のある目的のために、彼らの可能性に対する強い懸念が持ち上がる。
合成画像の自動検出に軽量な多重局所固有次元法(multiLID)を提案する。
論文 参考訳(メタデータ) (2023-07-05T15:03:10Z) - Deceptive-NeRF/3DGS: Diffusion-Generated Pseudo-Observations for High-Quality Sparse-View Reconstruction [60.52716381465063]
我々は,限られた入力画像のみを用いて,スパースビュー再構成を改善するために,Deceptive-NeRF/3DGSを導入した。
具体的には,少数視点再構成によるノイズ画像から高品質な擬似観測へ変換する,偽拡散モデルを提案する。
本システムでは,拡散生成擬似観測をトレーニング画像集合に徐々に組み込んで,スパース入力観測を5倍から10倍に高めている。
論文 参考訳(メタデータ) (2023-05-24T14:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。