論文の概要: Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection
- arxiv url: http://arxiv.org/abs/2601.20461v1
- Date: Wed, 28 Jan 2026 10:35:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.895075
- Title: Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection
- Title(参考訳): AI生成画像検出のためのジェネレータアーキテクチャの最終コンポーネントの探索
- Authors: Yanzhu Liu, Xiao Liu, Yuexuan Wang, Mondal Soumik,
- Abstract要約: DINOv3のバックボーンで調整された検出器は、22個のテストセットで平均98.83%の精度を持つ。
筆者らは, ジェネレータの最終成分を用いて実像を「汚染」し, 検出器を訓練し, 元の実像と区別することを提案する。
- 参考スコア(独自算出の注目度): 8.799682136894914
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the rapid proliferation of powerful image generators, accurate detection of AI-generated images has become essential for maintaining a trustworthy online environment. However, existing deepfake detectors often generalize poorly to images produced by unseen generators. Notably, despite being trained under vastly different paradigms, such as diffusion or autoregressive modeling, many modern image generators share common final architectural components that serve as the last stage for converting intermediate representations into images. Motivated by this insight, we propose to "contaminate" real images using the generator's final component and train a detector to distinguish them from the original real images. We further introduce a taxonomy based on generators' final components and categorize 21 widely used generators accordingly, enabling a comprehensive investigation of our method's generalization capability. Using only 100 samples from each of three representative categories, our detector-fine-tuned on the DINOv3 backbone-achieves an average accuracy of 98.83% across 22 testing sets from unseen generators.
- Abstract(参考訳): 強力な画像生成装置の急速な普及に伴い、信頼できるオンライン環境を維持するためには、AI生成画像の正確な検出が不可欠になっている。
しかし、既存のディープフェイク検出器は、しばしば目に見えない発電機によって生成された画像に悪影響を及ぼす。
特に、拡散や自己回帰モデリングなど、非常に異なるパラダイムで訓練されているにもかかわらず、現代の画像生成装置の多くは、中間表現をイメージに変換する最終段階として機能する一般的なアーキテクチャコンポーネントを共有している。
この知見に触発されて、我々はジェネレータの最終成分を用いて実画像を「汚染」し、検出器を訓練して元の実画像と区別することを提案する。
さらに, ジェネレータの最終構成成分に基づく分類を導入し, 21個の広く使用されているジェネレータを分類し, 本手法の一般化能力に関する総合的な調査を可能にする。
3つの代表的なカテゴリからそれぞれ100点のサンプルを使用して、DINOv3のバックボーンに調整された検出器は、22個のテストセットで平均98.83%の精度を達成している。
関連論文リスト
- FUSE: Unifying Spectral and Semantic Cues for Robust AI-Generated Image Detection [0.2446672595462589]
FUSEは、Fast Fourier Transformから抽出されたスペクトル特徴とCLIPのビジョンエンコーダから得られたセマンティック特徴を組み合わせたハイブリッドシステムである。
GenImageデータセットの平均精度は91.36%、テストされたすべてのジェネレータの平均精度は88.71%、平均精度は94.96%である。
論文 参考訳(メタデータ) (2025-12-25T14:38:39Z) - AdaptPrompt: Parameter-Efficient Adaptation of VLMs for Generalizable Deepfake Detection [7.76090543025328]
画像生成の最近の進歩により、高度にリアルな合成メディアが普及し、信頼性の高いディープフェイク検出の難しさが高まっている。
重要な課題は一般化であり、限られた種類の発電機で訓練された検出器は、目に見えないモデルに直面すると失敗することが多い。
本稿では,大規模視覚言語モデル(特にCLIP)を活用して,多様な生成技術にまたがる合成内容の同定を行うことにより,一般化可能な検出の必要性に対処する。
論文 参考訳(メタデータ) (2025-12-19T16:06:03Z) - Beyond Semantic Features: Pixel-level Mapping for Generalized AI-Generated Image Detection [30.53429368921365]
現在の検出器の限界は、目に見えない生成モデルからの画像に一般化できないことである。
本稿では,画像の画素値分布を乱すための,単純かつ極めて効果的な画素レベルのマッピング前処理手順を提案する。
本手法は, 最先端検出器のクロスジェネレータ性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2025-12-19T08:47:09Z) - Breaking Latent Prior Bias in Detectors for Generalizable AIGC Image Detection [11.907536189598577]
現在のAIGC検出器は、トレーニングに使用される同じジェネレータで生成された画像に対してほぼ完璧な精度を達成するが、目に見えないジェネレータからの出力に一般化するのに苦労する。
検出器は、堅牢な生成アーティファクトを学ぶのではなく、初期ノイズベクトルから発生するパターンに関連するショートカットを学習する。
そこで我々は, 発電機の出力多様体に残る逆数例を生成するオン・マニフォールド・逆数訓練(OMAT)を提案する。
論文 参考訳(メタデータ) (2025-06-01T07:20:45Z) - D$^3$: Scaling Up Deepfake Detection by Learning from Discrepancy [29.919663502808575]
既存の文献は、目に見えない発電機上でのディープフェイク検出の一般化能力を強調している。
この研究は、より一般化と堅牢性のある普遍的なディープフェイク検出システムに向けた一歩である。
論文 参考訳(メタデータ) (2024-04-06T10:45:02Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Rethinking the Up-Sampling Operations in CNN-based Generative Network
for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。
tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。
この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文 参考訳(メタデータ) (2023-12-16T14:27:06Z) - Securing Deep Generative Models with Universal Adversarial Signature [69.51685424016055]
深い生成モデルは、その潜在的な誤用のために社会に脅威をもたらす。
本稿では,任意の事前学習型生成モデルに普遍的逆数シグネチャを注入することを提案する。
提案手法は, FFHQ と ImageNet のデータセット上で, 様々な最先端生成モデルを用いて検証する。
論文 参考訳(メタデータ) (2023-05-25T17:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。