論文の概要: Beyond Semantic Features: Pixel-level Mapping for Generalized AI-Generated Image Detection
- arxiv url: http://arxiv.org/abs/2512.17350v1
- Date: Fri, 19 Dec 2025 08:47:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.313121
- Title: Beyond Semantic Features: Pixel-level Mapping for Generalized AI-Generated Image Detection
- Title(参考訳): セマンティック機能を超えて:汎用AI生成画像検出のためのピクセルレベルのマッピング
- Authors: Chenming Zhou, Jiaan Wang, Yu Li, Lei Li, Juan Cao, Sheng Tang,
- Abstract要約: 現在の検出器の限界は、目に見えない生成モデルからの画像に一般化できないことである。
本稿では,画像の画素値分布を乱すための,単純かつ極めて効果的な画素レベルのマッピング前処理手順を提案する。
本手法は, 最先端検出器のクロスジェネレータ性能を著しく向上させることを示す。
- 参考スコア(独自算出の注目度): 30.53429368921365
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of generative technologies necessitates reliable methods for detecting AI-generated images. A critical limitation of current detectors is their failure to generalize to images from unseen generative models, as they often overfit to source-specific semantic cues rather than learning universal generative artifacts. To overcome this, we introduce a simple yet remarkably effective pixel-level mapping pre-processing step to disrupt the pixel value distribution of images and break the fragile, non-essential semantic patterns that detectors commonly exploit as shortcuts. This forces the detector to focus on more fundamental and generalizable high-frequency traces inherent to the image generation process. Through comprehensive experiments on GAN and diffusion-based generators, we show that our approach significantly boosts the cross-generator performance of state-of-the-art detectors. Extensive analysis further verifies our hypothesis that the disruption of semantic cues is the key to generalization.
- Abstract(参考訳): 生成技術の急速な進化は、AI生成画像を検出するための信頼性の高い方法を必要とする。
現在の検出器の限界は、普遍的な生成アーティファクトを学習するよりも、しばしばソース固有のセマンティックキューに過度に適合するため、目に見えない生成モデルからのイメージに一般化できないことである。
これを解決するために,画像の画素値分布を乱し,検出者が通常ショートカットとして利用する脆弱で非意味な意味的パターンを壊すための,シンプルかつ極めて効果的な画素レベルのマッピング前処理手順を導入する。
これにより検出器は、画像生成プロセスに固有の、より基本的で一般化可能な高周波トレースに集中せざるを得なくなる。
GANと拡散型ジェネレータの総合的な実験を通して,本手法は最先端検出器のクロスジェネレータ性能を大幅に向上させることを示した。
包括的解析は、セマンティックキューの破壊が一般化の鍵であるという我々の仮説をさらに検証する。
関連論文リスト
- Towards Sustainable Universal Deepfake Detection with Frequency-Domain Masking [17.153540024060483]
ユニバーサルディープフェイク検出は、目に見えないものを含む、幅広い生成モデルにわたるAI生成画像を特定することを目的としている。
これは新鮮で目に見えないディープフェイクへの堅牢な一般化を必要とし、頻繁に現れる。
本研究では,ディープフェイク検出器のトレーニング戦略として周波数領域マスキングを検討する。
論文 参考訳(メタデータ) (2025-12-08T21:08:25Z) - Self-Supervised AI-Generated Image Detection: A Camera Metadata Perspective [80.10217707456046]
カメラメタデータを利用したAI生成画像検出のための自己教師型アプローチを提案する。
分類型EXIFタグを分類することにより,撮影画像のみに特徴抽出器を訓練する。
我々の検出器は、電界中のサンプルに対して強力な一般化と、一般的な良性イメージの摂動に対する堅牢性を提供する。
論文 参考訳(メタデータ) (2025-12-05T11:53:18Z) - CINEMAE: Leveraging Frozen Masked Autoencoders for Cross-Generator AI Image Detection [25.84217122259626]
CINEMAEはテキスト検出法の中核となる原則を視覚領域に適用する。
我々は、安定拡散v1.4のみをトレーニングし、GenImageベンチマークの8つの未知のジェネレータに対して95%以上の精度を達成した。
このことは、文脈条件の再構成の不確実性が、AIGC検出のための堅牢で転送可能な信号を提供することを示している。
論文 参考訳(メタデータ) (2025-11-09T11:05:45Z) - Bi-Level Optimization for Self-Supervised AI-Generated Face Detection [56.57881725223548]
両レベル最適化に基づくAI生成顔検出器の自己教師方式を提案する。
我々の検出器は、一級・二級の分類設定において、既存のアプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-07-30T16:38:29Z) - Breaking Latent Prior Bias in Detectors for Generalizable AIGC Image Detection [11.907536189598577]
現在のAIGC検出器は、トレーニングに使用される同じジェネレータで生成された画像に対してほぼ完璧な精度を達成するが、目に見えないジェネレータからの出力に一般化するのに苦労する。
検出器は、堅牢な生成アーティファクトを学ぶのではなく、初期ノイズベクトルから発生するパターンに関連するショートカットを学習する。
そこで我々は, 発電機の出力多様体に残る逆数例を生成するオン・マニフォールド・逆数訓練(OMAT)を提案する。
論文 参考訳(メタデータ) (2025-06-01T07:20:45Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Time Step Generating: A Universal Synthesized Deepfake Image Detector [0.4488895231267077]
汎用合成画像検出器 Time Step Generating (TSG) を提案する。
TSGは、事前訓練されたモデルの再構築能力、特定のデータセット、サンプリングアルゴリズムに依存していない。
我々は,提案したTSGを大規模GenImageベンチマークで検証し,精度と一般化性の両方において大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-11-17T09:39:50Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。