論文の概要: Combating Pattern and Content Bias: Adversarial Feature Learning for Generalized AI-Generated Image Detection
- arxiv url: http://arxiv.org/abs/2604.12353v1
- Date: Tue, 14 Apr 2026 06:41:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.293444
- Title: Combating Pattern and Content Bias: Adversarial Feature Learning for Generalized AI-Generated Image Detection
- Title(参考訳): 会話パターンとコンテンツバイアス:汎用AI生成画像検出のための敵対的特徴学習
- Authors: Haifeng Zhang, Qinghui He, Xiuli Bi, Bo Liu, Chi-Man Pun, Bin Xiao,
- Abstract要約: 高品質な偽画像を作成するための多次元逆特徴学習フレームワークを提案する。
生成パターンとコンテンツバイアスを抑えることにより、MAFLは、異なる生成モデル間で共有される生成機能に焦点を合わせるようにモデルをガイドする。
提案手法は,従来の最先端手法を10.89%,平均精度8.57%で上回っている。
- 参考スコア(独自算出の注目度): 44.91910921880288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the rapid development of generative artificial intelligence technology has significantly lowered the barrier to creating high-quality fake images, posing a serious challenge to information authenticity and credibility. Existing generated image detection methods typically enhance generalization through model architecture or network design. However, their generalization performance remains susceptible to data bias, as the training data may drive models to fit specific generative patterns and content rather than the common features shared by images from different generative models (asymmetric bias learning). To address this issue, we propose a Multi-dimensional Adversarial Feature Learning (MAFL) framework. The framework adopts a pretrained multimodal image encoder as the feature extraction backbone, constructs a real-fake feature learning network, and designs an adversarial bias-learning branch equipped with a multi-dimensional adversarial loss, forming an adversarial training mechanism between authenticity-discriminative feature learning and bias feature learning. By suppressing generation-pattern and content biases, MAFL guides the model to focus on the generative features shared across different generative models, thereby effectively capturing the fundamental differences between real and generated images, enhancing cross-model generalization, and substantially reducing the reliance on large-scale training data. Through extensive experimental validation, our method outperforms existing state-of-the-art approaches by 10.89% in accuracy and 8.57% in Average Precision (AP). Notably, even when trained with only 320 images, it can still achieve over 80% detection accuracy on public datasets.
- Abstract(参考訳): 近年、生成人工知能技術の急速な発展は、高品質な偽画像を作成するための障壁を著しく減らし、情報の信頼性と信頼性に深刻な課題を提起している。
既存の画像検出手法は一般にモデルアーキテクチャやネットワーク設計による一般化を促進する。
しかし、それらの一般化性能は、異なる生成モデル(非対称バイアス学習)のイメージによって共有される共通の特徴よりも、特定の生成パターンやコンテンツに適合するモデルを駆動するので、データバイアスの影響を受けないままである。
この問題に対処するために,多次元適応特徴学習(MAFL)フレームワークを提案する。
本フレームワークは、予め訓練されたマルチモーダル画像エンコーダを特徴抽出バックボーンとして採用し、実造特徴学習ネットワークを構築し、多次元の対向損失を備えた対向バイアス学習ブランチを設計し、真偽識別特徴学習と偏向特徴学習との間に対向訓練機構を形成する。
生成パターンとコンテンツバイアスを抑えることにより、MAFLは、異なる生成モデル間で共有される生成機能に焦点を合わせ、実際の画像と生成された画像の根本的な違いを効果的に把握し、クロスモデル一般化を強化し、大規模トレーニングデータへの依存を大幅に低減する。
実験により,従来の手法よりも精度が10.89%,精度が8.57%,精度が8.57%向上した。
特に、わずか320イメージでトレーニングされた場合でも、パブリックデータセットで80%以上の検出精度を達成できる。
関連論文リスト
- Detecting AI-Generated Images via Distributional Deviations from Real Images [6.615773227400183]
ファインチューニング中に生成モデル固有のパターンを含むテクスチャ領域をマスクするテクスチャ・アウェア・マスキング(TAM)機構を導入する。
我々の手法は最小限の画像しか調整されず、既存の手法よりも大幅に優れており、2つのデータセットの平均精度は98.2%と94.6%に達する。
論文 参考訳(メタデータ) (2026-01-07T05:00:13Z) - A Bias-Free Training Paradigm for More General AI-generated Image Detection [15.421102443599773]
良く設計された法医学的検知器は、データバイアスを反映するのではなく、生成物固有のアーティファクトを検出する必要がある。
本稿では,実画像から偽画像を生成する,バイアスのない学習パラダイムであるB-Freeを提案する。
我々は,最先端検出器の一般化とロバスト性の両方において有意な改善が認められた。
論文 参考訳(メタデータ) (2024-12-23T15:54:32Z) - GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [60.101097709212716]
本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。
本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。
提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文 参考訳(メタデータ) (2024-12-03T10:45:34Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Time Step Generating: A Universal Synthesized Deepfake Image Detector [0.4488895231267077]
汎用合成画像検出器 Time Step Generating (TSG) を提案する。
TSGは、事前訓練されたモデルの再構築能力、特定のデータセット、サンプリングアルゴリズムに依存していない。
我々は,提案したTSGを大規模GenImageベンチマークで検証し,精度と一般化性の両方において大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-11-17T09:39:50Z) - RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection [60.960988614701414]
RIGIDは、堅牢なAI生成画像検出のためのトレーニング不要でモデルに依存しない方法である。
RIGIDは、既存のトレーニングベースおよびトレーニング不要な検出器を著しく上回っている。
論文 参考訳(メタデータ) (2024-05-30T14:49:54Z) - Active Generation for Image Classification [45.93535669217115]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。