論文の概要: Generalizable and Adaptive Continual Learning Framework for AI-generated Image Detection
- arxiv url: http://arxiv.org/abs/2601.05580v1
- Date: Fri, 09 Jan 2026 07:01:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.881004
- Title: Generalizable and Adaptive Continual Learning Framework for AI-generated Image Detection
- Title(参考訳): AI生成画像検出のための一般化型・適応型連続学習フレームワーク
- Authors: Hanyi Wang, Jun Lan, Yaoyu Kang, Huijia Zhu, Weiqiang Wang, Zhuosheng Zhang, Shilin Wang,
- Abstract要約: 悪意のある誤用とAI生成画像の普及は、オンライン情報の信頼性に重大な脅威をもたらす。
現在の検出方法は、しばしば目に見えない生成モデルに一般化するのに苦労する。
本稿では,進化的生成モデルへの継続的適応を目的とした3段階連続学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 42.71754298609258
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The malicious misuse and widespread dissemination of AI-generated images pose a significant threat to the authenticity of online information. Current detection methods often struggle to generalize to unseen generative models, and the rapid evolution of generative techniques continuously exacerbates this challenge. Without adaptability, detection models risk becoming ineffective in real-world applications. To address this critical issue, we propose a novel three-stage domain continual learning framework designed for continuous adaptation to evolving generative models. In the first stage, we employ a strategic parameter-efficient fine-tuning approach to develop a transferable offline detection model with strong generalization capabilities. Building upon this foundation, the second stage integrates unseen data streams into a continual learning process. To efficiently learn from limited samples of novel generated models and mitigate overfitting, we design a data augmentation chain with progressively increasing complexity. Furthermore, we leverage the Kronecker-Factored Approximate Curvature (K-FAC) method to approximate the Hessian and alleviate catastrophic forgetting. Finally, the third stage utilizes a linear interpolation strategy based on Linear Mode Connectivity, effectively capturing commonalities across diverse generative models and further enhancing overall performance. We establish a comprehensive benchmark of 27 generative models, including GANs, deepfakes, and diffusion models, chronologically structured up to August 2024 to simulate real-world scenarios. Extensive experiments demonstrate that our initial offline detectors surpass the leading baseline by +5.51% in terms of mean average precision. Our continual learning strategy achieves an average accuracy of 92.20%, outperforming state-of-the-art methods.
- Abstract(参考訳): 悪意のある誤用とAI生成画像の普及は、オンライン情報の信頼性に重大な脅威をもたらす。
現在の検出法は、しばしば目に見えない生成モデルを一般化するのに苦労し、生成技術の急速な進化は、この課題を継続的に悪化させる。
適応性がないと、検出モデルは現実世界のアプリケーションでは効果がない。
この重要な問題に対処するために,進化的生成モデルへの継続的適応を目的とした新しい3段階ドメイン連続学習フレームワークを提案する。
第一段階では、強力な一般化機能を持つ移動可能なオフライン検出モデルを開発するために、戦略パラメータ効率の良い微調整手法を用いる。
この基盤の上に構築された第2段階は、目に見えないデータストリームを継続的な学習プロセスに統合する。
新規モデルの限られたサンプルから効率的に学習し、過度な適合を緩和するために、徐々に複雑化するデータ拡張チェーンを設計する。
さらに, Kronecker-Factored Approximate Curvature (K-FAC) 法を用いて, ヘッセン方程式を近似し, 破滅的忘れを緩和する。
最後に、第3段階は線形モード接続性に基づく線形補間戦略を利用し、多種多様な生成モデル間の共通性を効果的に捕捉し、全体的な性能をさらに向上させる。
GAN、ディープフェイク、拡散モデルを含む27の生成モデルを総合的にベンチマークし、実世界のシナリオをシミュレートするため、2024年8月までに時系列的に構成した。
大規模な実験により、我々の初期のオフライン検出器は平均的な精度で先頭のベースラインを+5.51%超えることを示した。
我々の継続学習戦略は92.20%の精度で、最先端の手法よりも優れています。
関連論文リスト
- Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Deepfake Detection that Generalizes Across Benchmarks [48.85953407706351]
ディープフェイク検出器の非表示操作技術への一般化は、実用的展開の課題である。
この研究は、基礎となる事前学習された視覚エンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。
提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-08-08T12:03:56Z) - RAAG: Ratio Aware Adaptive Guidance [9.525432706814675]
フローベースの生成モデルは驚くべき進歩を遂げた。
推論全体を通じて強力な、固定されたガイダンススケールを適用することは、現代的なアプリケーションに必要な、迅速な、数ステップのサンプリングには適していない。
本稿では,進化率に基づいて早期段階の指導尺度を自動的に減衰させる,シンプルな,理論的に基礎付けられた適応型指導スケジュールを提案する。
論文 参考訳(メタデータ) (2025-08-05T13:41:05Z) - Automated Modeling Method for Pathloss Model Discovery [1.7373039830910548]
本稿では,解釈可能性を維持しながら経路損失モデルの発見を加速する新しい手法を提案する。
一つはDeep Symbolic Regressionをベースとし、もうひとつは完全な解釈可能性を提供し、もうひとつはKolmogorov-Arnold Networksをベースとし、2段階の解釈性を提供する。
以上の結果から,コルモゴロフ・アルノルドネットワークは最小の予測誤差で1に近い決定値R2の係数を達成する一方,Deep Symbolic Regressionは適度な精度でコンパクトなモデルを生成することがわかった。
論文 参考訳(メタデータ) (2025-05-29T12:04:07Z) - EDELINE: Enhancing Memory in Diffusion-based World Models via Linear-Time Sequence Modeling [8.250616459360684]
EDELINEは、状態空間モデルと拡散モデルを統合する統一世界モデルアーキテクチャである。
我々のアプローチは、視覚的に困難なAtari 100kタスク、メモリ要求ベンチマーク、3DファーストパーソンのViZDoom環境において、既存のベースラインよりも優れています。
論文 参考訳(メタデータ) (2025-02-01T15:49:59Z) - Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.5898357277047]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文 参考訳(メタデータ) (2023-05-11T17:55:25Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。