論文の概要: SAIDO: Generalizable Detection of AI-Generated Images via Scene-Aware and Importance-Guided Dynamic Optimization in Continual Learning
- arxiv url: http://arxiv.org/abs/2512.00539v1
- Date: Sat, 29 Nov 2025 16:13:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.286363
- Title: SAIDO: Generalizable Detection of AI-Generated Images via Scene-Aware and Importance-Guided Dynamic Optimization in Continual Learning
- Title(参考訳): SAIDO:連続学習におけるシーン認識と重要誘導動的最適化によるAI生成画像の汎用的検出
- Authors: Yongkang Hu, Yu Cheng, Yushuo Zhang, Yuan Xie, Zhaoxia Yin,
- Abstract要約: Scene-Aware and Importance-Guided Dynamic Optimization Detection framework with continual learning (SAIDO)を提案する。
各シーンについて、独立したエキスパートモジュールは動的に割り当てられ、フレームワークはシーン固有の偽造機能をよりよくキャプチャできる。
本手法は, 従来のSOTA法よりも安定性, 可塑性ともに優れ, 平均検出誤差率44.22%, 相対還元率40.57%をそれぞれ達成した。
- 参考スコア(独自算出の注目度): 20.771107947846122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread misuse of image generation technologies has raised security concerns, driving the development of AI-generated image detection methods. However, generalization has become a key challenge and open problem: existing approaches struggle to adapt to emerging generative methods and content types in real-world scenarios. To address this issue, we propose a Scene-Aware and Importance-Guided Dynamic Optimization detection framework with continual learning (SAIDO). Specifically, we design Scene-Awareness-Based Expert Module (SAEM) that dynamically identifies and incorporates new scenes using VLLMs. For each scene, independent expert modules are dynamically allocated, enabling the framework to capture scene-specific forgery features better and enhance cross-scene generalization. To mitigate catastrophic forgetting when learning from multiple image generative methods, we introduce Importance-Guided Dynamic Optimization Mechanism (IDOM), which optimizes each neuron through an importance-guided gradient projection strategy, thereby achieving an effective balance between model plasticity and stability. Extensive experiments on continual learning tasks demonstrate that our method outperforms the current SOTA method in both stability and plasticity, achieving 44.22\% and 40.57\% relative reductions in average detection error rate and forgetting rate, respectively. On open-world datasets, it improves the average detection accuracy by 9.47\% compared to the current SOTA method.
- Abstract(参考訳): 画像生成技術の広範囲にわたる誤用は、セキュリティ上の懸念を提起し、AI生成画像検出手法の開発を推進している。
しかし、一般化は重要な課題であり、オープンな問題となっている。既存のアプローチは、現実のシナリオにおいて、新たな生成方法やコンテンツタイプに適応するのに苦労している。
この問題に対処するために,連続学習(SAIDO)を用いたScene-Aware and Importance-Guided Dynamic Optimization検出フレームワークを提案する。
具体的には,新たなシーンをVLLMを用いて動的に識別し,組み込むScene-Awareness-Based Expert Module (SAEM) を設計する。
各シーンについて、独立したエキスパートモジュールを動的に割り当て、シーン固有の偽造機能をキャプチャし、クロスシーンの一般化を強化する。
複数の画像生成法から学習する際の破滅的な忘れを軽減するために、重要誘導勾配投影戦略により各ニューロンを最適化するImportance-Guided Dynamic Optimization Mechanism (IDOM)を導入し、モデル塑性と安定性の効果的なバランスを実現する。
連続学習タスクにおける実験結果から,本手法は従来のSOTA法よりも安定性と塑性の両面において優れており,平均検出誤差率の44.22\%と40.57\%の相対減少率をそれぞれ達成していることがわかった。
オープンワールドデータセットでは、現在のSOTA法と比較して平均検出精度が9.47\%向上している。
関連論文リスト
- Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Make It Efficient: Dynamic Sparse Attention for Autoregressive Image Generation [8.624395048491275]
適応動的スパース注意(adaptive Dynamic Sparse Attention, ADSA)と呼ばれる新しい学習自由コンテキスト最適化手法を提案する。
ADSAは、局所的なテクスチャの整合性を維持するのに欠かせない歴史的トークンと、グローバルなセマンティック・コヒーレンスを確保するのに欠かせないトークンを特定し、効率的に注意を合理化する。
また、ADSAに適した動的KV-cache更新機構を導入し、推論中のGPUメモリ消費量を約50%削減する。
論文 参考訳(メタデータ) (2025-06-23T01:27:06Z) - MLEP: Multi-granularity Local Entropy Patterns for Universal AI-generated Image Detection [44.40575446607237]
AI生成画像(AIGI)を効果的に検出する手法が緊急に必要である。
マルチグラニュラリティ局所エントロピーパターン (MLEP) を提案する。
MLEPは、画像のセマンティクスを著しく破壊し、潜在的なコンテンツバイアスを低減しながら、次元とスケールの画素関係を包括的にキャプチャする。
論文 参考訳(メタデータ) (2025-04-18T14:50:23Z) - Underlying Semantic Diffusion for Effective and Efficient In-Context Learning [113.4003355229632]
Underlying Semantic Diffusion (US-Diffusion)は、セマンティック学習、計算効率、文脈内学習能力を高める拡張拡散モデルである。
本稿では,フィードバック信号を利用したフィードバック支援学習(FAL)フレームワークを提案する。
また,高雑音レベルの時間ステップで高密度サンプリングを行うためのプラグイン・アンド・プレイの効率的なサンプリング戦略(ESS)を提案する。
論文 参考訳(メタデータ) (2025-03-06T03:06:22Z) - Learning Large-scale Neural Fields via Context Pruned Meta-Learning [60.93679437452872]
本稿では,大規模ニューラルネットワーク学習のための最適化に基づくメタラーニング手法を提案する。
メタテスト時間における勾配再スケーリングは、非常に高品質なニューラルネットワークの学習を可能にすることを示す。
我々のフレームワークは、モデルに依存しない、直感的で、実装が容易であり、幅広い信号に対する大幅な再構成改善を示す。
論文 参考訳(メタデータ) (2023-02-01T17:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。