論文の概要: PGC: Peak-Guided Calibration for Generalizable AI-Generated Image Detection
- arxiv url: http://arxiv.org/abs/2605.21207v1
- Date: Wed, 20 May 2026 14:04:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.711461
- Title: PGC: Peak-Guided Calibration for Generalizable AI-Generated Image Detection
- Title(参考訳): PGC: 一般化可能なAI生成画像検出のためのピークガイド校正
- Authors: Xiaoyu Zhou, Jianwei Fei, Peipeng Yu, Jingchang Xie, Chong Cheng, Zhihua Xia,
- Abstract要約: 画像解析のためのPeak-Guided (PGC) フレームワークを提案する。
PGCは、最も識別性の高い局所的な手がかりをアクセントするピーク感受性アグリゲーションを用いる。
このアプローチは、さもなくばグローバルコンテキストに沈むであろう微妙なパターンを復元する。
- 参考スコア(独自算出の注目度): 22.18646747780848
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of generative AI, from GANs to modern diffusion models, has resulted in increasingly subtle discriminative clues. These fine-grained signals are often overshadowed by dominant, high-fidelity image content (e.g., the main subject), limiting the reliability of existing detectors that predominantly rely on global representations. To address this challenge, we propose the Peak-Guided Calibration (PGC) framework. PGC introduces a novel strategy that aggregates salient features via a peak-focusing mechanism. Specifically, by employing a peak-sensitive aggregation that accentuates the most discriminative local clues, PGC leverages these critical signals to calibrate the global decision. This approach recovers subtle patterns that would otherwise be submerged in the global context. Furthermore, to better simulate real-world threats, we introduce the CommGen15 dataset, a challenging benchmark comprising samples from 15 commercial models. Extensive experiments demonstrate that PGC achieves state-of-the-art performance. Specifically, it improves mean accuracy by +12.3% on our CommGen15 dataset, and sets new records on standard benchmarks, including GenImage (+2.1%), AIGI (+3.5%), and UniversalFakeDetect (+1.7%). Code is available at https://github.com/xiaoyu6868/PGC.
- Abstract(参考訳): GANから現代拡散モデルへの生成AIの急速な進化は、次第に微妙な差別的手がかりを生み出している。
これらの微細な信号は、主にグローバルな表現に依存している既存の検出器の信頼性を制限する、支配的な高忠実な画像コンテンツ(例えば主対象)によって、しばしば影が隠れている。
この課題に対処するために,ピークガイド校正(PGC)フレームワークを提案する。
PGCはピーク焦点機構を通じて健全な特徴を集約する新しい戦略を導入している。
具体的には、最も差別的な局所的な手がかりをアクセントするピーク感度アグリゲーションを用いることで、PGCはこれらの臨界信号を利用して世界的決定を校正する。
このアプローチは、さもなくばグローバルコンテキストに沈むであろう微妙なパターンを復元する。
さらに、現実世界の脅威をより良くシミュレートするために、15の商用モデルのサンプルからなる挑戦的なベンチマークであるCommGen15データセットを紹介します。
大規模な実験は、PGCが最先端のパフォーマンスを達成することを実証している。
具体的には、CommunGen15データセットの平均精度を+12.3%改善し、GenImage (+2.1%)、AIGI (+3.5%)、UniversalFakeDetect (+1.7%)などの標準ベンチマークに新しいレコードを設定する。
コードはhttps://github.com/xiaoyu6868/PGCで入手できる。
関連論文リスト
- Complementary Text-Guided Attention for Zero-Shot Adversarial Robustness [57.104158692005775]
ゼロショットロバストネス(TGA-ZSR)のためのテキストガイド型アテンションを提案する。
我々のゴールは、CLIPモデルの一般化を維持し、敵の堅牢性を高めることである。
この制限を克服するために、補完的テキストガイド注意(Complementary Text-Guided Attention, Comp-TGA)と呼ばれる新しいアプローチを提案する。
論文 参考訳(メタデータ) (2026-03-19T08:11:46Z) - Deepfake Forensics Adapter: A Dual-Stream Network for Generalizable Deepfake Detection [22.889849855283355]
Deepfake Forensics Adapter (DFA)は、視覚言語の基礎モデルをターゲットの法医学分析と相乗化する新しいデュアルストリームフレームワークである。
提案手法では,事前学習したCLIPモデルと3つのコアコンポーネントを統合して,ディープフェイク検出を実現する。
我々のフレームワークは、最先端の性能を実証するだけでなく、堅牢なディープフェイク検出システムを開発するための実用的で効果的な方向を指摘する。
論文 参考訳(メタデータ) (2026-03-02T04:58:00Z) - Intelligent recognition of GPR road hidden defect images based on feature fusion and attention mechanism [14.938306841402643]
地中貫入レーダ(GPR)は,地下道路の欠陥を非破壊的に評価するための重要なツールである。
本稿では,これらの制約に対処するための包括的枠組みを紹介する。
論文 参考訳(メタデータ) (2025-12-25T00:29:58Z) - AdaptPrompt: Parameter-Efficient Adaptation of VLMs for Generalizable Deepfake Detection [7.76090543025328]
画像生成の最近の進歩により、高度にリアルな合成メディアが普及し、信頼性の高いディープフェイク検出の難しさが高まっている。
重要な課題は一般化であり、限られた種類の発電機で訓練された検出器は、目に見えないモデルに直面すると失敗することが多い。
本稿では,大規模視覚言語モデル(特にCLIP)を活用して,多様な生成技術にまたがる合成内容の同定を行うことにより,一般化可能な検出の必要性に対処する。
論文 参考訳(メタデータ) (2025-12-19T16:06:03Z) - Scaling Up AI-Generated Image Detection via Generator-Aware Prototypes [15.99138549265524]
GAPL(Generator-Aware Prototype Learning)は、構造化学習パラダイムで表現を制約するフレームワークである。
GAPLは最先端の性能を達成し、多様なGANおよび拡散型ジェネレータにおいて優れた検出精度を示す。
論文 参考訳(メタデータ) (2025-12-15T04:58:08Z) - Towards Imperceptible JPEG Image Hiding: Multi-range Representations-driven Adversarial Stego Generation [19.5984577708016]
JPEG画像隠蔽のためのMRAGと呼ばれるマルチレンジ表現駆動型逆スチーゴ生成フレームワークを提案する。
MRAGは、畳み込みの局所レンジ特性と変換器のグローバルレンジモデリングを統合する。
シュプロゲートステガナライザーの分類された特徴に基づいて、カバーとステゴ間の敵対的損失を計算する。
論文 参考訳(メタデータ) (2025-07-11T06:45:07Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - When Neural Networks Fail to Generalize? A Model Sensitivity Perspective [82.36758565781153]
ドメイン一般化 (Domain Generalization, DG) は、異なる分布の下で見えないドメインでうまく機能するようにモデルを訓練することを目的としている。
本稿では,より現実的で,より困難なシナリオである単一領域一般化(Single-DG)について考察する。
我々は「モデル感度」と命名する一般化と強く相関するモデルの性質を経験的に確認する。
本稿では、高感度の周波数をターゲットとした拡張画像を生成するために、スペクトル逆データ拡張(SADA)の新たな戦略を提案する。
論文 参考訳(メタデータ) (2022-12-01T20:15:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。