論文の概要: Noise-Informed Diffusion-Generated Image Detection with Anomaly Attention
- arxiv url: http://arxiv.org/abs/2506.16743v1
- Date: Fri, 20 Jun 2025 04:25:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.342112
- Title: Noise-Informed Diffusion-Generated Image Detection with Anomaly Attention
- Title(参考訳): 異常注意によるノイズインフォームド拡散画像検出
- Authors: Weinan Guan, Wei Wang, Bo Peng, Ziwen He, Jing Dong, Haonan Cheng,
- Abstract要約: 偽造検出の鍵となる課題は、トレーニング中に見えない拡散モデルに一般化することである。
拡散モデルの異なる画像が、実際の画像と異なる類似のノイズパターンを共有することを観察する。
SOTA検出モデルを実装するために、我々はNASAをSwin Transformerに組み込み、NASA-Swinという新しい検出アーキテクチャを構築した。
- 参考スコア(独自算出の注目度): 10.124433096208948
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the rapid development of image generation technologies, especially the advancement of Diffusion Models, the quality of synthesized images has significantly improved, raising concerns among researchers about information security. To mitigate the malicious abuse of diffusion models, diffusion-generated image detection has proven to be an effective countermeasure.However, a key challenge for forgery detection is generalising to diffusion models not seen during training. In this paper, we address this problem by focusing on image noise. We observe that images from different diffusion models share similar noise patterns, distinct from genuine images. Building upon this insight, we introduce a novel Noise-Aware Self-Attention (NASA) module that focuses on noise regions to capture anomalous patterns. To implement a SOTA detection model, we incorporate NASA into Swin Transformer, forming an novel detection architecture NASA-Swin. Additionally, we employ a cross-modality fusion embedding to combine RGB and noise images, along with a channel mask strategy to enhance feature learning from both modalities. Extensive experiments demonstrate the effectiveness of our approach in enhancing detection capabilities for diffusion-generated images. When encountering unseen generation methods, our approach achieves the state-of-the-art performance.Our code is available at https://github.com/WeinanGuan/NASA-Swin.
- Abstract(参考訳): 画像生成技術の急速な発展、特に拡散モデルの発展により、合成画像の品質が大幅に向上し、情報セキュリティへの懸念が高まった。
拡散モデルの悪用を緩和するため、拡散生成画像検出は効果的な対策であることが証明されているが、偽造検出の重要な課題は、訓練中に見えない拡散モデルに一般化することである。
本稿では,画像雑音に着目し,この問題に対処する。
拡散モデルの異なる画像が、実際の画像と異なる類似のノイズパターンを共有することを観察する。
この知見に基づいて、異常パターンを捕捉するノイズ領域に焦点を当てた、新しいノイズ対応セルフアテンション(NASA)モジュールを導入する。
SOTA検出モデルを実装するために、我々はNASAをSwin Transformerに組み込み、NASA-Swinという新しい検出アーキテクチャを構築した。
さらに,RGBとノイズ画像の組み合わせにモーダリティ融合を組み込むとともに,両方のモーダリティからの特徴学習を強化するためのチャネルマスク戦略も導入する。
広汎な実験により拡散生成画像の検出能力を向上する手法の有効性が実証された。
我々のコードはhttps://github.com/WeinanGuan/NASA-Swinで公開されている。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Blue noise for diffusion models [50.99852321110366]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。
我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。
本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文 参考訳(メタデータ) (2024-02-07T14:59:25Z) - Adv-Diffusion: Imperceptible Adversarial Face Identity Attack via Latent
Diffusion Model [61.53213964333474]
本稿では,生の画素空間ではなく,潜在空間における非知覚的対角的アイデンティティ摂動を生成できる統一的なフレームワークAdv-Diffusionを提案する。
具体的には,周囲のセマンティックな摂動を生成するために,個人性に敏感な条件付き拡散生成モデルを提案する。
設計された適応強度に基づく対向摂動アルゴリズムは、攻撃の伝達性とステルス性の両方を確保することができる。
論文 参考訳(メタデータ) (2023-12-18T15:25:23Z) - Diffusion Noise Feature: Accurate and Fast Generated Image Detection [28.262273539251172]
生成モデルは、驚くほどリアルなイメージを生成できる先進的な段階に達している。
生成された画像に対する既存の画像検出器は、低精度や限定的な一般化といった課題に直面している。
本稿では,生成画像の検出能力を高めるために,強力な一般化機能を備えた表現を求めることにより,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-05T10:01:11Z) - Exposing the Fake: Effective Diffusion-Generated Images Detection [14.646957596560076]
本稿では拡散生成画像検出(SeDID)のためのステップワイド誤差と呼ばれる新しい検出法を提案する。
SeDIDは拡散モデルのユニークな特性、すなわち決定論的逆転と決定論的逆退誤差を利用する。
我々の研究は拡散モデル生成画像の識別に重要な貢献をしており、人工知能のセキュリティ分野における重要なステップとなっている。
論文 参考訳(メタデータ) (2023-07-12T16:16:37Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - On Conditioning the Input Noise for Controlled Image Generation with
Diffusion Models [27.472482893004862]
条件付き画像生成は、画像編集、ストック写真の生成、および3Dオブジェクト生成におけるいくつかのブレークスルーの道を開いた。
本研究では,入出力ノイズアーチファクトを慎重に構築した条件拡散モデルを提案する。
論文 参考訳(メタデータ) (2022-05-08T13:18:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。