論文の概要: Any-Resolution AI-Generated Image Detection by Spectral Learning
- arxiv url: http://arxiv.org/abs/2411.19417v1
- Date: Thu, 28 Nov 2024 23:55:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:21:19.555326
- Title: Any-Resolution AI-Generated Image Detection by Spectral Learning
- Title(参考訳): スペクトル学習によるAI生成画像の非解像検出
- Authors: Dimitrios Karageorgiou, Symeon Papadopoulos, Ioannis Kompatsiaris, Efstratios Gavves,
- Abstract要約: 我々は、実画像のスペクトル分布が、AI生成画像検出のための不変パターンと高識別パターンの両方を構成するというキーとなる考え方を構築した。
提案手法は, これまでの13の世代的アプローチと比較して, AUCの絶対的な改善を5.5%達成している。
- 参考スコア(独自算出の注目度): 36.562914181733426
- License:
- Abstract: Recent works have established that AI models introduce spectral artifacts into generated images and propose approaches for learning to capture them using labeled data. However, the significant differences in such artifacts among different generative models hinder these approaches from generalizing to generators not seen during training. In this work, we build upon the key idea that the spectral distribution of real images constitutes both an invariant and highly discriminative pattern for AI-generated image detection. To model this under a self-supervised setup, we employ masked spectral learning using the pretext task of frequency reconstruction. Since generated images constitute out-of-distribution samples for this model, we propose spectral reconstruction similarity to capture this divergence. Moreover, we introduce spectral context attention, which enables our approach to efficiently capture subtle spectral inconsistencies in images of any resolution. Our spectral AI-generated image detection approach (SPAI) achieves a 5.5% absolute improvement in AUC over the previous state-of-the-art across 13 recent generative approaches, while exhibiting robustness against common online perturbations.
- Abstract(参考訳): 近年の研究では、AIモデルが生成された画像にスペクトルアーティファクトを導入し、ラベル付きデータを使ってそれらをキャプチャするためのアプローチを提案する。
しかし、異なる生成モデルにおけるこれらのアーティファクトの顕著な違いは、これらのアプローチの一般化から、訓練中に見えないジェネレータへの一般化を妨げている。
本研究では、実画像のスペクトル分布が、AI生成画像検出のための不変パターンと高識別パターンの両方を構成するというキーとなる考え方を構築する。
これを自己教師付き設定でモデル化するために、周波数再構成のプレテキストタスクを用いてマスク付きスペクトル学習を用いる。
生成した画像はこのモデルのための分布外サンプルであるので、スペクトル再構成類似性を提案し、この分散を捉える。
さらに,任意の解像度の画像における微妙なスペクトルの不整合を効果的に捉えることのできるスペクトルコンテキストアテンションを導入する。
我々のスペクトルAI生成画像検出アプローチ(SPAI)は、最近の13の世代的アプローチに対して、AUCの5.5%の絶対的な改善を実現し、一般的なオンライン摂動に対する堅牢性を示した。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Oscillation Inversion: Understand the structure of Large Flow Model through the Lens of Inversion Method [60.88467353578118]
実世界のイメージを逆転させる固定点インスパイアされた反復的アプローチは収束を達成せず、異なるクラスタ間で振動することを示す。
本稿では,画像強調,ストロークベースのリカラー化,および視覚的プロンプト誘導画像編集を容易にする,シンプルで高速な分布転送手法を提案する。
論文 参考訳(メタデータ) (2024-11-17T17:45:37Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Spectrum Translation for Refinement of Image Generation (STIG) Based on
Contrastive Learning and Spectral Filter Profile [15.5188527312094]
生成した画像の周波数領域における相違を緩和する枠組みを提案する。
これは、コントラスト学習に基づく画像生成(STIG)の洗練のためのスペクトル変換によって実現される。
我々は,STIGの有効性を実証するために,8つのフェイク画像データセットと様々な最先端モデルにまたがるフレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-03-08T06:39:24Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - DiffUCD:Unsupervised Hyperspectral Image Change Detection with Semantic
Correlation Diffusion Model [46.68717345017946]
ハイパースペクトル画像変化検出(HSI-CD)はリモートセンシングにおいて重要な研究領域となっている。
意味相関拡散モデル(DiffUCD)を用いた新しい教師なしHSI-CDを提案する。
提案手法は,多数のサンプルを必要とする完全教師付き手法に匹敵する結果が得られる。
論文 参考訳(メタデータ) (2023-05-21T09:21:41Z) - Exploring the Asynchronous of the Frequency Spectra of GAN-generated
Facial Images [19.126496628073376]
カラーチャネルの非同期周波数スペクトルを探索する新しい手法を提案する。これは、教師なし学習モデルと教師なし学習モデルの両方を訓練し、GANに基づく合成画像の識別に有効である。
実験結果から,周波数領域におけるスペクトルの差は,様々な種類のGAN生成画像の検出に有効であることが示唆された。
論文 参考訳(メタデータ) (2021-12-15T11:34:11Z) - Self-supervised GAN Detector [10.963740942220168]
生成モデルは 不正や 破壊 偽ニュースなど 悪意のある目的で悪用される
トレーニング設定外の未確認画像を識別する新しいフレームワークを提案する。
提案手法は,GAN画像の高品質な人工指紋を再構成する人工指紋生成装置から構成する。
論文 参考訳(メタデータ) (2021-11-12T06:19:04Z) - Spectral Distribution Aware Image Generation [11.295032417617456]
フォトリアリスティック画像の深部生成モデルは、人間の目で実際の画像と容易に区別できない。
スペクトル判別器を用いて実データの周波数分布に応じて画像を生成することを提案する。
この結果から,実際の周波数スペクトルによる画像生成がより容易であり,検出が困難であることが示唆された。
論文 参考訳(メタデータ) (2020-12-05T19:46:48Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。