論文の概要: LDR-Net: A Novel Framework for AI-generated Image Detection via Localized Discrepancy Representation
- arxiv url: http://arxiv.org/abs/2501.13475v1
- Date: Thu, 23 Jan 2025 08:46:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-24 15:58:08.950895
- Title: LDR-Net: A Novel Framework for AI-generated Image Detection via Localized Discrepancy Representation
- Title(参考訳): LDR-Net: 局所離散表現によるAI生成画像検出のための新しいフレームワーク
- Authors: JiaXin Chen, Miao Hu, DengYong Zhang, Yun Song, Xin Liao,
- Abstract要約: 本稿では,AI生成画像を検出するために,LDR-Net(Localized Disrepancy representation Network)を提案する。
LDR-Netはスムーズなアーティファクトやテクスチャの不規則をキャプチャする。
生成した画像の検出における最先端性能を実現し、目に見えない生成モデル間で満足な一般化を示す。
- 参考スコア(独自算出の注目度): 30.677834580640123
- License:
- Abstract: With the rapid advancement of generative models, the visual quality of generated images has become nearly indistinguishable from the real ones, posing challenges to content authenticity verification. Existing methods for detecting AI-generated images primarily focus on specific forgery clues, which are often tailored to particular generative models like GANs or diffusion models. These approaches struggle to generalize across architectures. Building on the observation that generative images often exhibit local anomalies, such as excessive smoothness, blurred textures, and unnatural pixel variations in small regions, we propose the localized discrepancy representation network (LDR-Net), a novel approach for detecting AI-generated images. LDR-Net captures smoothing artifacts and texture irregularities, which are common but often overlooked. It integrates two complementary modules: local gradient autocorrelation (LGA) which models local smoothing anomalies to detect smoothing anomalies, and local variation pattern (LVP) which captures unnatural regularities by modeling the complexity of image patterns. By merging LGA and LVP features, a comprehensive representation of localized discrepancies can be provided. Extensive experiments demonstrate that our LDR-Net achieves state-of-the-art performance in detecting generated images and exhibits satisfactory generalization across unseen generative models. The code will be released upon acceptance of this paper.
- Abstract(参考訳): 生成モデルの急速な進歩により、生成した画像の視覚的品質は、実際の画像とほとんど区別がつかなくなり、コンテンツの信頼性検証に挑戦している。
AI生成画像を検出する既存の方法は、主に特定の偽の手がかりに焦点を当てており、しばしばGANや拡散モデルのような特定の生成モデルに適合する。
これらのアプローチはアーキテクチャ全体の一般化に苦慮している。
生成画像は小さな領域における過度な滑らかさ、ぼやけたテクスチャ、不自然な画素変動などの局所的な異常を示すことが多いという観察に基づいて、AI生成画像を検出する新しいアプローチである局所的不一致表現ネットワーク(LDR-Net)を提案する。
LDR-Netはスムーズなアーティファクトやテクスチャの不規則をキャプチャする。
局所的なスムーズな異常を検出するために局所的なスムーズな異常をモデル化する局所勾配自己相関(LGA)と、画像パターンの複雑さをモデル化して不自然な規則性を捉える局所変動パターン(LVP)の2つの相補的なモジュールを統合する。
LGAとLVPを融合することにより、局所的な不一致を包括的に表現することができる。
広汎な実験により,LDR-Netは生成画像の検出において最先端の性能を達成し,未知の生成モデルにまたがる満足な一般化を示す。
コードは、この論文の受理時に公開される。
関連論文リスト
- Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。
CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文 参考訳(メタデータ) (2024-07-29T18:00:10Z) - Rethinking the Up-Sampling Operations in CNN-based Generative Network
for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。
tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。
この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文 参考訳(メタデータ) (2023-12-16T14:27:06Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - CRADL: Contrastive Representations for Unsupervised Anomaly Detection
and Localization [2.8659934481869715]
医用画像における教師なし異常検出は、訓練中に異常データを必要とせず、任意の異常を検出し、位置決めすることを目的としている。
現在の最先端の手法のほとんどは、画像上で直接動作する潜在変数生成モデルを使用している。
コントラストプレテクストタスクで訓練されたエンコーダの低次元表現空間において,正規サンプルの分布を直接モデル化するCRADLを提案する。
論文 参考訳(メタデータ) (2023-01-05T16:07:49Z) - AnoViT: Unsupervised Anomaly Detection and Localization with Vision
Transformer-based Encoder-Decoder [3.31490164885582]
我々は,画像パッチ間のグローバルな関係を学習することにより,通常の情報を反映する視覚変換器を用いたエンコーダデコーダモデルAnoViTを提案する。
提案モデルは,3つのベンチマークデータセット上での畳み込みモデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-03-21T09:01:37Z) - A One-Shot Texture-Perceiving Generative Adversarial Network for
Unsupervised Surface Inspection [4.6284467350305585]
教師なしスキームで一発の正常画像から学習した階層的テクスチャ知覚生成対向ネットワーク(HTP-GAN)を提案する。
具体的には、HTP-GANは、大域構造と画像の微細な表現を同時に捉えることができる、畳み込み型GANのピラミッドを含んでいる。
本発明の判別器では、方向の畳み込みにより通常の画像の空間的不変表現をキャプチャするためにテクスチャ知覚モジュールが考案される。
論文 参考訳(メタデータ) (2021-06-12T15:05:17Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - DFR: Deep Feature Reconstruction for Unsupervised Anomaly Segmentation [24.52418722578279]
本論文では,非監視型異常セグメンテーション手法を提案する。
画像の小さな領域や限られた領域の異常を検出し、分類することができる。
複数のベンチマークデータセットで最先端のパフォーマンスを向上する。
論文 参考訳(メタデータ) (2020-12-13T18:30:51Z) - Anomaly localization by modeling perceptual features [3.04585143845864]
特徴拡張型VAEは、入力画像を画素空間や複数の異なる特徴空間で再構成することで訓練される。
MVTec異常検出およびローカライゼーションデータセットの最先端手法に対する明確な改善を実現する。
論文 参考訳(メタデータ) (2020-08-12T15:09:13Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。