論文の概要: Diversity Matters: Dataset Diversification and Dual-Branch Network for Generalized AI-Generated Image Detection
- arxiv url: http://arxiv.org/abs/2603.27800v1
- Date: Sun, 29 Mar 2026 18:29:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.122468
- Title: Diversity Matters: Dataset Diversification and Dual-Branch Network for Generalized AI-Generated Image Detection
- Title(参考訳): 多様性の課題:汎用AI生成画像検出のためのデータセットの多様化とデュアルブランチネットワーク
- Authors: Nusrat Tasnim, Kutub Uddin, Khalid Malik,
- Abstract要約: 我々は、AI生成画像検出のためのデータ多様性と特徴領域補完性を強調する新しいフレームワーク、textbfDiversity Mattersを提案する。
提案手法では,冗長あるいは非常に類似したサンプルを破棄する特徴領域類似度フィルタリング機構を提案する。
ベンチマークデータセットに対する大規模な実験により、提案手法はクロスモデルとクロスデータセットのパフォーマンスを大幅に改善することが示された。
- 参考スコア(独自算出の注目度): 2.1410799064827235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid proliferation of AI-generated images, powered by generative adversarial networks (GANs), diffusion models, and other synthesis techniques, has raised serious concerns about misinformation, copyright violations, and digital security. However, detecting such images in a generalized and robust manner remains a major challenge due to the vast diversity of generative models and data distributions. In this work, we present \textbf{Diversity Matters}, a novel framework that emphasizes data diversity and feature domain complementarity for AI-generated image detection. The proposed method introduces a feature-domain similarity filtering mechanism that discards redundant or highly similar samples across both inter-class and intra-class distributions, ensuring a more diverse and representative training set. Furthermore, we propose a dual-branch network that combines CLIP features from the pixel domain and the frequency domain to jointly capture semantic and structural cues, leading to improved generalization against unseen generative models and adversarial conditions. Extensive experiments on benchmark datasets demonstrate that the proposed approach significantly improves cross-model and cross-dataset performance compared to existing methods. \textbf{Diversity Matters} highlights the critical role of data and feature diversity in building reliable and robust detectors against the rapidly evolving landscape of synthetic content.
- Abstract(参考訳): 生成的敵ネットワーク(GAN)、拡散モデル、その他の合成技術を利用したAI生成画像の急速な拡散は、誤情報、著作権侵害、デジタルセキュリティに対する深刻な懸念を引き起こしている。
しかし、このような画像の一般化とロバストな検出は、生成モデルやデータ分布の多様さのため、依然として大きな課題である。
本稿では,AI生成画像検出のためのデータ多様性と特徴領域の相補性を強調する新しいフレームワークである「textbf{Diversity Matters}」を紹介する。
提案手法では,クラス間およびクラス内の両方で冗長あるいは非常に類似したサンプルを破棄し,より多彩で代表的なトレーニングセットを確保する機能ドメイン類似度フィルタリング機構を提案する。
さらに、画素領域と周波数領域のCLIP特徴を組み合わせた二重ブランチネットワークを提案し、意味的および構造的手がかりを協調的にキャプチャし、目に見えない生成モデルや逆境条件に対する一般化を改善する。
ベンチマークデータセットの大規模な実験により、提案手法は既存手法と比較して、クロスモデルとクロスデータセットのパフォーマンスを著しく改善することが示された。
\textbf{Diversity Matters} は、急速に進化する合成コンテンツのランドスケープに対して、信頼性が高く堅牢な検出器を構築する上で、データのクリティカルな役割と特徴的多様性を強調している。
関連論文リスト
- Vision-Enhanced Large Language Models for High-Resolution Image Synthesis and Multimodal Data Interpretation [0.0]
本研究では,視覚拡張大言語モデル(LLM)と高度なトランスフォーマベースアーキテクチャを統合するための変換フレームワークを提案する。
提案モデルでは, ノイズとデータを線形経路に接続し, 効率的かつ高品質な生成を可能にする整流機構を組み込んだ。
このフレームワークは、合成画像とコヒーレントなマルチモーダル表現において、非平行な忠実性を達成する。
論文 参考訳(メタデータ) (2025-12-14T08:28:50Z) - Composite Data Augmentations for Synthetic Image Detection Against Real-World Perturbations [14.985516487680917]
合成画像検出(SID)ソリューションは、圧縮やその他の操作によってしばしば変更されるため、インターネットから生成された画像に苦労する。
本研究は,データ拡張組み合わせを探索し,遺伝的アルゴリズムを最適な拡張選択に活用し,二重基準最適化アプローチを導入することにより,SIDを向上させる。
本研究は,様々な品質・変換の合成画像の同定が可能な検出モデルの開発に有用な知見を提供する。
論文 参考訳(メタデータ) (2025-06-13T06:28:05Z) - HFMF: Hierarchical Fusion Meets Multi-Stream Models for Deepfake Detection [4.908389661988192]
HFMFは総合的な2段階のディープフェイク検出フレームワークである。
視覚変換器と畳み込みネットを階層的特徴融合機構を通じて統合する。
私たちのアーキテクチャは、多様なデータセットベンチマークで優れたパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2025-01-10T00:20:29Z) - Multisource Collaborative Domain Generalization for Cross-Scene Remote Sensing Image Classification [57.945437355714155]
クロスシーン画像分類は, 異なる分布領域のアノテート領域に, 地中物質の事前の知識を伝達することを目的としている。
既存のアプローチでは、未確認のターゲットドメインへの単一ソースドメインの一般化に重点を置いている。
マルチソースリモートセンシングデータの均一性と不均一性特性に基づく,新しいマルチソース協調型ドメイン一般化フレームワーク(MS-CDG)を提案する。
論文 参考訳(メタデータ) (2024-12-05T06:15:08Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - A Dual Attentive Generative Adversarial Network for Remote Sensing Image
Change Detection [6.906936669510404]
本稿では,高分解能なリモートセンシング画像変化検出タスクを実現するために,二重注意生成対向ネットワークを提案する。
DAGANフレームワークは、85.01%がIoU、91.48%がF1スコアであり、LEVIRデータセットの先進的な手法よりもパフォーマンスが良い。
論文 参考訳(メタデータ) (2023-10-03T08:26:27Z) - DiffDis: Empowering Generative Diffusion Model with Cross-Modal
Discrimination Capability [75.9781362556431]
本稿では,拡散過程下での1つのフレームワークに,モダクティブと差別的事前学習を統一するDiffDisを提案する。
DiffDisは画像生成タスクと画像テキスト識別タスクの両方において単一タスクモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T05:03:48Z) - UniDiff: Advancing Vision-Language Models with Generative and
Discriminative Learning [86.91893533388628]
本稿では、画像テキストコントラスト学習(ITC)、テキスト条件付き画像合成学習(IS)、相互意味整合性モデリング(RSC)を統合した統合マルチモーダルモデルUniDiffを提案する。
UniDiffはマルチモーダル理解と生成タスクの両方において汎用性を示す。
論文 参考訳(メタデータ) (2023-06-01T15:39:38Z) - Data Augmentation via Mixed Class Interpolation using Cycle-Consistent
Generative Adversarial Networks Applied to Cross-Domain Imagery [16.870604081967866]
機械学習による物体検出と非可視画像内の分類は多くの分野において重要な役割を担っている。
しかし、このような応用は、限られた量の非可視領域画像のためにしばしば苦しむ。
本稿では,可視光帯域画像を利用した新しいデータ拡張手法の提案と評価を行う。
論文 参考訳(メタデータ) (2020-05-05T18:53:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。