論文の概要: A Comprehensive Dataset for Human vs. AI Generated Image Detection
- arxiv url: http://arxiv.org/abs/2601.00553v1
- Date: Fri, 02 Jan 2026 03:58:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.510213
- Title: A Comprehensive Dataset for Human vs. AI Generated Image Detection
- Title(参考訳): 人間対AI生成画像検出のための包括的データセット
- Authors: Rajarshi Roy, Nasrin Imanpour, Ashhar Aziz, Shashwat Bajpai, Gurpreet Singh, Shwetangshu Biswas, Kapil Wanaskar, Parth Patwa, Subhankar Ghosh, Shreyas Dixit, Nilesh Ranjan Pal, Vipula Rawte, Ritvik Garimella, Gaytri Jena, Vasu Sharma, Vinija Jain, Aman Chadha, Aishwarya Naresh Reganti, Amitava Das,
- Abstract要約: 96000個の実データポイントと合成データポイントからなるAI生成画像検出のための新しいデータセットであるMS COCOAIをリリースする。
合成画像を生成するには, 安定拡散3, 安定拡散2.1, SDXL, DALL-E3, MidJourney v6の5つのジェネレータを使用する。
このデータセットに基づいて,(1)画像を実または生成されたものと分類し,(2)どのモデルが与えられた合成画像を生成するかを同定する2つのタスクを提案する。
- 参考スコア(独自算出の注目度): 23.138504627151494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal generative AI systems like Stable Diffusion, DALL-E, and MidJourney have fundamentally changed how synthetic images are created. These tools drive innovation but also enable the spread of misleading content, false information, and manipulated media. As generated images become harder to distinguish from photographs, detecting them has become an urgent priority. To combat this challenge, We release MS COCOAI, a novel dataset for AI generated image detection consisting of 96000 real and synthetic datapoints, built using the MS COCO dataset. To generate synthetic images, we use five generators: Stable Diffusion 3, Stable Diffusion 2.1, SDXL, DALL-E 3, and MidJourney v6. Based on the dataset, we propose two tasks: (1) classifying images as real or generated, and (2) identifying which model produced a given synthetic image. The dataset is available at https://huggingface.co/datasets/Rajarshi-Roy-research/Defactify_Image_Dataset.
- Abstract(参考訳): 安定拡散(Stable Diffusion)、DALL-E、MidJourneyといったマルチモーダルな生成AIシステムは、合成画像の作成方法を根本的に変えた。
これらのツールはイノベーションを促進するだけでなく、誤解を招くコンテンツ、偽情報、操作されたメディアの拡散を可能にする。
生成した画像と写真との区別が困難になるにつれて、その検出が最優先事項となっている。
この課題に対処するため、我々は、MS COCOデータセットを使用して構築された96000の実データポイントと合成データポイントからなる、AI生成画像検出のための新しいデータセットであるMS COCOAIをリリースする。
合成画像を生成するには, 安定拡散3, 安定拡散2.1, SDXL, DALL-E3, MidJourney v6の5つのジェネレータを使用する。
このデータセットに基づいて,(1)画像を実または生成されたものと分類し,(2)どのモデルが与えられた合成画像を生成するかを同定する2つのタスクを提案する。
データセットはhttps://huggingface.co/datasets/Rajarshi-Roy-research/Defactify_Image_Datasetで公開されている。
関連論文リスト
- CO-SPY: Combining Semantic and Pixel Features to Detect Synthetic Images by AI [58.35348718345307]
実際の画像とAI生成画像を区別する現在の取り組みには、一般化が欠如している可能性がある。
既存のセマンティック機能を強化した新しいフレームワークCo-Spyを提案する。
また、5つの実画像データセットと22の最先端生成モデルからなる包括的データセットであるCo-Spy-Benchを作成します。
論文 参考訳(メタデータ) (2025-03-24T01:59:29Z) - Visual Counter Turing Test (VCT^2): Discovering the Challenges for AI-Generated Image Detection and Introducing Visual AI Index (V_AI) [5.8695051911828555]
最近のAI生成画像検出(AGID)には、CNN検出、NPR、DM画像検出、フェイク画像検出、DIRE、LASTED、GAN画像検出、AIDE、SP、DRCT、RINE、OCC-CLIP、De-Fake、Deep Fake Detectionが含まれる。
本稿では,テキスト・ツー・イメージ・モデルによって生成される130K画像からなるベンチマークであるVisual Counter Turing Test (VCT2)を紹介する。
VCT$2$ベンチマークで前述のAGID技術の性能を評価し、AI生成の検出におけるその非効率性を強調した。
論文 参考訳(メタデータ) (2024-11-24T06:03:49Z) - Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Data-Efficient Generation for Dataset Distillation [12.106527496044473]
ラベル付きリアルな合成画像を生成する条件付き潜時拡散モデルを訓練する。
我々は,少数の合成画像のみを用いてモデルを効果的に訓練し,大規模な実検体で評価できることを実証した。
論文 参考訳(メタデータ) (2024-09-05T22:31:53Z) - A Sanity Check for AI-generated Image Detection [49.08585395873425]
我々はAI生成画像を検出するAI生成画像検出装置(AI生成画像検出装置)を提案する。
AIDEは最先端の手法を+3.5%、+4.6%改善した。
論文 参考訳(メタデータ) (2024-06-27T17:59:49Z) - M3Dsynth: A dataset of medical 3D images with AI-generated local
manipulations [10.20962191915879]
M3DsynthはCT(Computed Tomography)肺画像の大規模なデータセットである。
実際のCTで肺がん結節を注入または除去することにより,操作画像を作成する。
実験の結果、これらの画像は簡単に自動診断ツールを騙すことが判明した。
論文 参考訳(メタデータ) (2023-09-14T18:16:58Z) - Scrape, Cut, Paste and Learn: Automated Dataset Generation Applied to
Parcel Logistics [58.720142291102135]
4つのステップでインスタンスセグメンテーションのための合成データセットを生成するために,完全に自動化されたパイプラインを提案する。
まず、人気のある画像検索エンジンから興味ある対象の画像を抽出する。
画像選択には,オブジェクトに依存しない事前処理,手動画像選択,CNNに基づく画像選択の3つの方法を比較する。
論文 参考訳(メタデータ) (2022-10-18T12:49:04Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。