論文の概要: RealHD: A High-Quality Dataset for Robust Detection of State-of-the-Art AI-Generated Images
- arxiv url: http://arxiv.org/abs/2602.10546v1
- Date: Wed, 11 Feb 2026 05:38:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.495316
- Title: RealHD: A High-Quality Dataset for Robust Detection of State-of-the-Art AI-Generated Images
- Title(参考訳): RealHD: 最先端AI生成画像のロバスト検出のための高品質データセット
- Authors: Hanzhe Yu, Yun Ye, Jintao Rong, Qi Xuan, Chen Ma,
- Abstract要約: 実画像とAI生成画像の両方を含む複数のカテゴリにわたる730,000以上の画像からなる高品質で大規模なデータセットを提案する。
生成された画像は最先端の方法で合成され、テキスト・ツー・イメージ・ジェネレーション(念入りに設計された1万以上のプロンプトによって誘導される)、画像のインペインティング、画像の精細化、顔のスワップなどが含まれる。
我々のデータセットは、検出方法を評価するための強力なベンチマークとして機能するだけでなく、AI生成画像検出技術の堅牢性向上にも寄与する。
- 参考スコア(独自算出の注目度): 14.691738115737962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid advancement of generative AI has raised concerns about the authenticity of digital images, as highly realistic fake images can now be generated at low cost, potentially increasing societal risks. In response, several datasets have been established to train detection models aimed at distinguishing AI-generated images from real ones. However, existing datasets suffer from limited generalization, low image quality, overly simple prompts, and insufficient image diversity. To address these limitations, we propose a high-quality, large-scale dataset comprising over 730,000 images across multiple categories, including both real and AI-generated images. The generated images are synthesized via state-of-the-art methods, including text-to-image generation (guided by over 10,000 carefully designed prompts), image inpainting, image refinement, and face swapping. Each generated image is annotated with its generation method and category. Inpainting images further include binary masks to indicate inpainted regions, providing rich metadata for analysis. Compared to existing datasets, detection models trained on our dataset demonstrate superior generalization capabilities. Our dataset not only serves as a strong benchmark for evaluating detection methods but also contributes to advancing the robustness of AI-generated image detection techniques. Building upon this, we propose a lightweight detection method based on image noise entropy, which transforms the original image into an entropy tensor of Non-Local Means (NLM) noise before classification. Extensive experiments demonstrate that models trained on our dataset achieve strong generalization, and our method delivers competitive performance, establishing a solid baseline for future research. The dataset and source code are publicly available at https://real-hd.github.io.
- Abstract(参考訳): 生成AIの急速な進歩は、非常に現実的な偽画像が低コストで生成でき、社会的リスクが増大する可能性があるため、デジタル画像の真正性に対する懸念を提起している。
これに対応するために、AI生成画像と実際の画像の区別を目的とした検出モデルをトレーニングするデータセットがいくつか確立されている。
しかし、既存のデータセットは、限定的な一般化、低画質、過度に単純なプロンプト、画像の多様性の欠如に悩まされている。
これらの制約に対処するために、実画像とAI生成画像の両方を含む複数のカテゴリにわたる730,000以上の画像からなる高品質で大規模なデータセットを提案する。
生成された画像は最先端の方法で合成され、テキスト・ツー・イメージ・ジェネレーション(念入りに設計された1万以上のプロンプトによって誘導される)、画像のインペインティング、画像の精細化、顔のスワップなどが含まれる。
各生成画像は、その生成方法とカテゴリとで注釈付けされる。
インペイント画像はさらに、インペイントされた領域を示すバイナリマスクを含み、分析のための豊富なメタデータを提供する。
既存のデータセットと比較して、我々のデータセットでトレーニングされた検出モデルは、優れた一般化能力を示している。
我々のデータセットは、検出方法を評価するための強力なベンチマークとして機能するだけでなく、AI生成画像検出技術の堅牢性向上にも寄与する。
そこで本研究では,NLMノイズのエントロピーテンソルに原画像を変換した画像雑音エントロピーに基づく軽量検出手法を提案する。
大規模な実験により、データセットでトレーニングされたモデルが強力な一般化を実現し、我々の手法が競合性能を提供し、将来の研究の確かなベースラインを確立することが実証された。
データセットとソースコードはhttps://real-hd.github.io.comで公開されている。
関連論文リスト
- Detecting AI-Generated Images via Distributional Deviations from Real Images [6.615773227400183]
ファインチューニング中に生成モデル固有のパターンを含むテクスチャ領域をマスクするテクスチャ・アウェア・マスキング(TAM)機構を導入する。
我々の手法は最小限の画像しか調整されず、既存の手法よりも大幅に優れており、2つのデータセットの平均精度は98.2%と94.6%に達する。
論文 参考訳(メタデータ) (2026-01-07T05:00:13Z) - SAGI: Semantically Aligned and Uncertainty Guided AI Image Inpainting [11.216906046169683]
SAGI-DはAIが生成する塗り絵の最大かつ最も多様なデータセットである。
実験の結果,セマンティックアライメントは画像の品質と美学を著しく改善することがわかった。
SAGI-Dを使っていくつかの画像法医学的アプローチを訓練すると、ドメイン内の検出性能は平均37.4%向上する。
論文 参考訳(メタデータ) (2025-02-10T15:56:28Z) - Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - A Sanity Check for AI-generated Image Detection [49.08585395873425]
我々はAI生成画像を検出するAI生成画像検出装置(AI生成画像検出装置)を提案する。
AIDEは最先端の手法を+3.5%、+4.6%改善した。
論文 参考訳(メタデータ) (2024-06-27T17:59:49Z) - RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection [60.960988614701414]
RIGIDは、堅牢なAI生成画像検出のためのトレーニング不要でモデルに依存しない方法である。
RIGIDは、既存のトレーニングベースおよびトレーニング不要な検出器を著しく上回っている。
論文 参考訳(メタデータ) (2024-05-30T14:49:54Z) - PatchCraft: Exploring Texture Patch for Efficient AI-generated Image
Detection [39.820699370876916]
本稿では,多種多様な生成モデルを用いて生成した偽画像を識別できる新しいAI生成画像検出器を提案する。
グローバルな意味情報を消去し,テクスチャパッチを強化するために,新しいSmash&Reconstruction前処理を提案する。
我々のアプローチは最先端のベースラインよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2023-11-21T07:12:40Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。