論文の概要: AI-Generated Image Detection: An Empirical Study and Future Research Directions
- arxiv url: http://arxiv.org/abs/2511.02791v1
- Date: Tue, 04 Nov 2025 18:13:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:06.141375
- Title: AI-Generated Image Detection: An Empirical Study and Future Research Directions
- Title(参考訳): AI生成画像検出:実証研究と今後の研究方向
- Authors: Nusrat Tasnim, Kutub Uddin, Khalid Mahmood Malik,
- Abstract要約: AIが生成するメディア、特にディープフェイクによって引き起こされる脅威は、鑑識にとって重大な課題を提起している。
いくつかの法医学的手法が提案され、それらは3つの重大なギャップに悩まされている。
これらの制限は、公正な比較、曖昧な真の堅牢性、およびセキュリティクリティカルなアプリケーションのデプロイメントを制限する。
- 参考スコア(独自算出の注目度): 6.891145787446519
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The threats posed by AI-generated media, particularly deepfakes, are now raising significant challenges for multimedia forensics, misinformation detection, and biometric system resulting in erosion of public trust in the legal system, significant increase in frauds, and social engineering attacks. Although several forensic methods have been proposed, they suffer from three critical gaps: (i) use of non-standardized benchmarks with GAN- or diffusion-generated images, (ii) inconsistent training protocols (e.g., scratch, frozen, fine-tuning), and (iii) limited evaluation metrics that fail to capture generalization and explainability. These limitations hinder fair comparison, obscure true robustness, and restrict deployment in security-critical applications. This paper introduces a unified benchmarking framework for systematic evaluation of forensic methods under controlled and reproducible conditions. We benchmark ten SoTA forensic methods (scratch, frozen, and fine-tuned) and seven publicly available datasets (GAN and diffusion) to perform extensive and systematic evaluations. We evaluate performance using multiple metrics, including accuracy, average precision, ROC-AUC, error rate, and class-wise sensitivity. We also further analyze model interpretability using confidence curves and Grad-CAM heatmaps. Our evaluations demonstrate substantial variability in generalization, with certain methods exhibiting strong in-distribution performance but degraded cross-model transferability. This study aims to guide the research community toward a deeper understanding of the strengths and limitations of current forensic approaches, and to inspire the development of more robust, generalizable, and explainable solutions.
- Abstract(参考訳): AIが生成したメディア、特にディープフェイクによって引き起こされる脅威は、マルチメディアの法医学、誤情報検出、生体認証システムにおいて重大な課題を提起し、法体系に対する公的な信頼の侵食、詐欺の著しい増加、社会工学的攻撃を引き起こしている。
いくつかの法医学的手法が提案されているが、それらは3つの重大なギャップに悩まされている。
(i)GANまたは拡散生成画像を用いた非標準ベンチマークの使用。
(二 不整合訓練プロトコル(例えば、ひっかき、冷凍、微調整)及び
3) 一般化と説明可能性の獲得に失敗する限られた評価指標。
これらの制限は、公正な比較、曖昧な真の堅牢性、およびセキュリティクリティカルなアプリケーションのデプロイメントを制限する。
本稿では,制御および再現可能な条件下での法医学的手法の体系的評価のための統一的なベンチマークフレームワークを提案する。
我々は,SoTAの10種類の法医学的手法(スクラッチ,凍結,微調整)と7つの公開データセット(GAN,拡散)をベンチマークし,広範囲かつ系統的な評価を行った。
我々は,精度,平均精度,ROC-AUC,エラー率,クラスワイド感度など,複数の指標を用いて評価を行った。
さらに,信頼曲線とGrad-CAMヒートマップを用いたモデル解釈可能性の解析を行った。
本評価では, 分散性能は高いが, クロスモデル転送性は低下するなど, 一般化のばらつきが顕著である。
本研究は、現在の法医学的アプローチの強みと限界のより深い理解に向けて研究コミュニティを導くことを目的としており、より堅牢で、一般化可能で、説明可能なソリューションの開発を促すことを目的としている。
関連論文リスト
- Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - Methods and Trends in Detecting AI-Generated Images: A Comprehensive Review [0.17188280334580194]
GAN(Generative Adversarial Networks)、拡散モデル(Diffusion Models)、変分オートエンコーダ(VAEs)は、高品質なマルチメディアデータの合成を可能にしている。
これらの進歩は、敵の攻撃、非倫理的使用、社会的な危害に関する重大な懸念を引き起こした。
このサーベイは、先進的な生成AIモデルによって生成された合成画像の検出と分類のための最先端技術に関する包括的なレビューを提供する。
論文 参考訳(メタデータ) (2025-02-21T03:16:18Z) - Dissecting Out-of-Distribution Detection and Open-Set Recognition: A Critical Analysis of Methods and Benchmarks [17.520137576423593]
我々は,コミュニティ内の2つの大きなサブフィールドの総合的なビュー – アウト・オブ・ディストリビューション(OOD)検出とオープンセット認識(OSR) – を提供することを目指している。
我々は,OOD検出における最先端手法とOSR設定との厳密な相互評価を行い,それらの手法の性能の強い相関関係を同定する。
我々は,OOD検出とOSRによって取り組まれている問題を解消する,より大規模なベンチマーク設定を提案する。
論文 参考訳(メタデータ) (2024-08-29T17:55:07Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - An Empirical Evaluation on Robustness and Uncertainty of Regularization
Methods [43.25086015530892]
ディープニューラルネットワーク(DNN)は、人間と根本的に異なる振る舞いをする。
入力にぼやけなどの小さな汚職が適用されると、簡単に予測を変更できる。
彼らは分布外サンプル(不適切な不確実性尺度)に自信を持って予測する。
論文 参考訳(メタデータ) (2020-03-09T01:15:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。