論文の概要: Comparative Evaluation of Deep Learning Models for Fake Image Detection
- arxiv url: http://arxiv.org/abs/2605.20971v1
- Date: Wed, 20 May 2026 09:57:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.612268
- Title: Comparative Evaluation of Deep Learning Models for Fake Image Detection
- Title(参考訳): フェイク画像検出のためのディープラーニングモデルの比較評価
- Authors: Akhitha Pakala, Mohammed Mahir Rahman, Shahzad Memon, Tauseef Ahmed,
- Abstract要約: 本研究では,4つのCNNアーキテクチャの性能を,統合前処理とトレーニングパイプラインを用いたフェイク画像検出の性能と比較する。
VGG16の精度は91%に達し、XceptionNet、ResNet50、EfficientNetB0はそれぞれ90%に達した。
この研究は、信頼性の高い偽画像検出システムを開発するために、バランスの取れたデータセット、高度な拡張、公正な学習の必要性を強調している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing sophistication of GAN-based image manipulation presents significant challenges for digital forensics. This study compares the performance of four pretrained CNN architectures including VGG16, ResNet50, EfficientNetB0, and XceptionNet for fake image detection using a unified preprocessing and training pipeline. A dataset of real and manipulated images was processed through resizing, normalization, and augmentation to address class imbalance and improve generalization. Models were evaluated using Accuracy, Precision, Recall, F1-score, and ROC-AUC. VGG16 achieved the highest accuracy at 91%, with XceptionNet, ResNet50, and EfficientNetB0 each reaching 90%. EfficientNetB0 showed stronger sensitivity to fake images but reduced reliability on real samples, reflecting imbalance-driven bias. Limitations include dataset imbalance, overfitting, and limited interpretability, which affect cross-domain robustness. The study provides a reproducible baseline and underscores the need for balanced datasets, advanced augmentation, and fairness-aware training to develop reliable fake image detection systems.
- Abstract(参考訳): GANに基づく画像操作の高度化は、デジタル法医学にとって重要な課題である。
本研究では,VGG16,ResNet50,EfficientNetB0,XceptionNetの4つの事前訓練済みCNNアーキテクチャの性能を比較した。
クラス不均衡に対処し、一般化を改善するために、リサイズ化、正規化、拡張を通じて実画像と操作画像のデータセットを処理した。
モデルは精度,精度,リコール,F1スコア,ROC-AUCを用いて評価した。
VGG16の精度は91%に達し、XceptionNet、ResNet50、EfficientNetB0はそれぞれ90%に達した。
効率の良いNetB0は、偽画像に対して強い感度を示したが、実際のサンプルに対する信頼性を低下させ、不均衡駆動バイアスを反映した。
制限には、データセットの不均衡、オーバーフィッティング、ドメイン間の堅牢性に影響を与える限定的な解釈性が含まれる。
この研究は再現可能なベースラインを提供し、信頼性の高い偽画像検出システムを開発するためのバランスの取れたデータセット、高度な拡張、公正な学習の必要性を強調している。
関連論文リスト
- Digital Image Forgery Detection Using Transfer Learning [0.3914676152740142]
本研究では,デジタル画像偽造検出のための転送学習フレームワークを提案する。
圧縮認識機能拡張とディープ畳み込みニューラルネットワーク(CNN)アーキテクチャを統合する。
全体として、提案フレームワークは、操作成果物の可視性を向上し、分類の堅牢性を向上し、現実世界のデジタル画像偽造検出シナリオに適している。
論文 参考訳(メタデータ) (2026-05-04T17:48:36Z) - So-Fake: Benchmarking and Explaining Social Media Image Forgery Detection [75.79507634008631]
So-Fake-Setは、200万以上の高品質な画像、多様な生成源、35の最先端生成モデルを用いて合成された画像を備えたソーシャルメディア指向のデータセットである。
本稿では,高精度な偽造検出,高精度な位置推定,解釈可能な視覚論理による説明可能な推論に強化学習を利用する高度な視覚言語フレームワークであるSo-Fake-R1を提案する。
論文 参考訳(メタデータ) (2025-05-24T11:53:35Z) - CAE-Net: Generalized Deepfake Image Detection using Convolution and Attention Mechanisms with Spatial and Frequency Domain Features [0.6700983301090583]
クラス不均衡に対処し,アンサンブルベースのアーキテクチャであるemphCAE-Netを考案した。
私たちのアーキテクチャは、畳み込みと注目に基づくアンサンブルネットワークで構成されており、3つの異なるニューラルネットワークアーキテクチャを採用している。
EfficientNet B0アーキテクチャは90.79%、ConvNeXtアーキテクチャは89.49%、DeiTアーキテクチャは89.32%である。
論文 参考訳(メタデータ) (2025-02-15T06:02:11Z) - Self-Supervised Learning in Deep Networks: A Pathway to Robust Few-Shot Classification [0.0]
まず、ラベルのない大量のデータから共通特徴表現を学習できるように、自己スーパービジョンでモデルを事前訓練する。
その後、数ショットのデータセットMini-ImageNetで微調整を行い、限られたデータの下でモデルの精度と一般化能力を改善する。
論文 参考訳(メタデータ) (2024-11-19T01:01:56Z) - Benchmarking Zero-Shot Robustness of Multimodal Foundation Models: A Pilot Study [61.65123150513683]
CLIPのようなマルチモーダル基盤モデルは、最先端のゼロショット結果を生成する。
これらのモデルは、ImageNetでトレーニングされた教師付きモデルのパフォーマンスを一致させることで、ロバスト性ギャップを埋めることが報告されている。
CLIPは、ベンチマーク上の教師付きImageNetモデルと比較して、かなりの堅牢性低下をもたらすことを示す。
論文 参考訳(メタデータ) (2024-03-15T17:33:49Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - If your data distribution shifts, use self-learning [24.23584770840611]
エントロピーや擬似ラベルのような自己学習技術は、体系的なドメインシフトの下でのコンピュータビジョンモデルの性能向上にシンプルかつ効果的である。
我々は広範囲にわたる大規模な実験を行い、モデルアーキテクチャに関係なく一貫した改善を示す。
論文 参考訳(メタデータ) (2021-04-27T01:02:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。