論文の概要: ForensicFormer: Hierarchical Multi-Scale Reasoning for Cross-Domain Image Forgery Detection
- arxiv url: http://arxiv.org/abs/2601.08873v1
- Date: Mon, 12 Jan 2026 04:29:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.112598
- Title: ForensicFormer: Hierarchical Multi-Scale Reasoning for Cross-Domain Image Forgery Detection
- Title(参考訳): ForensicFormer: クロスドメイン画像偽造検出のための階層的マルチスケール推論
- Authors: Hema Hariharan Samson,
- Abstract要約: ForensicFormerは階層的なフレームワークで、低レベルのアーティファクト検出、中レベルの境界解析、高レベルのセマンティック推論を統一する。
本手法は,従来の操作,GAN生成画像,拡散モデル出力にまたがる7種類のテストセットの平均精度を86.8%維持する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The proliferation of AI-generated imagery and sophisticated editing tools has rendered traditional forensic methods ineffective for cross-domain forgery detection. We present ForensicFormer, a hierarchical multi-scale framework that unifies low-level artifact detection, mid-level boundary analysis, and high-level semantic reasoning via cross-attention transformers. Unlike prior single-paradigm approaches, which achieve <75% accuracy on out-of-distribution datasets, our method maintains 86.8% average accuracy across seven diverse test sets, spanning traditional manipulations, GAN-generated images, and diffusion model outputs - a significant improvement over state-of-the-art universal detectors. We demonstrate superior robustness to JPEG compression (83% accuracy at Q=70 vs. 66% for baselines) and provide pixel-level forgery localization with a 0.76 F1-score. Extensive ablation studies validate that each hierarchical component contributes 4-10% accuracy improvement, and qualitative analysis reveals interpretable forensic features aligned with human expert reasoning. Our work bridges classical image forensics and modern deep learning, offering a practical solution for real-world deployment where manipulation techniques are unknown a priori.
- Abstract(参考訳): AI生成画像の拡散と高度な編集ツールにより、伝統的な法医学的手法はクロスドメインの偽造検出には効果がない。
本稿では,低レベルアーティファクト検出,中レベル境界解析,高レベルセマンティック推論をクロスアテンショントランスフォーマーを介して統合する階層型マルチスケールフレームワークForensicFormerを提案する。
従来の単一パラダイムの手法とは違い,本手法では,従来の操作,GAN生成画像,拡散モデル出力にまたがる7種類のテストセットの平均精度を86.8%維持する。
JPEG圧縮(Q=70では83%,ベースラインでは66%)に優れたロバスト性を示し,0.76F1スコアの画素レベルのフォージェリーローカライゼーションを提供する。
広範囲にわたるアブレーション研究は、各階層的成分が4-10%の精度向上に寄与し、質的分析により、人間の専門家による推論に沿った解釈可能な法医学的特徴が明らかにされる。
我々の研究は、古典的な画像法学と近代的なディープラーニングを橋渡しし、操作テクニックが未知の現実のデプロイメントに実用的なソリューションを提供する。
関連論文リスト
- Fixed-Threshold Evaluation of a Hybrid CNN-ViT for AI-Generated Image Detection Across Photos and Art [0.0]
クリーンな検証データに基づいて選択された決定しきい値を保持する固定閾値評価を導入し、すべての後処理変換に固定する。
AiDataアート/グラフィックでは91.4%の精度、AiDataアート/グラフィックでは89.7%の精度、CIFAKEでは98.3%(競争力)である。
論文 参考訳(メタデータ) (2025-12-25T05:19:09Z) - Self-Supervised AI-Generated Image Detection: A Camera Metadata Perspective [80.10217707456046]
カメラメタデータを利用したAI生成画像検出のための自己教師型アプローチを提案する。
分類型EXIFタグを分類することにより,撮影画像のみに特徴抽出器を訓練する。
我々の検出器は、電界中のサンプルに対して強力な一般化と、一般的な良性イメージの摂動に対する堅牢性を提供する。
論文 参考訳(メタデータ) (2025-12-05T11:53:18Z) - From Evidence to Verdict: An Agent-Based Forensic Framework for AI-Generated Image Detection [19.240335260177382]
AIFo(Agent-based Image Forensics)は、マルチエージェントコラボレーションによる人間の法医学的調査をエミュレートする、トレーニング不要のフレームワークである。
従来の手法とは異なり,本フレームワークでは,リバース画像検索,メタデータ抽出,事前学習型分類器,VLM解析など,一連の法医学的ツールを用いている。
我々の総合的な評価は6000のイメージに及び、現代の生成プラットフォームや多様なオンラインソースの画像を含む現実世界のシナリオに挑戦する。
論文 参考訳(メタデータ) (2025-10-31T18:36:49Z) - A Hybrid Deep Learning and Forensic Approach for Robust Deepfake Detection [0.0]
既存のディープフェイク検出手法は、一般化や歪みに対する脆弱性の低いディープラーニングや、解釈可能なが新しい操作技術に制限される法医学的な分析に頼っている。
本研究では,雑音残差,JPEG圧縮トレース,周波数領域記述子などの法医学的特徴を融合したハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-31T11:32:52Z) - Propose and Rectify: A Forensics-Driven MLLM Framework for Image Manipulation Localization [49.71303998618939]
本稿では,意味論的推論と法科学的な分析を橋渡しするPropose-Rectifyフレームワークを提案する。
提案手法は,具体的技術実証により,初期セマンティックな提案が体系的に検証され,拡張されることを保証し,包括的検出精度と局所化精度を実現する。
論文 参考訳(メタデータ) (2025-08-25T12:43:53Z) - Edge-Enhanced Vision Transformer Framework for Accurate AI-Generated Image Detection [0.0]
本稿では,視覚変換器(ViT)と新たなエッジベース画像処理モジュールを組み合わせたハイブリッド検出フレームワークを提案する。
提案手法は,自動コンテンツ検証とデジタル法医学における実世界の応用に非常に適している。
論文 参考訳(メタデータ) (2025-08-25T10:30:56Z) - CAMME: Adaptive Deepfake Image Detection with Multi-Modal Cross-Attention [4.359154048799454]
マルチヘッド・クロスアテンション機構を用いて,視覚,テキスト,周波数領域の機能を統合するフレームワークであるCAMMEを提案する。
実験では、CAMMEは最先端の手法よりも優れており、自然のシーンでは12.56%、顔のディープフェイクでは13.25%改善している。
論文 参考訳(メタデータ) (2025-05-23T15:39:07Z) - Is JPEG AI going to change image forensics? [50.92778618091496]
ニューラル画像圧縮に基づく新しいJPEGAI標準の反法医学的効果について検討する。
その結果,JPEG AIで処理したコンテンツの解析において,先行する法医学的検知器の性能が低下していることが示唆された。
論文 参考訳(メタデータ) (2024-12-04T12:07:20Z) - UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。