論文の概要: ForensicHub: A Unified Benchmark & Codebase for All-Domain Fake Image Detection and Localization
- arxiv url: http://arxiv.org/abs/2505.11003v1
- Date: Fri, 16 May 2025 08:49:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.374786
- Title: ForensicHub: A Unified Benchmark & Codebase for All-Domain Fake Image Detection and Localization
- Title(参考訳): ForensicHub: 全ドメインフェイク画像の検出とローカライゼーションのための統一ベンチマークとコードベース
- Authors: Bo Du, Xuekang Zhu, Xiaochen Ma, Chenfan Qu, Kaiwen Feng, Zhe Yang, Chi-Man Pun, Jian Liu, Jizhe Zhou,
- Abstract要約: ForensicHubは、オールドメインの偽画像検出とローカライゼーションのための最初の統一ベンチマークである。
科学的なパイプラインをデータセット、変換、モデル、評価者間で交換可能なコンポーネントに分解する。
FIDLモデルアーキテクチャ、データセットの特徴、評価標準に関する8つの重要な実行可能な洞察を提供する。
- 参考スコア(独自算出の注目度): 48.147576833781386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The field of Fake Image Detection and Localization (FIDL) is highly fragmented, encompassing four domains: deepfake detection (Deepfake), image manipulation detection and localization (IMDL), artificial intelligence-generated image detection (AIGC), and document image manipulation localization (Doc). Although individual benchmarks exist in some domains, a unified benchmark for all domains in FIDL remains blank. The absence of a unified benchmark results in significant domain silos, where each domain independently constructs its datasets, models, and evaluation protocols without interoperability, preventing cross-domain comparisons and hindering the development of the entire FIDL field. To close the domain silo barrier, we propose ForensicHub, the first unified benchmark & codebase for all-domain fake image detection and localization. Considering drastic variations on dataset, model, and evaluation configurations across all domains, as well as the scarcity of open-sourced baseline models and the lack of individual benchmarks in some domains, ForensicHub: i) proposes a modular and configuration-driven architecture that decomposes forensic pipelines into interchangeable components across datasets, transforms, models, and evaluators, allowing flexible composition across all domains; ii) fully implements 10 baseline models, 6 backbones, 2 new benchmarks for AIGC and Doc, and integrates 2 existing benchmarks of DeepfakeBench and IMDLBenCo through an adapter-based design; iii) conducts indepth analysis based on the ForensicHub, offering 8 key actionable insights into FIDL model architecture, dataset characteristics, and evaluation standards. ForensicHub represents a significant leap forward in breaking the domain silos in the FIDL field and inspiring future breakthroughs.
- Abstract(参考訳): Fake Image Detection and Localization(FIDL)の分野は、ディープフェイク検出(Deepfake)、画像操作検出とローカライゼーション(IMDL)、人工知能生成画像検出(AIGC)、ドキュメント操作ローカライゼーション(Doc)の4つの領域から構成されている。
個々のベンチマークはいくつかのドメインに存在するが、FIDLのすべてのドメインに対する統一されたベンチマークは依然として空白のままである。
統合されたベンチマークがないため、各ドメインは相互運用なしにデータセット、モデル、評価プロトコルを独立に構築し、ドメイン間比較を防止し、FIDLフィールド全体の開発を妨げる重要なドメインサイロが発生します。
ドメインサイロバリアを閉鎖するために、全ドメインの偽画像検出とローカライゼーションのための最初の統一ベンチマークとコードベースであるForensicHubを提案する。
すべてのドメインにわたるデータセット、モデル、評価設定の劇的なバリエーションや、オープンソースベースラインモデルの不足、いくつかのドメインでの個々のベンチマークの欠如を考慮すると、ForensicHub:
一 法定パイプラインをデータセット、変換、モデル、評価者間で交換可能なコンポーネントに分解し、すべてのドメインに柔軟な構成を可能にするモジュール式で構成駆動のアーキテクチャを提案すること。
ii)AIGCとDoc用の10のベースラインモデル、6つのバックボーン、2つの新しいベンチマークを実装し、アダプタベースの設計を通じてDeepfakeBenchとIMDLBenCoの既存の2つのベンチマークを統合する。
三ForensicHubに基づく詳細な分析を行い、FIDLモデルアーキテクチャ、データセットの特徴、評価基準に関する8つの重要な洞察を提供する。
ForensicHubは、FIDLフィールドのドメインサイロを壊し、将来のブレークスルーを刺激する上で、大きな飛躍だ。
関連論文リスト
- Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Cross-Domain Document Object Detection: Benchmark Suite and Method [71.4339949510586]
文書オブジェクト検出(DOD)は、インテリジェントな文書編集や理解といった下流タスクに不可欠である。
我々は、ソースドメインからのラベル付きデータとターゲットドメインからのラベルなしデータのみを用いて、ターゲットドメインの検出器を学習することを目的として、クロスドメインDODを調査した。
各データセットに対して、ページイメージ、バウンディングボックスアノテーション、PDFファイル、PDFファイルから抽出されたレンダリング層を提供する。
論文 参考訳(メタデータ) (2020-03-30T03:04:51Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。