論文の概要: DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities
- arxiv url: http://arxiv.org/abs/2606.04205v1
- Date: Tue, 02 Jun 2026 20:49:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.377774
- Title: DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities
- Title(参考訳): DetectZoo: テキスト、オーディオ、画像モダリティ間のAI生成コンテンツ検出のための統一ツールキット
- Authors: Sajad Ebrahimi, Nima Jamali, Bardia Shirsalimian, Kelly McConvey, Wentao Zhang, Jalehsadat Mahdavimoghaddam, Maksym Taranukhin, Maura Grossman, Vered Shwartz, Yuntian Deng, Ebrahim Bagheri,
- Abstract要約: 生成モデルは、人間と機械生成物の区別を侵食した。
ほとんどの検出器は商用ソフトウェアか、オープンソースであれば、互換性のない事前処理、評価プロトコル、評価メトリクスが付属する。
我々は、AI生成コンテンツ検出のための統一インターフェースを提供するために設計された、第一級ツールキットであるDetectZooを紹介する。
- 参考スコア(独自算出の注目度): 24.062435951342692
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The growing popularity and capacity of generative models have eroded the distinction between human and machine-generated content, motivating a growing body of work on detection across text, images, and audio. Most available detectors are either commercial software or, if open-source, come with incompatible codebases with bespoke preprocessing, evaluation protocols, and evaluation metrics, which make their adoption, fair comparison, and reproduction quite difficult. To address this critical gap, we introduce DetectZoo, a first-of-its-kind, extensible toolkit designed to provide a unified interface for AI-generated content detection across text, audio, and image modalities. DetectZoo standardizes the complete empirical pipeline, from data ingestion and preprocessing to model assessment, offering researchers a cohesive framework to benchmark state-of-the-art detectors systematically. By integrating diverse public datasets and baseline detection algorithms under a single, unified API, our toolkit facilitates rigorous and reproducible evaluation. DetectZoo provides reference implementations of 61 detectors, native loaders for 22 benchmark datasets, and a standardized evaluation pipeline that reports multiple metrics through a common interface. Each detector is self-contained yet accessible through the same interface, automatically caches pretrained weights, and reproduces the original published results. DetectZoo lowers the barrier to entry for multi-modal AI forensics, enabling researchers to identify performance gaps across domains and accelerating the development of robust, generalizable detection techniques. The open-source repository and comprehensive documentation are publicly available at https://github.com/sadjadeb/DetectZoo, and the package can be installed via pip install detectzoo.
- Abstract(参考訳): 生成モデルの人気と能力の高まりは、人間と機械が生成するコンテンツの区別を損なうようになり、テキスト、画像、オーディオをまたいで検出する取り組みの活発化を動機付けている。
利用可能なほとんどの検出器は商用ソフトウェアか、オープンソースであれば、非互換のコードベースが備わっており、事前処理、評価プロトコル、評価メトリクスが採用、公正な比較、再現を非常に困難にしている。
この重要なギャップに対処するために、テキスト、オーディオ、画像のモダリティをまたいだAI生成コンテンツ検出のための統一インターフェースを提供するために設計された、第一級で拡張可能なツールキットであるDetectZooを紹介します。
DetectZooは、データ取り込みや前処理からモデルアセスメントに至るまで、完全な経験的パイプラインを標準化し、研究者が結束的なフレームワークを提供し、最先端の検出器を体系的にベンチマークする。
多様な公開データセットとベースライン検出アルゴリズムを単一の統一APIに統合することにより、当社のツールキットは厳密で再現可能な評価を容易にする。
DetectZooは、61の検出器、22のベンチマークデータセットのネイティブローダ、共通インターフェースを通じて複数のメトリクスをレポートする標準化された評価パイプラインのリファレンス実装を提供する。
それぞれの検出器は自己完結しているが、同じインターフェースを通じてアクセス可能であり、予め訓練された重量を自動的にキャッシュし、元の公表された結果を再現する。
DetectZooは、マルチモーダルAI法医学の参入障壁を低くし、研究者がドメイン間のパフォーマンスギャップを特定し、堅牢で一般化可能な検出技術の開発を加速できるようにする。
オープンソースリポジトリと包括的なドキュメントはhttps://github.com/sadjadeb/DetectZooで公開されている。
関連論文リスト
- Benchmarking Fake Voice Detection in the Fake Voice Generation Arms Race [5.051497895059242]
既存のベンチマークでは、さまざまな偽音声サンプルを単一のデータセットに集約して評価する。
このプラクティスは、メソッド固有のアーティファクトをマスクし、異なる世代パラダイムに対する検出器のさまざまなパフォーマンスを隠蔽する。
我々は,新しい1対1評価プロトコルによって17の最先端の偽音声生成装置と8つの先行検知器の相互作用を体系的に評価する,最初のエコシステムレベルのベンチマークを導入する。
論文 参考訳(メタデータ) (2025-10-08T00:52:06Z) - AUDDT: Audio Unified Deepfake Detection Benchmark Toolkit [7.279026980203529]
既存の28のオーディオディープフェイクデータセットを体系的にレビューし、AUDDTと呼ばれるオープンソースのベンチマークツールキットを提示する。
このツールキットの目的は、これらの28のデータセットにわたる事前訓練された検出器の評価を自動化することであり、ディープフェイク検出器の利点と欠点を直接フィードバックすることである。
論文 参考訳(メタデータ) (2025-09-25T21:09:40Z) - Where are we in audio deepfake detection? A systematic analysis over generative and detection models [59.09338266364506]
SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供する。
従来のモデルベース検出システムと基礎モデルベース検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文 参考訳(メタデータ) (2024-10-06T01:03:42Z) - Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.43709660948812]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。
ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。
BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文 参考訳(メタデータ) (2024-07-10T18:00:54Z) - Benchmarking Cross-Domain Audio-Visual Deception Detection [45.342156006617394]
本稿では,最初のクロスドメイン音声・視覚的誤認検出ベンチマークを提案する。
シングル・ツー・シングルとマルチ・ツー・シングル・ドメインの一般化性能を比較した。
一般化性能を向上させるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-11T12:06:31Z) - DeepfakeBench: A Comprehensive Benchmark of Deepfake Detection [55.70982767084996]
ディープフェイク検出の分野で見落とされがちな課題は、標準化され、統一され、包括的なベンチマークがないことである。
DeepfakeBenchと呼ばれる,3つの重要なコントリビューションを提供するディープフェイク検出のための,最初の包括的なベンチマークを提示する。
DeepfakeBenchには15の最先端検出方法、9CLデータセット、一連のDeepfake検出評価プロトコルと分析ツール、包括的な評価ツールが含まれている。
論文 参考訳(メタデータ) (2023-07-04T01:34:41Z) - On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。
GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文 参考訳(メタデータ) (2023-04-10T17:47:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。