論文の概要: NeXT-IMDL: Build Benchmark for NeXT-Generation Image Manipulation Detection & Localization
- arxiv url: http://arxiv.org/abs/2512.23374v1
- Date: Mon, 29 Dec 2025 11:09:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.472759
- Title: NeXT-IMDL: Build Benchmark for NeXT-Generation Image Manipulation Detection & Localization
- Title(参考訳): NeXT-IMDL:NeXT生成画像操作検出とローカライゼーションのためのビルドベンチマーク
- Authors: Yifei Li, Haoyuan He, Yu Zheng, Bingyao Yu, Wenzhao Zheng, Lei Chen, Jie Zhou, Jiwen Lu,
- Abstract要約: NeXT-IMDLは、現在の検出器の境界を調査するために設計された大規模な診断ベンチマークである。
NeXT-IMDLはAIGCベースの操作を、編集モデル、操作タイプ、コンテンツセマンティクス、偽造の4つの基本軸に沿って分類する。
11の代表的なモデルに対する我々の実験では、これらのモデルが元の設定でうまく機能する一方で、システム障害と大幅な性能低下を示しています。
- 参考スコア(独自算出の注目度): 67.84497768987023
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The accessibility surge and abuse risks of user-friendly image editing models have created an urgent need for generalizable, up-to-date methods for Image Manipulation Detection and Localization (IMDL). Current IMDL research typically uses cross-dataset evaluation, where models trained on one benchmark are tested on others. However, this simplified evaluation approach conceals the fragility of existing methods when handling diverse AI-generated content, leading to misleading impressions of progress. This paper challenges this illusion by proposing NeXT-IMDL, a large-scale diagnostic benchmark designed not just to collect data, but to probe the generalization boundaries of current detectors systematically. Specifically, NeXT-IMDL categorizes AIGC-based manipulations along four fundamental axes: editing models, manipulation types, content semantics, and forgery granularity. Built upon this, NeXT-IMDL implements five rigorous cross-dimension evaluation protocols. Our extensive experiments on 11 representative models reveal a critical insight: while these models perform well in their original settings, they exhibit systemic failures and significant performance degradation when evaluated under our designed protocols that simulate real-world, various generalization scenarios. By providing this diagnostic toolkit and the new findings, we aim to advance the development towards building truly robust, next-generation IMDL models.
- Abstract(参考訳): ユーザフレンドリーな画像編集モデルのアクセシビリティの急上昇と乱用リスクは、画像操作検出および局所化(IMDL)の一般化可能な最新の方法に対する緊急の要求を生み出している。
現在のIMDL研究は一般的に、あるベンチマークでトレーニングされたモデルを他のベンチマークでテストするクロスデータセット評価を使用する。
しかし、この簡易な評価アプローチは、多種多様なAI生成コンテンツを扱う際の既存の手法の脆弱さを隠蔽し、進歩の誤解を招く。
本稿では,データ収集だけでなく,現行検出器の一般化境界を体系的に探究する大規模診断ベンチマークであるNeXT-IMDLを提案することで,この錯覚に挑戦する。
具体的には、NeXT-IMDLはAIGCベースの操作を4つの基本軸に沿って分類する。
これに基づいて、NeXT-IMDLは5つの厳密なクロス次元評価プロトコルを実装している。
これらのモデルは、元の設定でよく機能するが、実世界の様々な一般化シナリオをシミュレートする設計されたプロトコルで評価された場合、システム障害と大幅な性能低下を示す。
この診断ツールキットと新たな知見を提供することで、我々は、真に堅牢で次世代のIMDLモデルの構築に向けた開発を進めることを目指している。
関連論文リスト
- From Evidence to Verdict: An Agent-Based Forensic Framework for AI-Generated Image Detection [19.240335260177382]
AIFo(Agent-based Image Forensics)は、マルチエージェントコラボレーションによる人間の法医学的調査をエミュレートする、トレーニング不要のフレームワークである。
従来の手法とは異なり,本フレームワークでは,リバース画像検索,メタデータ抽出,事前学習型分類器,VLM解析など,一連の法医学的ツールを用いている。
我々の総合的な評価は6000のイメージに及び、現代の生成プラットフォームや多様なオンラインソースの画像を含む現実世界のシナリオに挑戦する。
論文 参考訳(メタデータ) (2025-10-31T18:36:49Z) - ForenX: Towards Explainable AI-Generated Image Detection with Multimodal Large Language Models [82.04858317800097]
ForenXは画像の真正性を識別するだけでなく、人間の思考に共鳴する説明を提供する新しい手法である。
ForenXは、強力なマルチモーダル大言語モデル(MLLM)を使用して、法医学的な手がかりを分析し、解釈する。
本稿では,AI生成画像における偽証拠の記述専用のデータセットであるForgReasonを紹介する。
論文 参考訳(メタデータ) (2025-08-02T15:21:26Z) - Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - IMDL-BenCo: A Comprehensive Benchmark and Codebase for Image Manipulation Detection & Localization [58.32394109377374]
IMDL-BenCoは、最初の包括的なIMDLベンチマークおよびモジュラーフレームワークである。
IMDLフレームワークを標準化された再利用可能なコンポーネントに分解し、モデル構築パイプラインを改訂する。
8つの最先端IMDLモデル(うち1つはスクラッチから再現される)、2つの標準トレーニングおよび評価プロトコル、15のGPUアクセラレーション評価メトリクス、そして3種類の堅牢性評価が含まれている。
論文 参考訳(メタデータ) (2024-06-15T09:44:54Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - Sampling for Deep Learning Model Diagnosis (Technical Report) [5.8057675678464555]
ディープニューラルネットワークのブラックボックスの性質は、医学的診断などの応用における採用の障壁である。
我々は,これらのモデルデバッグクエリに対して,近似的だが正確な結果を生成する新しいデータサンプリング手法を開発した。
本手法は,1つの標準的なコンピュータビジョンと1つの科学的データセットで評価し,クエリの精度において,サンプリング手法が様々な最先端の代替技術より優れていることを示す。
論文 参考訳(メタデータ) (2020-02-22T19:24:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。