論文の概要: Impostor: An Agent-Curated Benchmark for Realistic AIGC Manipulation Localization
- arxiv url: http://arxiv.org/abs/2606.04545v1
- Date: Wed, 03 Jun 2026 07:27:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.604776
- Title: Impostor: An Agent-Curated Benchmark for Realistic AIGC Manipulation Localization
- Title(参考訳): Impostor: AIGC操作ローカライゼーションのためのエージェントキュレートベンチマーク
- Authors: Zhenliang Li, Yutao Hu, Qixiong Wang, Wenpeng Du, Hongxiang Jiang, Jiasong Wu, Xiaolong Jiang, Jungong Han,
- Abstract要約: 高品質なAI編集画像操作ローカライゼーションデータセットであるImpostorを紹介した。
Impostorは、シーン認識、編集計画、操作実行、品質検証、反復リフレクションを統合するクローズドループエージェントフレームワークであるCraftAgentによって構築されている。
本研究では,局所的な位相モデリングと意味論的整合性学習を導入し,意味論的に検証可能なが法学的に乱された領域をよりよくローカライズする意味情報ネットワーク(PANet)を提案する。
- 参考スコア(独自算出の注目度): 45.52738316793005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in generative image editing have improved the realism and controllability of localized image manipulation, raising new challenges for image manipulation detection and localization (IMDL). However, existing IMDL benchmarks still have limitations in visual realism, manipulation diversity, and generator coverage, making it difficult to reflect recent trends in image manipulation. To address these limitations, we introduce Impostor, a high-quality AI-edited image manipulation localization dataset containing 100K manipulated images. Impostor is constructed by CraftAgent, a closed-loop agent framework that integrates scene perception, editing planning, manipulation execution, quality validation, and iterative reflection to automatically generate diverse and visually realistic manipulated images. Moreover, Impostor contains images generated by seven recent AIGC models across three manipulation types and includes multiple manipulated regions, providing a more comprehensive benchmark for AIGC-based IMDL. Furthermore, we propose PhaseAware-Net (PANet), a semantic-forensic framework that introduces local phase modeling and semantic-forensic consistency learning to better localize semantically plausible yet forensically disrupted manipulated regions. Extensive experiments show that Impostor poses significant challenges to existing large vision-language models (LVLMs) and specialized IMDL methods, while PANet achieves superior performance on Impostor and multiple public benchmarks.
- Abstract(参考訳): 近年、画像編集の進歩により、局所的な画像操作の現実性と制御性が向上し、画像操作検出と局所化(IMDL)の新たな課題が提起されている。
しかし、既存のIMDLベンチマークには、視覚リアリズム、操作の多様性、ジェネレータのカバレッジに制限があるため、最近の画像操作の傾向を反映することは困難である。
これらの制限に対処するために、100Kの操作された画像を含む高品質なAI編集画像操作ローカライゼーションデータセットであるImpostorを紹介した。
Impostorは、シーン認識、編集計画、操作実行、品質検証、反復リフレクションを統合するクローズドループエージェントフレームワークであるCraftAgentによって構築され、多彩で視覚的に操作されたイメージを自動的に生成する。
さらに、Impostorには、3つの操作タイプにわたる7つの最新のAIGCモデルによって生成されたイメージが含まれており、複数の操作されたリージョンが含まれており、AIGCベースのIMDLのより包括的なベンチマークを提供する。
さらに、局所位相モデリングと意味法則整合学習を導入し、意味論的に検証可能なが、法学的に乱された操作領域のローカライズを向上する意味法学フレームワークであるPyseAware-Net(PANet)を提案する。
大規模な実験により、Impostorは既存の大規模視覚言語モデル(LVLM)と特殊なIMDLメソッドに重大な課題を呈し、PANetはImpostorと複数の公開ベンチマークで優れたパフォーマンスを達成している。
関連論文リスト
- INSIGHT: An Interpretable Neural Vision-Language Framework for Reasoning of Generative Artifacts [0.0]
現在の法医学システムは、現実世界の条件下で急速に低下している。
ほとんどの検出器は不透明物として機能し、なぜ画像が合成物としてフラグ付けされるのかについての知見はほとんど得られない。
本稿では,AI生成画像のロバスト検出と透過的説明のための統合フレームワークであるINSIGHTを紹介する。
論文 参考訳(メタデータ) (2025-11-27T11:43:50Z) - ManipShield: A Unified Framework for Image Manipulation Detection, Localization and Explanation [81.52606410224136]
画像操作検出と局所化のための大規模ベンチマークである textbfManipBench を提案する。
また,マルチモーダル大言語モデル(MLLM)に基づくオールインワンモデルであるtextbfManipShieldを提案する。
論文 参考訳(メタデータ) (2025-11-18T08:50:17Z) - Context-Aware Weakly Supervised Image Manipulation Localization with SAM Refinement [52.15627062770557]
悪意のある画像操作は社会的リスクを生じさせ、効果的な画像操作検出方法の重要性を高めている。
画像操作検出の最近のアプローチは、完全に教師されたアプローチによって大きく推進されている。
本稿では,デュアルブランチトランスフォーマー-CNNアーキテクチャに基づく,弱教師付きフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-26T07:35:09Z) - EditScout: Locating Forged Regions from Diffusion-based Edited Images with Multimodal LLM [50.054404519821745]
本稿では,多モーダル大規模言語モデルを統合した新しいフレームワークを提案する。
我々のフレームワークはMagicBrush、AutoSplice、PerfBrushデータセットの有望な結果を達成する。
特に,本手法は,これまで目に見えなかった種類の編集を特徴とする自己構築型テストセットであるPerfBrushデータセットを最適化する。
論文 参考訳(メタデータ) (2024-12-05T02:05:33Z) - GIM: A Million-scale Benchmark for Generative Image Manipulation Detection and Localization [21.846935203845728]
我々はSAM, LLM, 生成モデルの強力な機能を統合するローカルな操作データ生成パイプラインを構築している。
1)大規模では、AIが操作する画像と実画像が100万組以上含まれている。
論文 参考訳(メタデータ) (2024-06-24T11:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。