論文の概要: Generalizable Detection of AI Generated Images with Large Models and Fuzzy Decision Tree
- arxiv url: http://arxiv.org/abs/2603.28508v1
- Date: Mon, 30 Mar 2026 14:43:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.448152
- Title: Generalizable Detection of AI Generated Images with Large Models and Fuzzy Decision Tree
- Title(参考訳): 大型モデルとファジィ決定木を用いたAI生成画像の一般化検出
- Authors: Fei Wu, Guanghao Ding, Zijian Niu, Zhenrui Wang, Lei Yang, Zhuosheng Zhang, Shilin Wang,
- Abstract要約: 悪意のある使用とAI生成画像の普及は、デジタルコンテンツの信頼性に深刻な脅威をもたらす。
既存の検出方法は、生成パイプライン内の一般的な操作ステップによって残された低レベルのアーティファクトを利用する。
本稿では,ファジィ決定木を介して,軽量な人工物認識検出器とMLLMを統合したAI生成画像検出フレームワークを提案する。
- 参考スコア(独自算出の注目度): 30.175850837300317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The malicious use and widespread dissemination of AI-generated images pose a serious threat to the authenticity of digital content. Existing detection methods exploit low-level artifacts left by common manipulation steps within the generation pipeline, but they often lack generalization due to model-specific overfitting. Recently, researchers have resorted to Multimodal Large Language Models (MLLMs) for AIGC detection, leveraging their high-level semantic reasoning and broad generalization capabilities. While promising, MLLMs lack the fine-grained perceptual sensitivity to subtle generation artifacts, making them inadequate as standalone detectors. To address this issue, we propose a novel AI-generated image detection framework that synergistically integrates lightweight artifact-aware detectors with MLLMs via a fuzzy decision tree. The decision tree treats the outputs of basic detectors as fuzzy membership values, enabling adaptive fusion of complementary cues from semantic and perceptual perspectives. Extensive experiments demonstrate that the proposed method achieves state-of-the-art accuracy and strong generalization across diverse generative models.
- Abstract(参考訳): AI生成画像の悪意ある使用と普及は、デジタルコンテンツの信頼性に深刻な脅威をもたらす。
既存の検出方法は、生成パイプライン内の一般的な操作ステップによって残された低レベルのアーティファクトを利用するが、モデル固有のオーバーフィッティングによる一般化が欠如していることが多い。
近年、研究者はAIGCの検出にMLLM(Multimodal Large Language Models)を活用し、ハイレベルなセマンティック推論と広範な一般化機能を活用している。
MLLMは有望だが、微妙な生成アーティファクトに対する微妙な知覚感度に欠けており、スタンドアロンの検出器としては不十分である。
この問題に対処するために,ファジィ決定木を介して軽量な人工物認識検出器とMLLMを相乗的に統合する,新たなAI生成画像検出フレームワークを提案する。
決定木は基本検出器の出力をファジィメンバシップ値として扱い、意味論的および知覚的視点から補完的キューの適応的な融合を可能にする。
大規模実験により,提案手法は多種多様な生成モデルにまたがる最先端の精度と強力な一般化を実現する。
関連論文リスト
- EvoGuard: An Extensible Agentic RL-based Framework for Practical and Evolving AI-Generated Image Detection [19.507664662884086]
EvoGuardはAIGI検出のための新しいエージェントフレームワークである。
様々な最先端(SOTA)のMLLMと非MLLM検出器を呼び出し可能なツールとしてカプセル化している。
正と負のサンプル間のバイアスを緩和しながらSOTA精度を達成する。
論文 参考訳(メタデータ) (2026-03-18T04:14:40Z) - Unveiling Perceptual Artifacts: A Fine-Grained Benchmark for Interpretable AI-Generated Image Detection [95.08316274158165]
X-AIGDは、低レベルの歪み、高レベルの意味論、認知レベルの反事実など、知覚的アーティファクトのピクセルレベルの分類されたアノテーションを提供する。
既存のAIGI検出器は、最も基本的な歪みレベルであっても、知覚的アーティファクトに依存しない。
モデル注意をアーティファクト領域と明確に整合させることは、検出器の解釈可能性と一般化を高めることができる。
論文 参考訳(メタデータ) (2026-01-27T10:09:17Z) - Self-Supervised AI-Generated Image Detection: A Camera Metadata Perspective [80.10217707456046]
カメラメタデータを利用したAI生成画像検出のための自己教師型アプローチを提案する。
分類型EXIFタグを分類することにより,撮影画像のみに特徴抽出器を訓練する。
我々の検出器は、電界中のサンプルに対して強力な一般化と、一般的な良性イメージの摂動に対する堅牢性を提供する。
論文 参考訳(メタデータ) (2025-12-05T11:53:18Z) - INSIGHT: An Interpretable Neural Vision-Language Framework for Reasoning of Generative Artifacts [0.0]
現在の法医学システムは、現実世界の条件下で急速に低下している。
ほとんどの検出器は不透明物として機能し、なぜ画像が合成物としてフラグ付けされるのかについての知見はほとんど得られない。
本稿では,AI生成画像のロバスト検出と透過的説明のための統合フレームワークであるINSIGHTを紹介する。
論文 参考訳(メタデータ) (2025-11-27T11:43:50Z) - ThinkFake: Reasoning in Multimodal Large Language Models for AI-Generated Image Detection [51.93101033997245]
AI生成画像のリアリズムの増大は、誤情報やプライバシー侵害に対する深刻な懸念を引き起こしている。
我々は、AI生成画像検出のための新しい推論に基づく一般化可能なフレームワークThinkFakeを提案する。
我々は、ThinkFakeがGenImageベンチマークで最先端の手法より優れており、挑戦的なLOKIベンチマークで強力なゼロショットの一般化を示すことを示す。
論文 参考訳(メタデータ) (2025-09-24T07:34:09Z) - ForenX: Towards Explainable AI-Generated Image Detection with Multimodal Large Language Models [82.04858317800097]
ForenXは画像の真正性を識別するだけでなく、人間の思考に共鳴する説明を提供する新しい手法である。
ForenXは、強力なマルチモーダル大言語モデル(MLLM)を使用して、法医学的な手がかりを分析し、解釈する。
本稿では,AI生成画像における偽証拠の記述専用のデータセットであるForgReasonを紹介する。
論文 参考訳(メタデータ) (2025-08-02T15:21:26Z) - MLEP: Multi-granularity Local Entropy Patterns for Universal AI-generated Image Detection [44.40575446607237]
AI生成画像(AIGI)を効果的に検出する手法が緊急に必要である。
マルチグラニュラリティ局所エントロピーパターン (MLEP) を提案する。
MLEPは、画像のセマンティクスを著しく破壊し、潜在的なコンテンツバイアスを低減しながら、次元とスケールの画素関係を包括的にキャプチャする。
論文 参考訳(メタデータ) (2025-04-18T14:50:23Z) - Towards Generalizable Forgery Detection and Reasoning [23.858913560970866]
We formulate detection and explanation as a unified forgery Detection and Reasoning task (FDR-Task)
マルチモーダル・フォージェリー推論データセット (MMFR-Dataset) は10つの生成モデルにわたる120K画像を含む大規模データセットであり, フォージェリー属性には378Kの推論アノテーションがある。
複数の生成モデルに対する実験により、FakeReasoningは堅牢な一般化を実現し、検出タスクと推論タスクの両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-03-27T06:54:06Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。