Fugu-MT 論文翻訳(概要): Multi-Feature Fusion Approach for Generative AI Images Detection

論文の概要: Multi-Feature Fusion Approach for Generative AI Images Detection

arxiv url: http://arxiv.org/abs/2603.29788v1
Date: Tue, 31 Mar 2026 14:25:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-01 15:25:03.712994
Title: Multi-Feature Fusion Approach for Generative AI Images Detection
Title（参考訳）: 生成AI画像検出のための多機能融合手法
Authors: Abderrezzaq Sendjasni, Mohamed-Chaker Larabi,
Abstract要約: 3つの異なる空間からの相補的手がかりを組み合わせた多機能融合フレームワークを検討・評価する。個々の特徴空間は、異なるジェネレータ間で大きな性能変動を示すことを示す。最先端の手法と比較して、提案するフレームワークは、評価されたすべてのデータセットに対して一貫してパフォーマンスを向上する。
参考スコア（独自算出の注目度）: 3.16770435670322
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The rapid evolution of Generative AI (GenAI) models has led to synthetic images of unprecedented realism, challenging traditional methods for distinguishing them from natural photographs. While existing detectors often rely on single-feature spaces, such as statistical regularities, semantic embeddings, or texture patterns, these approaches tend to lack robustness when confronted with diverse and evolving generative models. In this work, we investigate and systematically evaluate a multi-feature fusion framework that combines complementary cues from three distinct spaces: (1) Mean Subtracted Contrast Normalized (MSCN) features capturing low-level statistical deviations; (2) CLIP embeddings encoding high-level semantic coherence; and (3) Multi-scale Local Binary Patterns (MLBP) characterizing mid-level texture anomalies. Through extensive experiments on four benchmark datasets covering a wide range of generative models, we show that individual feature spaces exhibit significant performance variability across different generators. Crucially, the fusion of all three representations yields superior and more consistent performance, particularly in a challenging mixed-model scenario. Compared to state-of-the-art methods, the proposed framework yields consistently improved performance across all evaluated datasets. Overall, this work highlights the importance of hybrid representations for robust GenAI image detection and provides a principled framework for integrating complementary visual cues.
Abstract（参考訳）: 生成AI(GenAI)モデルの急速な進化により、前例のない現実主義の合成画像が生まれ、それらと自然写真とを区別する伝統的な手法に挑戦している。既存の検出器は統計正則性やセマンティック埋め込み、テクスチャパターンといった単一機能空間に依存していることが多いが、これらのアプローチは多様で進化する生成モデルに直面すると頑丈さを欠く傾向がある。本研究では,(1)低レベルな統計的偏差を捉えた平均抽出コントラスト正規化(MSCN)特徴,(2)高レベルなセマンティックコヒーレンスを符号化したCLIP埋め込み,(3)中レベルのテクスチャ異常を特徴付けるマルチスケールローカルバイナリパターン(MLBP)の3つの異なる空間からの相補的キューを組み合わせた多機能融合フレームワークについて検討し,体系的に評価する。広範囲な生成モデルをカバーする4つのベンチマークデータセットの広範な実験を通して、個々の特徴空間が異なるジェネレータ間で大きな性能変動を示すことを示す。重要なことに、3つの表現の融合は、特に挑戦的な混合モデルシナリオにおいて、優れた、より一貫性のあるパフォーマンスをもたらす。最先端の手法と比較して、提案するフレームワークは、評価されたすべてのデータセットに対して一貫してパフォーマンスを向上する。全体として、この研究は、堅牢なGenAI画像検出のためのハイブリッド表現の重要性を強調し、相補的な視覚的手がかりを統合するための原則化されたフレームワークを提供する。

関連論文リスト

Diversity Matters: Dataset Diversification and Dual-Branch Network for Generalized AI-Generated Image Detection [2.1410799064827235]
我々は、AI生成画像検出のためのデータ多様性と特徴領域補完性を強調する新しいフレームワーク、textbfDiversity Mattersを提案する。提案手法では,冗長あるいは非常に類似したサンプルを破棄する特徴領域類似度フィルタリング機構を提案する。ベンチマークデータセットに対する大規模な実験により、提案手法はクロスモデルとクロスデータセットのパフォーマンスを大幅に改善することが示された。
論文参考訳（メタデータ） (2026-03-29T18:29:00Z)
UniG2U-Bench: Do Unified Models Advance Multimodal Understanding? [50.92401586025528]
統一マルチモーダルモデルは、最近強力な生成能力を示したが、生成が理解を改善したかどうかはまだ不明である。提案するUniG2U-Benchは,G2U(Generation-to-understanding)評価を7つのシステマと30のサブタスクに分類する総合ベンチマークである。
論文参考訳（メタデータ） (2026-03-03T18:36:16Z)
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation [54.588082888166504]
我々は、因果アプローチを通じてインターリーブされたマルチモーダル生成を可能にする統一的なフレームワークであるMogaoを提案する。 Mogooは、Deep-fusion設計、デュアルビジョンエンコーダ、インターリーブされた回転位置埋め込み、マルチモーダル分類器フリーガイダンスなど、アーキテクチャ設計における重要な技術的改善のセットを統合している。実験により,モガオはマルチモーダル理解とテキスト・ツー・イメージ生成において最先端の性能を発揮するとともに,高品質でコヒーレントなインターリーブ・アウトプットの創出にも優れていることが示された。
論文参考訳（メタデータ） (2025-05-08T17:58:57Z)
HFMF: Hierarchical Fusion Meets Multi-Stream Models for Deepfake Detection [4.908389661988192]
HFMFは総合的な2段階のディープフェイク検出フレームワークである。視覚変換器と畳み込みネットを階層的特徴融合機構を通じて統合する。私たちのアーキテクチャは、多様なデータセットベンチマークで優れたパフォーマンスを実現しています。
論文参考訳（メタデータ） (2025-01-10T00:20:29Z)
Detecting the Undetectable: Combining Kolmogorov-Arnold Networks and MLP for AI-Generated Image Detection [0.0]
本稿では,最先端な生成AIモデルによって生成された画像の堅牢な識別が可能な,新しい検出フレームワークを提案する。従来の多層パーセプトロン(MLP)とセマンティックイメージ埋め込みを統合した分類システムを提案する。
論文参考訳（メタデータ） (2024-08-18T06:00:36Z)
Learning transformer-based heterogeneously salient graph representation for multimodal remote sensing image classification [42.15709954199397]
本稿では,変圧器を用いたヘテロジニアサリエントグラフ表現法(THSGR)を提案する。まず、多モード不均一グラフエンコーダを用いて、非ユークリッド構造の特徴を異種データから符号化する。自己アテンションフリーなマルチ畳み込み変調器は、効果的かつ効率的な長期依存性モデリングのために設計されている。
論文参考訳（メタデータ） (2023-11-17T04:06:20Z)
IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文参考訳（メタデータ） (2023-03-17T17:07:36Z)
Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。 CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文参考訳（メタデータ） (2022-07-21T22:19:17Z)
IMAGINE: Image Synthesis by Image-Guided Model Inversion [79.4691654458141]
IMGE-Guided Model INvErsion (IMAGINE) と呼ばれるインバージョンベースの手法を導入し、高品質で多様な画像を生成します。我々は,事前学習した分類器から画像意味論の知識を活用し,妥当な世代を実現する。 IMAGINEは,1)合成中の意味的特異性制約を同時に実施し,2)ジェネレータトレーニングなしでリアルな画像を生成し,3)生成過程を直感的に制御する。
論文参考訳（メタデータ） (2021-04-13T02:00:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。