論文の概要: Can We Build a Monolithic Model for Fake Image Detection? SICA: Semantic-Induced Constrained Adaptation for Unified-Yet-Discriminative Artifact Feature Space Reconstruction
- arxiv url: http://arxiv.org/abs/2602.06676v1
- Date: Fri, 06 Feb 2026 13:03:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.404268
- Title: Can We Build a Monolithic Model for Fake Image Detection? SICA: Semantic-Induced Constrained Adaptation for Unified-Yet-Discriminative Artifact Feature Space Reconstruction
- Title(参考訳): 偽画像検出のためのモノリシックモデルの構築は可能か? : SICA: 意味的制約付き適応による一元的特徴量空間再構成
- Authors: Bo Du, Xiaochen Ma, Xuekang Zhu, Zhe Yang, Chaogun Niu, Jian Liu, Ji-Zhe Zhou,
- Abstract要約: モノリシックフェイク画像検出(FID)モデルは、実際には一貫して性能が劣っている。
本稿では,最初のモノリシックFIDパラダイムであるSemantic-induced Constrained Adaptation (SICA)を提案する。
SICAは15の最先端のメソッドを上回り、ターゲットの統一されたyet-差別的なアーティファクト特徴空間を再構築する。
- 参考スコア(独自算出の注目度): 35.062003602486925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fake Image Detection (FID), aiming at unified detection across four image forensic subdomains, is critical in real-world forensic scenarios. Compared with ensemble approaches, monolithic FID models are theoretically more promising, but to date, consistently yield inferior performance in practice. In this work, by discovering the ``heterogeneous phenomenon'', which is the intrinsic distinctness of artifacts across subdomains, we diagnose the cause of this underperformance for the first time: the collapse of the artifact feature space driven by such phenomenon. The core challenge for developing a practical monolithic FID model thus boils down to the ``unified-yet-discriminative" reconstruction of the artifact feature space. To address this paradoxical challenge, we hypothesize that high-level semantics can serve as a structural prior for the reconstruction, and further propose Semantic-Induced Constrained Adaptation (SICA), the first monolithic FID paradigm. Extensive experiments on our OpenMMSec dataset demonstrate that SICA outperforms 15 state-of-the-art methods and reconstructs the target unified-yet-discriminative artifact feature space in a near-orthogonal manner, thus firmly validating our hypothesis. The code and dataset are available at:https: //github.com/scu-zjz/SICA_OpenMMSec.
- Abstract(参考訳): フェイク画像検出(FID)は、4つの画像法医学サブドメインにまたがる統一的な検出を目的としており、現実世界の法医学シナリオにおいて重要である。
アンサンブルのアプローチと比較すると、モノリシックなFIDモデルは理論的にはより有望であるが、これまでは、実用的には一貫して劣る性能を保っている。
本研究では,サブドメイン間のアーティファクトの固有の相違である「異種現象」を発見し,その原因を初めて診断する。
実用的なモノリシックなFIDモデルを開発する上での課題は、アーティファクトの特徴空間を ‘統一的かつ差別的’ に再構築することにある。
このパラドックス的課題に対処するために、我々は、高レベルの意味論が再構築の事前構造として機能しうると仮定し、さらに、最初のモノリシックFIDパラダイムであるセマンティック誘導制約適応(SICA)を提案する。
我々のOpenMMSecデータセットの大規模な実験により、SICAは15の最先端の手法より優れており、ターゲットの統一的識別的アーティファクト特徴空間をほぼ直交的に再構成し、我々の仮説をしっかりと検証している。
コードとデータセットは、https: //github.com/scu-zjz/SICA_OpenMMSecで公開されている。
関連論文リスト
- Simplicity Prevails: The Emergence of Generalizable AIGI Detection in Visual Foundation Models [15.709482146201283]
現代のビジョン・ファンデーション・モデル(Vision Foundation Models)の凍結した特徴に基づいて訓練された単純な線形分類器は、新しい最先端技術を確立している。
この基準線は標準ベンチマーク上の特別な検出器と一致し、また、ウィジェット内のデータセット上では決定的に優れていることを示す。
我々は、AIの法医学におけるパラダイムシフトを提唱し、静的ベンチマークの過度な適合から、ファンデーションモデルの進化する世界の知識を現実の信頼性に活用することへと移行した。
論文 参考訳(メタデータ) (2026-02-02T07:20:02Z) - DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation [47.409626500688866]
本稿では,DINO Spherical Autoencoder(DINO-SAE)について述べる。
提案手法は, 既修のVFMと強いセマンティックアライメントを維持しつつ, 0.37 rFID と 26.2 dB PSNR に到達し, 最先端の再現性を実現する。
論文 参考訳(メタデータ) (2026-01-30T12:25:34Z) - DNA: Uncovering Universal Latent Forgery Knowledge [39.19379714306656]
フォージェリ検出機能は、すでにトレーニング済みのモデル内にエンコードされている。
DNAフレームワークは粗大な発掘機構を採用している。
Hifi-Genは、最新のモデルの上に構築された高忠実度合成ベンチマークである。
論文 参考訳(メタデータ) (2026-01-30T03:48:30Z) - Reasoning-Driven Amodal Completion: Collaborative Agents and Perceptual Evaluation [17.405818788700234]
本稿では,視覚合成から意味的計画を明確に分離する協調的マルチエージェント推論フレームワークを提案する。
提案手法は,画素生成前の構造的,明示的なプランを生成し,視覚的,意味的に整合した単一パス合成を可能にする。
従来の評価基準の限界に対処し,新しい人間対応評価指標MAC-Scoreを導入する。
論文 参考訳(メタデータ) (2025-12-24T04:39:45Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。