論文の概要: Decoupling Semantics and Fingerprints: A Universal Representation for AI-Generated Image Detection
- arxiv url: http://arxiv.org/abs/2605.07074v1
- Date: Fri, 08 May 2026 00:48:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.701321
- Title: Decoupling Semantics and Fingerprints: A Universal Representation for AI-Generated Image Detection
- Title(参考訳): セマンティックスとフィンガープリントのデカップリング:AI生成画像検出のための普遍表現
- Authors: Zhiyuan Wang, Yanxiang Chen, Yuanzhi Yao, Yunfeng Diao,
- Abstract要約: 検出者は単一の絡み合った表現として因子を学習し、普遍的な偽の痕跡は生成元固有の指紋と意味的内容と密に融合していることを示す。
我々はこれらの因子を構造的に分解するオルソゴン分解浄化ネットワーク(ODP-Net)を提案する。
ジェネレータ固有の指紋とセマンティックコンテンツから普遍的な偽トレースを明示的に分離することにより、ODP-Netは目に見えないアーキテクチャ上で最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 15.38286216285934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting AI-generated images across unseen architectures remains challenging, as existing models often overfit to generator-specific fingerprints and semantic content rather than learning universal forgery traces. We attribute this failure to feature entanglement: detectors learn these factors as a single entangled representation, where universal forgery traces are inextricably confounded with both generator-specific fingerprints and semantic content. Crucially, our spectral analysis reveals that this entanglement is avoidable: distinct generator-specific fingerprints (e.g., GAN stripes vs. Diffusion Model spots) occupy disjoint frequency subspaces and coexist as independent superpositions. Leveraging this physical orthogonality, we propose the Orthogonal Decomposition and Purification Network (ODP-Net) to structurally disentangle these factors. Specifically, ODP-Net employs (1) Instance-aware Orthogonal Decomposition to project features into mutually exclusive subspaces: universal forgery traces, generator-specific fingerprints, and semantic content; (2) Perturbation-based Purification to enforce semantic invariance via cross-sample feature injection; and (3) Manifold Alignment to bridge domain gaps. By explicitly decoupling universal forgery traces from generator-specific fingerprints and semantic content, ODP-Net achieves state-of-the-art performance on unseen architectures (e.g., Stable Diffusion 3), validating that structural disentanglement is key to generalization.
- Abstract(参考訳): 既存のモデルは、普遍的な偽の痕跡を学習するのではなく、ジェネレータ固有の指紋やセマンティックコンテンツに過度に適合する。
検出器は、これらの因子を単一の絡み合った表現として学習し、普遍的な偽の痕跡は、ジェネレータ固有の指紋とセマンティックコンテンツの両方で、厳密には融合している。
重要な点として、我々のスペクトル分析は、この絡み合いは避けられることを明らかにしている: 別個のジェネレータ固有の指紋(例えば、GANストライプ対拡散モデルスポット)は、結合周波数部分空間を占有し、独立した重ね合わせとして共存する。
この物理的直交性を生かしたオルソゴン分解浄化ネットワーク(ODP-Net)を提案する。
特に, ODP-Net では,(1) ケース対応のオルソゴン分解を用いて, 汎用的なフォージェリートレース, ジェネレータ固有の指紋, セマンティックコンテンツなど, 相互排他的な部分空間に特徴を投影する。
生成元固有の指紋とセマンティックコンテンツから普遍的な偽トレースを明示的に分離することにより、ODP-Netは未確認アーキテクチャ(例えば、安定拡散3)における最先端のパフォーマンスを達成し、構造的絡み合いが一般化の鍵であることを検証した。
関連論文リスト
- Probing the Latent World: Emergent Discrete Symbols and Physical Structure in Latent Representations [0.0]
JEPA(Joint Embedding Predictive Architectures)で訓練されたビデオワールドモデルは、ピクセルの再構成ではなく、潜在空間のマスキング領域を予測することによってリッチな表現を得る。
この経路は生成モデルの視覚的検証を除去し、構造的解釈可能性のギャップを生じさせる。
本稿では,AIM(AIM)フレームワークを受動的量子化プローブとして,V-JEPA2連続潜時ベクトルをタスク固有の監督やエンコーダの変更なしに離散シンボルシーケンスに変換する軽量なボキャブラリフリープローブとして提案する。
論文 参考訳(メタデータ) (2026-03-20T01:30:59Z) - Deepfake Detection with Multi-Artifact Subspace Fine-Tuning and Selective Layer Masking [11.158258169109907]
ディープフェイク検出は、クロスデータセットと現実世界の複雑なシナリオにおいて依然として重大な課題に直面している。
本稿では,多要素部分空間と選択層マスク(MASM)に基づくディープフェイク検出手法を提案する。
MASMは、アーティファクト表現から意味表現を明示的に分離し、アーティファクト部分空間の適合強度を制限する。
論文 参考訳(メタデータ) (2026-01-03T02:33:18Z) - Scaling Up AI-Generated Image Detection via Generator-Aware Prototypes [15.99138549265524]
GAPL(Generator-Aware Prototype Learning)は、構造化学習パラダイムで表現を制約するフレームワークである。
GAPLは最先端の性能を達成し、多様なGANおよび拡散型ジェネレータにおいて優れた検出精度を示す。
論文 参考訳(メタデータ) (2025-12-15T04:58:08Z) - When Semantics Regulate: Rethinking Patch Shuffle and Internal Bias for Generated Image Detection with CLIP [13.360123625878733]
CLIPベースの検出器は、しばしばジェネレータアーティファクトではなくセマンティックキューに依存しており、分散シフト時の不安定なパフォーマンスをもたらす。
Patch Shuffleは、グローバルなセマンティックな連続性を阻害するCLIPに対して、非常に強力なメリットを提供する。
本稿では,セマンティックサブ空間を凍結し,人工物に敏感な層のみを適応させるセマンティック・アンタゴニスティックな微調整パラダイムであるSemAntiを提案する。
論文 参考訳(メタデータ) (2025-11-24T13:54:00Z) - Beyond Binary Classification: A Semi-supervised Approach to Generalized AI-generated Image Detection [1.189955933770711]
現在の法医学における重大な脆弱性は、検出器がクロスジェネレータの一般化を達成できないことである。
本稿では,「フェイク」クラス内の潜在アーキテクチャパターンを発見することによって,バイナリ分類を強化する半教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2025-11-23T16:02:27Z) - Noise & pattern: identity-anchored Tikhonov regularization for robust structural anomaly detection [58.535473924035365]
異常検出は自動産業検査において重要な役割を担い、他の均一な視覚パターンの微妙な欠陥や稀な欠陥を識別することを目的としている。
自己教師型オートエンコーダを用いて, 破損した入力の修復を学習する構造的異常検出に取り組む。
構造欠陥を模倣した画像に人工的破壊を注入する汚職モデルを導入する。
論文 参考訳(メタデータ) (2025-11-10T15:48:50Z) - DVF: Advancing Robust and Accurate Fine-Grained Image Retrieval with Retrieval Guidelines [67.44394651662738]
細粒度画像検索(FGIR)は、一般化を維持しながら視覚的に類似した物体を識別する視覚表現を学習することである。
既存の方法は識別的特徴を生成することを提案するが、FGIRタスク自体の特異性を考えることは滅多にない。
本稿では, サブカテゴリ固有の不一致を識別し, 効果的なFGIRモデルを設計するための識別的特徴を生成するための実践的ガイドラインを提案する。
論文 参考訳(メタデータ) (2024-04-24T09:45:12Z) - Rethinking the Up-Sampling Operations in CNN-based Generative Network
for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。
tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。
この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文 参考訳(メタデータ) (2023-12-16T14:27:06Z) - Do Generative Models Know Disentanglement? Contrastive Learning is All
You Need [59.033559925639075]
本論文では,変数空間におけるコントラスト(DisCo)による非監視的,モデル非依存的手法を提案する。
DisCoは、GAN、VAE、およびフローを含む、事前訓練された非解離生成モデルに与えられた最先端の解離を達成します。
論文 参考訳(メタデータ) (2021-02-21T08:01:20Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。