論文の概要: Need We Teach Foundation Models What is a Generative Image? Gradient-Free Generative Artifact Detection via Analytic Spectral Adaptation
- arxiv url: http://arxiv.org/abs/2606.07660v1
- Date: Wed, 03 Jun 2026 13:04:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.202713
- Title: Need We Teach Foundation Models What is a Generative Image? Gradient-Free Generative Artifact Detection via Analytic Spectral Adaptation
- Title(参考訳): ファウンデーションモデルを教える必要がある 生成画像とは何か? 分析スペクトル適応によるグラディエントフリー生成アーティファクト検出
- Authors: Qiaoyu Chen, Bing Zhang,
- Abstract要約: 勾配ベースの更新による生成成果物の検出に基礎モデルを適用することで、本質的な表現が損なわれる。
本稿では,二分分類から外分布(OOD)異常測定問題への検出を緩和する勾配のない手法を提案する。
- 参考スコア(独自算出の注目度): 3.881211374324378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adapting foundation models to detect generative artifacts via gradient-based updates compromises their intrinsic representations. Under optimization on limited samples, models overfit to local domain shortcuts. Fine-tuning massive weights on specialized data introduces erroneous inductive biases, inducing a measurable $\mathcal{L}_2$ norm perturbation in the high-dimensional feature space -- a phenomenon we formalize as anchor drift. Amplified by nonlinear activations, this drift impairs zero-shot forgery detection across unseen domains.We propose a gradient-free methodology reframing detection from binary classification to an out-of-distribution (OOD) anomaly measurement problem. Treating a frozen foundation model as a stable coordinate system, we establish an absolute natural anchor on the real visual manifold by analytically decoupling statistical and semantic deviations, derived from attention-weighted spatial moments and orthogonal projection of perceptual inconsistencies. Evaluated in an extreme zero-shot setting (trained on face forgeries, tested on universal Text-to-Image generations), our method significantly outperforms gradient-optimized paradigms. Backpropagation-free forward passes and linear solvers enable hardware-agnostic, edge-deployable calibration with minimal latency. Furthermore, the Sherman-Morrison formula unlocks instantaneous online learning against novel attacks and enables privacy-preserving federated collaboration via covariance delta transmission.
- Abstract(参考訳): 勾配ベースの更新による生成成果物の検出に基礎モデルを適用することで、本質的な表現が損なわれる。
限られたサンプルの最適化では、モデルはローカルドメインのショートカットに過度に適合する。
特殊データに対する微調整の大きな重みは誤った帰納バイアスをもたらし、高次元の特徴空間における測定可能な$\mathcal{L}_2$ノルム摂動を誘導する。
非線形アクティベーションによって増幅されたこのドリフトは、未確認領域間のゼロショットフォージェリ検出を阻害し、二分法分類からアウト・オブ・ディストリビューション(OOD)異常測定問題への検出を緩和する勾配のない手法を提案する。
凍結基礎モデルを安定座標系として扱うことにより,注意重み付き空間モーメントと直交的な知覚的不整合の予測から,統計的および意味的偏差を解析的に分離することにより,実視覚多様体に絶対的な自然なアンカーを確立する。
極端ゼロショット設定(顔の偽造で訓練され、普遍的なテキスト・ツー・イメージ世代でテストされる)で評価し、勾配最適化パラダイムを著しく上回っている。
バックプロパゲーションフリーのフォワードパスとリニアソルバは、最小レイテンシでハードウェアに依存しないエッジデプロイ可能なキャリブレーションを可能にする。
さらに、シャーマン・モリソンの公式は、新しい攻撃に対する即時オンライン学習を解放し、共分散デルタ送信によるプライバシー保護された連携を可能にする。
関連論文リスト
- Rate-optimal neural boundary detection from unlabeled noisy images [1.8620637029128548]
統計的観点からラベル付き雑音画像の境界検出について検討した。
頑健なギブスの後部アプローチにより, 境界検出のための連続的なヒンジ型サロゲート損失を提案する。
提案した損失は勾配に基づく最適化に有効であり、複雑なオブジェクト境界を表現するためにディープニューラルネットワークと組み合わせることができる。
論文 参考訳(メタデータ) (2026-05-30T12:58:09Z) - GroundingAnomaly: Spatially-Grounded Diffusion for Few-Shot Anomaly Synthesis [16.74245445257004]
我々は,新しい数発の異常画像生成フレームワークであるGroundingAnomalyを提案する。
本フレームワークでは,画素ごとのセマンティックマップを活用する空間条件モジュールを導入している。
Gated Self-Attention Moduleは、凍結したU-Netに条件付きトークンを注入するように設計されている。
論文 参考訳(メタデータ) (2026-04-09T14:34:50Z) - DNA: Uncovering Universal Latent Forgery Knowledge [39.19379714306656]
フォージェリ検出機能は、すでにトレーニング済みのモデル内にエンコードされている。
DNAフレームワークは粗大な発掘機構を採用している。
Hifi-Genは、最新のモデルの上に構築された高忠実度合成ベンチマークである。
論文 参考訳(メタデータ) (2026-01-30T03:48:30Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - One-for-More: Continual Diffusion Model for Anomaly Detection [63.50488826645681]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。
われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。
本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-02-27T07:47:27Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。