論文の概要: Suppressing Forgery-Specific Shortcuts for Generalizable Deepfake Detection
- arxiv url: http://arxiv.org/abs/2606.01843v1
- Date: Mon, 01 Jun 2026 07:54:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.581082
- Title: Suppressing Forgery-Specific Shortcuts for Generalizable Deepfake Detection
- Title(参考訳): 一般化可能なディープフェイク検出のためのフォージェリ特有ショートカットの抑制
- Authors: Yihui Wang, Yonghui Yang, Jilong Liu, Fengbin Zhu, Le Wu, Tat-Seng Chua,
- Abstract要約: ディープフェイク検出は偽造法全体の一般化が不十分である。
近年のアプローチでは一般化の改善が試みられているが、そのようなショートカットを特定して抑制するための明確なメカニズムは欠如している。
本稿では,メソッド固有のショートカットを明示的に特徴付け,抑制するショートカットサブスペース抑圧(S3)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 59.056076147081775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deepfake detection suffers from poor generalization across forgery methods, as existing models tend to rely on spurious method-specific shortcuts that fail to transfer to unseen manipulations. While recent approaches attempt to improve generalization, they lack an explicit mechanism to identify and suppress such shortcuts in learned representations. In this work, we propose Shortcut Subspace Suppression (S^3) framework that explicitly characterizes and suppresses method-specific shortcuts via subspace modeling. Our key insight is that variations distinguishing different forgery methods capture method-specific artifacts and thus serve as an effective proxy for method-specific shortcuts. To this end, we train a lightweight linear probe for forgery method classification and perform Singular Value Decomposition (SVD) to extract the dominant shortcut subspace. Building on this formulation, we develop two complementary strategies to reduce shortcut reliance. During training, we softly suppress the shortcut subspace in feature representations, encouraging the model to rely on more generalizable cues for real/fake discrimination. At inference time, we introduce a training-free counterpart that attenuates neurons aligned with the identified shortcut directions, enabling plug-and-play generalization enhancement with improved interpretability. Extensive experiments on multiple benchmarks demonstrate that our method significantly improves cross-method generalization while maintaining strong in-domain performance. The code will be released upon acceptance of the submission.
- Abstract(参考訳): ディープフェイク検出は、偽造法全体の一般化が貧弱なため、既存のモデルは、目に見えない操作に転送できない、突発的なメソッド固有のショートカットに依存する傾向がある。
近年のアプローチでは一般化の改善が試みられているが、学習表現においてそのようなショートカットを識別し、抑制する明確なメカニズムが欠如している。
本研究では,サブスペースモデリングによるメソッド固有のショートカットを明示的に特徴付け,抑制するショートカットサブスペース抑圧(S^3)フレームワークを提案する。
我々の重要な洞察は、異なるフォージェリーメソッドを区別するバリエーションがメソッド固有のアーティファクトをキャプチャし、メソッド固有のショートカットの効果的なプロキシとして機能するということである。
この目的のために、偽メソッド分類のための軽量線形プローブを訓練し、Singular Value Decomposition (SVD)を実行し、支配的なショートカット部分空間を抽出する。
この定式化に基づいて、ショートカット依存を減らすための2つの相補的戦略を開発する。
トレーニング中、特徴表現におけるショートカット部分空間をソフトに抑制し、より一般化可能なキューをリアル/フェイク識別に頼るようにモデルに促す。
推論時に、特定したショートカット方向に沿ってニューロンを減衰させ、プラグ・アンド・プレイの一般化を改良し、解釈性を向上させる訓練自由な手法を導入する。
複数のベンチマーク実験により,本手法はドメイン内での強い性能を維持しつつ,クロスメソッドの一般化を著しく改善することを示した。
コードは提出の受理時に公開される。
関連論文リスト
- FakeRadar: Probing Forgery Outliers to Detect Unknown Deepfake Videos [56.782373316571444]
本稿では,新しいディープフェイクビデオ検出フレームワークであるFakeRadarを提案する。
FakeRadarは、現実世界のシナリオにおけるクロスドメインの一般化の課題に対処する。
論文 参考訳(メタデータ) (2025-12-16T17:11:45Z) - Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space [7.8904984750896885]
ディープニューラルネットワークはショートカットを学習しやすく、刺激的で容易に学習できる相関関係を持つ。
ショートカット信号に機能的に不変な分類器を簡易かつ効果的に描画する手法を提案する。
我々はこれを対象のヤコビ正規化として分析し、分類器は急激な特徴を無視し、より複雑なコアセマンティック信号に依存するように強制する。
論文 参考訳(メタデータ) (2025-11-24T07:09:08Z) - Anti-Collapse Loss for Deep Metric Learning Based on Coding Rate Metric [99.19559537966538]
DMLは、分類、クラスタリング、検索といった下流タスクのための識別可能な高次元埋め込み空間を学習することを目的としている。
埋め込み空間の構造を維持し,特徴の崩壊を避けるために,反崩壊損失と呼ばれる新しい損失関数を提案する。
ベンチマークデータセットの総合実験により,提案手法が既存の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-07-03T13:44:20Z) - Towards Faithful Explanations: Boosting Rationalization with Shortcuts Discovery [12.608345627859322]
本稿では,潜在的ショートカットの発見と活用により合理化を促進するショートカット融合選択合理化法を提案する。
具体的には、SSRはいくつかの潜在的なショートカットを検出するショートカット発見アプローチを最初に設計した。
そして,同定されたショートカットを導入することで,合理性を構成するためにショートカットを利用する問題を緩和する2つの戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T07:24:17Z) - Spurious Feature Eraser: Stabilizing Test-Time Adaptation for Vision-Language Foundation Model [86.9619638550683]
視覚言語基礎モデルは、画像とテキストのペアデータに拡張性があるため、多数の下流タスクで顕著な成功を収めている。
しかし、これらのモデルは、決定ショートカットの結果、きめ細かな画像分類などの下流タスクに適用した場合に重大な制限を呈する」。
論文 参考訳(メタデータ) (2024-03-01T09:01:53Z) - Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.646582245834324]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - Chroma-VAE: Mitigating Shortcut Learning with Generative Classifiers [44.97660597940641]
生成モデルだけではショートカット学習を防ぐには不十分であることを示す。
特にChroma-VAE(英語版)を提案する。これは、VAEが最初、小さな潜伏部分空間でショートカットを分離するために訓練される2段階のアプローチである。
ベンチマークや実世界のショートカット学習におけるクロマVAEの有効性の実証に加えて, 生成型分類器の潜時空間を操作して, 特定の相関関係を分離・解釈する可能性を強調した。
論文 参考訳(メタデータ) (2022-11-28T11:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。