論文の概要: Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection
- arxiv url: http://arxiv.org/abs/2311.11278v2
- Date: Thu, 28 Mar 2024 17:25:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-29 21:33:29.753196
- Title: Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection
- Title(参考訳): 一般化可能なディープフェイク検出のための潜時空間拡張による超越フォージェリー特異性
- Authors: Zhiyuan Yan, Yuhao Luo, Siwei Lyu, Qingshan Liu, Baoyuan Wu,
- Abstract要約: LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
- 参考スコア(独自算出の注目度): 57.646582245834324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deepfake detection faces a critical generalization hurdle, with performance deteriorating when there is a mismatch between the distributions of training and testing data. A broadly received explanation is the tendency of these detectors to be overfitted to forgery-specific artifacts, rather than learning features that are widely applicable across various forgeries. To address this issue, we propose a simple yet effective detector called LSDA (\underline{L}atent \underline{S}pace \underline{D}ata \underline{A}ugmentation), which is based on a heuristic idea: representations with a wider variety of forgeries should be able to learn a more generalizable decision boundary, thereby mitigating the overfitting of method-specific features (see Fig.~\ref{fig:toy}). Following this idea, we propose to enlarge the forgery space by constructing and simulating variations within and across forgery features in the latent space. This approach encompasses the acquisition of enriched, domain-specific features and the facilitation of smoother transitions between different forgery types, effectively bridging domain gaps. Our approach culminates in refining a binary classifier that leverages the distilled knowledge from the enhanced features, striving for a generalizable deepfake detector. Comprehensive experiments show that our proposed method is surprisingly effective and transcends state-of-the-art detectors across several widely used benchmarks.
- Abstract(参考訳): Deepfake検出は、トレーニングとテストデータの分布にミスマッチがある場合のパフォーマンスが低下する、重要な一般化ハードルに直面している。
広く受け入れられた説明は、これらの検出器は様々な偽造品に広く適用される特徴を学習するよりも、偽造特有の人工物に過度に適合する傾向にある。
この問題に対処するために、我々はLSDA (\underline{L}atent \underline{S}pace \underline{D}ata \underline{A}ugmentation) と呼ばれる単純で効果的な検出器を提案する。
このアイデアに従えば、潜在空間における偽空間内および偽空間間のバリエーションを構築し、シミュレーションすることにより、偽空間を拡大することを提案する。
このアプローチは、リッチでドメイン固有の特徴の獲得と、異なるフォージェリータイプ間のスムーズな移行の促進を含み、ドメインギャップを効果的に埋める。
提案手法は, 改良された特徴から蒸留された知識を生かし, 一般化可能なディープフェイク検出器の開発に有効である。
包括的実験により,提案手法は驚くほど有効であり,多くの広く使用されているベンチマークで最先端の検出器を超越していることがわかった。
関連論文リスト
- Leveraging Mixture of Experts for Improved Speech Deepfake Detection [53.69740463004446]
スピーチのディープフェイクは、個人のセキュリティとコンテンツの信頼性に重大な脅威をもたらす。
本研究では,Mixture of Expertsアーキテクチャを用いた音声深度検出性能の向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-24T13:24:03Z) - ED$^4$: Explicit Data-level Debiasing for Deepfake Detection [24.695989108814018]
限られたデータから固有のバイアスを学習することは、一般化可能なディープフェイク検出の失敗の主な原因と考えられている。
データレベルで上記のバイアスに明示的に対処するためのシンプルで効果的な戦略であるED$4$を提示します。
我々は,既存のディープフェイク検出手法よりも有効性と優位性を示すため,広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-08-13T10:05:20Z) - COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文 参考訳(メタデータ) (2023-08-03T03:37:13Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Controllable Guide-Space for Generalizable Face Forgery Detection [0.6445605125467573]
本稿では,異なる偽ドメインの識別を強化するための制御可能なガイド空間(GS)手法を提案する。
十分に設計されたガイド空間は、偽ドメインの適切な分離と、実際の偽ドメイン間の大きな距離の両方を同時に達成することができる。
論文 参考訳(メタデータ) (2023-07-26T08:43:12Z) - UCF: Uncovering Common Features for Generalizable Deepfake Detection [44.12640679000489]
ディープフェイク検出は、新しい種類の偽造を一般化することが困難であるため、依然として難しい課題である。
本稿では,2種類のオーバーフィッティング問題に共通する偽造特徴を明らかにすることによって対処する新しい手法を提案する。
我々のフレームワークは現在の最先端手法よりも優れた一般化を行うことができる。
論文 参考訳(メタデータ) (2023-04-27T04:07:29Z) - MC-LCR: Multi-modal contrastive classification by locally correlated
representations for effective face forgery detection [11.124150983521158]
局所的関連表現を用いたマルチモーダルコントラスト分類法を提案する。
我々のMC-LCRは、空間領域と周波数領域の両方から真偽顔と偽顔の暗黙の局所的不一致を増幅することを目的としている。
我々は最先端の性能を達成し,本手法の堅牢性と一般化を実証する。
論文 参考訳(メタデータ) (2021-10-07T09:24:12Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。