論文の概要: Generalizable Speech Deepfake Detection via Information Bottleneck Enhanced Adversarial Alignment
- arxiv url: http://arxiv.org/abs/2509.23618v1
- Date: Sun, 28 Sep 2025 03:48:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.33149
- Title: Generalizable Speech Deepfake Detection via Information Bottleneck Enhanced Adversarial Alignment
- Title(参考訳): インフォメーション・ボトルネック強化逆アライメントによる一般化可能な音声ディープフェイク検出
- Authors: Pu Huang, Shouguang Wang, Siya Yao, Mengchu Zhou,
- Abstract要約: 信頼誘導対向アライメントは、識別的手がかりを消去することなく攻撃固有のアーティファクトを適応的に抑制する。
IB-CAANは、多くのベンチマークにおいて、ベースラインと最先端のパフォーマンスを一貫して上回る。
- 参考スコア(独自算出の注目度): 48.73836179661632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural speech synthesis techniques have enabled highly realistic speech deepfakes, posing major security risks. Speech deepfake detection is challenging due to distribution shifts across spoofing methods and variability in speakers, channels, and recording conditions. We explore learning shared discriminative features as a path to robust detection and propose Information Bottleneck enhanced Confidence-Aware Adversarial Network (IB-CAAN). Confidence-guided adversarial alignment adaptively suppresses attack-specific artifacts without erasing discriminative cues, while the information bottleneck removes nuisance variability to preserve transferable features. Experiments on ASVspoof 2019/2021, ASVspoof 5, and In-the-Wild demonstrate that IB-CAAN consistently outperforms baseline and achieves state-of-the-art performance on many benchmarks.
- Abstract(参考訳): ニューラル音声合成技術は、非常にリアルな音声ディープフェイクを可能にし、大きなセキュリティリスクを生じさせている。
音声のディープフェイク検出は、スプーフィング方式の分散シフトと、話者、チャンネル、記録条件の変動により困難である。
我々は,堅牢な検出の道として,共有識別特徴の学習について検討し,情報ボタネック強化信頼度対応ネットワーク (IB-CAAN) を提案する。
信頼誘導対向アライメントは、識別的手がかりを消去することなく、攻撃固有のアーティファクトを適応的に抑制する一方、情報ボトルネックは、伝達可能な特徴を保持するためのニュアンス変数を除去する。
ASVspoof 2019/2021、ASVspoof 5、In-the-Wildの実験は、IB-CAANがベースラインを一貫して上回り、多くのベンチマークで最先端のパフォーマンスを達成することを示した。
関連論文リスト
- Diversity Boosts AI-Generated Text Detection [51.56484100374058]
DivEyeは、予備的な機能を使って、予測不可能がテキスト間でどのように変動するかをキャプチャする、新しいフレームワークである。
提案手法は、既存のゼロショット検出器を最大33.2%向上させ、微調整ベースラインとの競合性能を達成する。
論文 参考訳(メタデータ) (2025-09-23T10:21:22Z) - AuthGuard: Generalizable Deepfake Detection via Language Guidance [39.18916434250689]
既存のディープフェイク検出技術は、進化し続ける新しい、目に見えない偽造手法に追いつくのに苦労している。
言語指導を取り入れることで、ディープフェイク検出の一般化を改善することができる。
我々は、識別的分類と画像テキストのコントラスト学習を組み合わせることで、専門的なディープフェイク視覚エンコーダを訓練する。
論文 参考訳(メタデータ) (2025-06-04T22:50:07Z) - FADEL: Uncertainty-aware Fake Audio Detection with Evidential Deep Learning [9.960675988638805]
顕在学習を用いた偽音声検出(FADEL)という新しいフレームワークを提案する。
FADELはモデルの不確実性を予測に組み込んでおり、OODシナリオではより堅牢なパフォーマンスを実現している。
本研究では,異なるスプーフィングアルゴリズム間の平均不確かさと等誤差率(EER)の強い相関関係を解析し,不確かさ推定の有効性を示す。
論文 参考訳(メタデータ) (2025-04-22T07:40:35Z) - A Knowledge-guided Adversarial Defense for Resisting Malicious Visual Manipulation [93.28532038721816]
視覚的操作の悪意ある応用は、多くの分野でユーザーのセキュリティと評判に深刻な脅威をもたらしている。
本稿では,悪質な操作モデルを積極的に強制し,意味論的に混乱したサンプルを出力するために,知識誘導型敵防衛(KGAD)を提案する。
論文 参考訳(メタデータ) (2025-04-11T10:18:13Z) - AdvSwap: Covert Adversarial Perturbation with High Frequency Info-swapping for Autonomous Driving Perception [14.326474757036925]
本稿では,ウェーブレットベースの高周波情報交換を創造的に活用する,新たな逆攻撃手法AdvSwapを提案する。
このスキームは、オリジナルラベルデータを効果的に除去し、ガイダンス画像データを取り込んで、隠蔽された堅牢な対向サンプルを生成する。
生成する敵のサンプルは、人間やアルゴリズムによっても知覚が難しい。
論文 参考訳(メタデータ) (2025-02-12T13:05:35Z) - Toward Improving Synthetic Audio Spoofing Detection Robustness via Meta-Learning and Disentangled Training With Adversarial Examples [33.445126880876415]
自動話者検証システムに到達させる代わりに、スプーフ攻撃をフィルタリングする信頼性と堅牢なスプーフ検出システムを提案する。
データ不均衡問題に対処するために重み付き加法的角縁損失が提案され、スプーフィング攻撃に対する一般化を改善するために異なるマージンが割り当てられている。
データ拡張戦略として、スプーフィング音声に知覚不能な摂動を加えて、敵の例にのみ対応する正規化統計が実行されることを保証するために、補助的なバッチ正規化を用いる。
論文 参考訳(メタデータ) (2024-08-23T19:26:54Z) - NPVForensics: Jointing Non-critical Phonemes and Visemes for Deepfake
Detection [50.33525966541906]
既存のマルチモーダル検出手法は、Deepfakeビデオを公開するために、音声と視覚の不整合をキャプチャする。
NPVForensics と呼ばれる非臨界音素とビセムの相関関係を抽出する新しいディープフェイク検出法を提案する。
我々のモデルは、微調整で下流のDeepfakeデータセットに容易に適応できる。
論文 参考訳(メタデータ) (2023-06-12T06:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。