論文の概要: Escaping the Linearity Trap: Manifold Detours for Black-Box Adversarial Attacks on Singing Audio Deepfake Detection
- arxiv url: http://arxiv.org/abs/2605.30366v1
- Date: Mon, 18 May 2026 03:43:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-07 20:42:22.501441
- Title: Escaping the Linearity Trap: Manifold Detours for Black-Box Adversarial Attacks on Singing Audio Deepfake Detection
- Title(参考訳): 音声ディープフェイク検出におけるブラックボックス対応攻撃のためのマニフォールドデチュール
- Authors: Yifan Liao, Yule Liu, Zhen Sun, Zongmin Zhang, Yupeng He, Jiaheng Wei, Xinhu Zheng, Xinlei He,
- Abstract要約: 歌声合成(SVS)の進歩は、非常に現実的で悪意のあるAIカバーを可能にする。
自己監督学習(SSL)ベースの検出器は、歌唱特有のスプーフアーティファクトをキャプチャするために、微調整された音声SSLバックボーンによって最先端のパフォーマンスを達成する。
既存の敵攻撃はSSL-SVDDに対してしばしば失敗し、本質的に堅牢であるという誤った印象を与える。
SSL-SVDDに適した転送ベースのブラックボックスフレームワークであるMARSを提案する。
- 参考スコア(独自算出の注目度): 15.084867267686567
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent Singing Voice Synthesis (SVS) advances enable highly realistic but potentially malicious AI covers, making singing voice deepfake detection (SVDD) crucial. Self-Supervised Learning (SSL)-based detectors achieve state-of-the-art performance by fine-tuning speech SSL backbones to capture singing-specific spoof artifacts. Existing adversarial attacks often fail against SSL-SVDD, creating a false impression of inherent robustness. We reveal this stems from two challenges. First, at the objective level, attacks optimize cross-entropy on local surrogates, crossing surrogate-specific boundaries rather than suppressing shared spoof evidence. Second, at the method level, attacks follow the surrogate's dominant gradient direction. In SSL-SVDD, this aligns with fine-tuned artifact-sensitive directions, limiting transferability to unseen detectors - a geometric failure we term the Linearity Trap. To properly evaluate robustness, we propose MARS (Meta-Adversarial Regression of Semantics), a transfer-based black-box framework tailored to SSL-SVDD. Structurally, MARS shifts to hypothesis-evidence manipulation by constructing a natural semantic anchor from the pre-trained SSL space and an artifact anchor from the fine-tuned space. Algorithmically, MARS escapes the Linearity Trap via bi-level optimization: the inner stage induces tangential exploration, while the outer stage guides the audio toward the natural semantic manifold. Experiments on the CtrSVDD benchmark show MARS improves Attack Success Rate (ASR) in in-distribution transfer (13%), out-of-distribution transfer (10%), and cross-task evaluation (36%), highlighting the urgent need for robust SVDD systems.
- Abstract(参考訳): 最近の歌声合成(SVS)の進歩は、非常に現実的で悪意のあるAIカバーを可能にし、歌声のディープフェイク検出(SVDD)を重要視している。
自己監督学習(SSL)ベースの検出器は、歌唱特有のスプーフアーティファクトをキャプチャするために、微調整された音声SSLバックボーンによって最先端のパフォーマンスを達成する。
既存の敵攻撃はSSL-SVDDに対してしばしば失敗し、本質的に堅牢であるという誤った印象を与える。
これには2つの課題がある。
第一に、目的レベルでは、アタックは、共有されたスプーフ証拠を抑えるのではなく、ローカルなサロゲート上のクロスエントロピーを最適化し、サロゲート固有の境界を越える。
第2に、メソッドレベルでは、攻撃はサロゲートの支配的な勾配方向に従う。
SSL-SVDDでは、これは微調整された人工物に敏感な方向に対応し、見えない検出器への転送可能性を制限する。
そこで我々は,SSL-SVDDに適した転送ベースのブラックボックスフレームワークであるMARS(Meta-Adversarial Regression of Semantics)を提案する。
構造的には、MARSは、事前訓練されたSSL空間から自然なセマンティックアンカーを構築し、微調整された空間からアーティファクトアンカーを構築することによって、仮説のエビデンス操作に移行する。
アルゴリズム的には、MARSは2段階の最適化により線形性トラップを逃れ、内側のステージは接的な探索を誘導し、外側のステージは音声を自然な意味多様体へと導く。
CtrSVDDベンチマークの実験では、MARSは分散転送(13%)、分散転送(10%)、クロスタスク評価(36%)においてアタック成功率(ASR)を改善し、堅牢なSVDDシステムの必要性を強調している。
関連論文リスト
- Beyond Waveform Robustness: Robust Feature-Vocoder Adversarial Attacks on Automatic Speech Recognition [9.839293944956006]
既存の敵対的攻撃は、直接音声に敵対的ノイズを付加する。
クリーン・レファレンス・フィーチャー・ヴォコーダ・アタックは、敵の探索空間を原波形から自己教師付き学習表現へ移動させる。
実験により,Whisper-smallのみを公共代理モデルとして最適化した場合,攻撃はブラックボックスASRモデルに効果的に伝達されることが示された。
論文 参考訳(メタデータ) (2026-06-04T04:00:48Z) - TwinGate: Stateful Defense against Decompositional Jailbreaks in Untraceable Traffic via Asymmetric Contrastive Learning [60.68349524623048]
分解されたジェイルブレイクは、大きな言語モデルにとって重大な脅威となる。
我々はステートフルなデュアルエンコーダ防御フレームワークであるTwinGateを紹介する。
我々は、8600の異なる悪意のある意図にまたがる360万以上の命令の包括的なデータセットを構築した。
論文 参考訳(メタデータ) (2026-04-30T13:44:01Z) - Zero-Sacrifice Persistent-Robustness Adversarial Defense for Pre-Trained Encoders [5.00483763729881]
ZePAD(Zero-Sacrifice Persistent-Robustness Adversarial Defense)を紹介する。
ZePADは、データ特性に対するニューラルネットワーク固有の感度にインスパイアされている。
敵の抵抗を強化するために2つの敵の微調整エンコーダを使用する。
論文 参考訳(メタデータ) (2026-02-10T07:41:34Z) - Enhancing Adversarial Transferability by Balancing Exploration and Exploitation with Gradient-Guided Sampling [82.52485740425321]
アドリアックは、ディープニューラルネットワークの堅牢性にとって重要な課題である。
敵攻撃の伝達性は、爆発(最大攻撃能力)と探索(クロスモデル一般化の促進)のジレンマに直面している
論文 参考訳(メタデータ) (2025-11-01T05:43:47Z) - Semantic Concentration for Self-Supervised Dense Representations Learning [103.10708947415092]
イメージレベルの自己教師型学習(SSL)は大きな進歩を遂げているが、パッチの密度の高い表現を学ぶことは依然として難しい。
この研究は、画像レベルのSSLが暗黙のセマンティックな集中を伴って過分散を避けることを明らかにしている。
論文 参考訳(メタデータ) (2025-09-11T13:12:10Z) - TRACEALIGN -- Tracing the Drift: Attributing Alignment Failures to Training-Time Belief Sources in LLMs [7.125400292079228]
大きな言語モデル(LLM)は、人間の値に合わせるように微調整され、しばしばアライメントドリフトを示す。
以前の作業ではアライメント障害が特徴的だったが、これらの障害の根底にあるトレーニングタイムの信念源についてはほとんど知られていない。
TraceAlignは、モデルのトレーニングコーパスの根本原因に安全でない完了をトレースするための統一されたフレームワークである。
論文 参考訳(メタデータ) (2025-08-04T05:03:35Z) - SRD: Reinforcement-Learned Semantic Perturbation for Backdoor Defense in VLMs [57.880467106470775]
攻撃者は、トレーニングデータに知覚不能な摂動を注入することができ、モデルが悪意のある攻撃的制御されたキャプションを生成する。
本稿では,引き金の事前知識を伴わずにバックドア動作を緩和する強化学習フレームワークであるセマンティック・リワード・ディフェンス(SRD)を提案する。
SRDはDeep Q-Networkを使用して、機密画像領域に個別の摂動を適用するためのポリシーを学習し、悪意ある経路の活性化を妨害することを目的としている。
論文 参考訳(メタデータ) (2025-06-05T08:22:24Z) - Modeling Adversarial Attack on Pre-trained Language Models as Sequential
Decision Making [10.425483543802846]
敵攻撃タスクは、事前訓練された言語モデル(PLM)が小さな摂動に弱いことを発見した。
本稿では, PLM に対する逆攻撃タスクを逐次決定問題としてモデル化する。
そこで本稿では,SDM-Attack と呼ばれる敵を発生させる適切な逐次攻撃経路を見つけるための強化学習を提案する。
論文 参考訳(メタデータ) (2023-05-27T10:33:53Z) - Improving the Adversarial Robustness for Speaker Verification by Self-Supervised Learning [95.60856995067083]
この研究は、特定の攻撃アルゴリズムを知らずにASVの敵防衛を行う最初の試みの一つである。
本研究の目的は,1) 対向摂動浄化と2) 対向摂動検出の2つの視点から対向防御を行うことである。
実験の結果, 検出モジュールは, 約80%の精度で対向検体を検出することにより, ASVを効果的に遮蔽することがわかった。
論文 参考訳(メタデータ) (2021-06-01T07:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。