論文の概要: Toward Noise-Aware Audio Deepfake Detection: Survey, SNR-Benchmarks, and Practical Recipes
- arxiv url: http://arxiv.org/abs/2512.13744v1
- Date: Mon, 15 Dec 2025 02:22:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.418279
- Title: Toward Noise-Aware Audio Deepfake Detection: Survey, SNR-Benchmarks, and Practical Recipes
- Title(参考訳): ノイズ対応オーディオディープフェイク検出に向けて:サーベイ, SNRベンチマーク, 実践的レシピ
- Authors: Udayon Sen, Alka Luqman, Anupam Chattopadhyay,
- Abstract要約: 本稿では,MS-SNSD雑音とASVspoof 2021 DF発話を混合し,信号対雑音比(SNR)で評価するフレームワークを提案する。
We study multi-condition training and fixed-SNR testing for pretrained encoder (WavLM, Wav2Vec2, MMS), reporting accuracy, ROC-AUC, and EER on binary and four-class (authenticity x corruption) task。
- 参考スコア(独自算出の注目度): 2.5756681494057045
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deepfake audio detection has progressed rapidly with strong pre-trained encoders (e.g., WavLM, Wav2Vec2, MMS). However, performance in realistic capture conditions - background noise (domestic/office/transport), room reverberation, and consumer channels - often lags clean-lab results. We survey and evaluate robustness for state-of-the-art audio deepfake detection models and present a reproducible framework that mixes MS-SNSD noises with ASVspoof 2021 DF utterances to evaluate under controlled signal-to-noise ratios (SNRs). SNR is a measured proxy for noise severity used widely in speech; it lets us sweep from near-clean (35 dB) to very noisy (-5 dB) to quantify graceful degradation. We study multi-condition training and fixed-SNR testing for pretrained encoders (WavLM, Wav2Vec2, MMS), reporting accuracy, ROC-AUC, and EER on binary and four-class (authenticity x corruption) tasks. In our experiments, finetuning reduces EER by 10-15 percentage points at 10-0 dB SNR across backbones.
- Abstract(参考訳): ディープフェイク音声検出は、強力な事前訓練エンコーダ(例えば、WavLM、Wav2Vec2、MMS)で急速に進歩している。
しかし、現実的なキャプチャ環境でのパフォーマンス - バックグラウンドノイズ(家庭内/オフィス/トランスポート)、部屋の残響、消費者チャネル - は、しばしばクリーンラブの結果に遅れる。
我々は、最先端オーディオディープフェイク検出モデルのロバスト性を調査、評価し、MS-SNSDノイズとASVspoof 2021 DF発話を混合し、制御信号対雑音比(SNR)で評価する再現可能なフレームワークを提案する。
SNRは、音声で広く使用されるノイズの重大度の測定プロキシであり、ほぼクリーン(35dB)から非常にノイズ(5dB)まで、優雅な劣化の定量化を可能にします。
We study multi-condition training and fixed-SNR testing for pretrained encoder (WavLM, Wav2Vec2, MMS), reporting accuracy, ROC-AUC, and EER on binary and four-class (authenticity x corruption) task。
実験では, 背骨間の10~0dB SNRにおいて, EERを10~15ポイント削減した。
関連論文リスト
- How Does Label Noise Gradient Descent Improve Generalization in the Low SNR Regime? [78.0226274470175]
我々は、勾配更新にラベルノイズを導入することで、ニューラルネットワーク(NN)のテスト性能が向上するかどうか検討する。
学習中のラベルノイズの付加は,学習過程を支配することを防止し,雑音の記憶を抑制することを実証する。
対照的に、標準GDで訓練されたNNは、同じ低SNR環境でのノイズに過度に適応する傾向にある。
論文 参考訳(メタデータ) (2025-10-20T13:28:13Z) - Machine Unlearning for Robust DNNs: Attribution-Guided Partitioning and Neuron Pruning in Noisy Environments [5.8166742412657895]
ディープニューラルネットワーク(DNN)は、さまざまなドメインで顕著な成功を収めているが、ノイズやトレーニングデータによってそのパフォーマンスが著しく低下する可能性がある。
本稿では,帰属誘導型データパーティショニング,識別的ニューロンプルーニング,およびノイズのあるサンプルの影響を軽減するための微調整を目的とした新しいフレームワークを提案する。
CIFAR-10の標準リトレーニングよりも約10%の絶対精度向上を実現し,ラベルノイズを注入した。
論文 参考訳(メタデータ) (2025-06-13T09:37:11Z) - Noisy Test-Time Adaptation in Vision-Language Models [73.14136220844156]
テスト時間適応(TTA)は、テスト中のターゲットデータのみに依存することにより、ソースデータとターゲットデータの分散シフトに対処することを目的としている。
本稿では、ゼロショット方式で、テスト時にノイズのあるサンプルをターゲットとするデータにモデルを適応させることに焦点を当てたゼロショットノイズTTA(ZS-NTTA)を提案する。
本稿では, 冷凍機の出力を擬似ラベルとして利用し, ノイズ検出器の訓練を行う適応ノイズ検出器(AdaND)を提案する。
論文 参考訳(メタデータ) (2025-02-20T14:37:53Z) - DAS-N2N: Machine learning Distributed Acoustic Sensing (DAS) signal
denoising without clean data [0.0]
本稿では、分散音響センサ(DAS)記録における強いランダムノイズを抑制するために、DAS-N2Nと呼ぶ弱い教師付き機械学習手法を提案する。
本研究では,DAS-N2Nが不整合性雑音を著しく抑制し,自然微小地震発生時の信号-雑音比(SNR)を増大させることを示す。
論文 参考訳(メタデータ) (2023-04-17T09:58:52Z) - Improving Noise Robustness of Contrastive Speech Representation Learning
with Speech Reconstruction [109.44933866397123]
実環境における音声認識システムの実現には,雑音の堅牢性が不可欠である。
雑音認識のための自己教師型フレームワークにより学習したノイズロスト表現を用いる。
ラベル付きデータのわずか16%で報告された最高の教師付きアプローチに匹敵するパフォーマンスを実現した。
論文 参考訳(メタデータ) (2021-10-28T20:39:02Z) - Learning based signal detection for MIMO systems with unknown noise
statistics [84.02122699723536]
本論文では,未知のノイズ統計による信号を堅牢に検出する一般化最大確率(ML)推定器を考案する。
実際には、システムノイズに関する統計的な知識はほとんどなく、場合によっては非ガウス的であり、衝動的であり、分析不可能である。
我々のフレームワークは、ノイズサンプルのみを必要とする教師なしの学習アプローチによって駆動される。
論文 参考訳(メタデータ) (2021-01-21T04:48:15Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - Efficient Training of Deep Classifiers for Wireless Source
Identification using Test SNR Estimates [4.44483539967295]
本研究では,SNR(Test Signal to Noise Ratio)推定値が利用可能であれば,無線信号を処理する効率的なディープラーニング学習アルゴリズムについて検討する。
ベンチマークでは、よく知られた2つのデータセットに対するディープラーニングアルゴリズムのテストに、最近の文献に依存しています。
正のオフセットが小さい誤ったテストSNR推定は、負のオフセットを持つ同じ誤差のマグニチュードを持つものよりも訓練に適している。
論文 参考訳(メタデータ) (2019-12-26T16:49:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。