論文の概要: Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio
Detection
- arxiv url: http://arxiv.org/abs/2308.03300v1
- Date: Mon, 7 Aug 2023 05:05:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 15:12:45.813427
- Title: Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio
Detection
- Title(参考訳): 覚えてますか?
フェイクオーディオ検出のためのカタストロフィック・フォーミングの克服
- Authors: Xiaohui Zhang, Jiangyan Yi, Jianhua Tao, Chenglong Wang, Chuyuan Zhang
- Abstract要約: 本稿では,破滅的な忘れを克服するために,偽音声検出のための連続学習アルゴリズムを提案する。
検出ネットワークを微調整する場合,本手法では,真の発話と偽発話の比率に応じて,重み付けの方向を適応的に計算する。
本手法は,音声の感情認識などの関連分野に容易に一般化できる。
- 参考スコア(独自算出の注目度): 54.20974251478516
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current fake audio detection algorithms have achieved promising performances
on most datasets. However, their performance may be significantly degraded when
dealing with audio of a different dataset. The orthogonal weight modification
to overcome catastrophic forgetting does not consider the similarity of genuine
audio across different datasets. To overcome this limitation, we propose a
continual learning algorithm for fake audio detection to overcome catastrophic
forgetting, called Regularized Adaptive Weight Modification (RAWM). When
fine-tuning a detection network, our approach adaptively computes the direction
of weight modification according to the ratio of genuine utterances and fake
utterances. The adaptive modification direction ensures the network can
effectively detect fake audio on the new dataset while preserving its knowledge
of old model, thus mitigating catastrophic forgetting. In addition, genuine
audio collected from quite different acoustic conditions may skew their feature
distribution, so we introduce a regularization constraint to force the network
to remember the old distribution in this regard. Our method can easily be
generalized to related fields, like speech emotion recognition. We also
evaluate our approach across multiple datasets and obtain a significant
performance improvement on cross-dataset experiments.
- Abstract(参考訳): 現在の偽音声検出アルゴリズムは、ほとんどのデータセットで有望なパフォーマンスを達成した。
しかし、異なるデータセットのオーディオを扱う場合、パフォーマンスは著しく低下する可能性がある。
破滅的な忘れを克服するための直交重み修正は、異なるデータセット間の真のオーディオの類似性を考慮していない。
この制限を克服するために、正規化適応重み修正(RAWM)と呼ばれる破滅的な忘れを克服するために、偽音声検出のための連続学習アルゴリズムを提案する。
検出ネットワークを微調整する場合,本手法は実発話と偽発話の比率に応じて重み付け方向を適応的に計算する。
適応的な修正方向により、ネットワークは古いモデルの知識を維持しながら、新しいデータセット上の偽の音声を効果的に検出し、破滅的な忘れを軽減できる。
また,異なる音響条件から収集した純音声は,その特徴分布に歪む可能性があるため,この点において,ネットワークに古い分布を記憶させるような正規化制約を導入する。
本手法は,音声の感情認識などの関連分野に容易に一般化できる。
また,複数のデータセットにまたがるアプローチを評価し,クロスデータセット実験において有意な性能改善を得た。
関連論文リスト
- Statistics-aware Audio-visual Deepfake Detector [11.671275975119089]
オーディオ・ヴィジュアルフェイク検出の手法は、主に音声と視覚の特徴の同期を評価する。
モデルの識別能力を高めるため,統計的特徴損失を提案する。
DFDCおよびFakeAVCelebデータセットの実験により,提案手法の妥当性が示された。
論文 参考訳(メタデータ) (2024-07-16T12:15:41Z) - Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models [52.04189118767758]
一般化は、現在のオーディオディープフェイク検出器の主な問題である。
本稿では,オーディオディープフェイク検出のための大規模事前学習モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-05-03T15:27:11Z) - What to Remember: Self-Adaptive Continual Learning for Audio Deepfake
Detection [53.063161380423715]
既存の検出モデルは、既知のディープフェイク音声を識別することに成功したが、新しい攻撃タイプに遭遇する際には苦労している。
本稿では,Radian Weight Modification (RWM) と呼ばれる連続的な学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:52:17Z) - Adaptive Fake Audio Detection with Low-Rank Model Squeezing [50.7916414913962]
ファインタニングのような従来の手法は計算集約的であり、既知の偽音声タイプの知識を損なう危険性がある。
本稿では,新たに登場したニセモノ音声タイプに特化して,低ランク適応行列をトレーニングするコンセプトを紹介する。
当社のアプローチには,ストレージメモリ要件の削減やエラー率の低下など,いくつかのメリットがあります。
論文 参考訳(メタデータ) (2023-06-08T06:06:42Z) - Improved DeepFake Detection Using Whisper Features [2.846767128062884]
DF検出フロントエンドとしてのWhisper自動音声認識モデルの影響について検討する。
本稿では,Whisperベースの機能を用いることで,各モデルの検出精度が向上し,Equal Error Rateを21%削減することで,In-The-Wildデータセットの最近の結果を上回っていることを示す。
論文 参考訳(メタデータ) (2023-06-02T10:34:05Z) - Anomalous Sound Detection using Audio Representation with Machine ID
based Contrastive Learning Pretraining [52.191658157204856]
コントラスト学習を用いて、各音声サンプルではなく、各機械IDの音声表現を洗練する。
提案手法では、コントラスト学習を用いて音声表現モデルを事前学習する。
実験の結果,本手法はコントラスト学習や自己教師型分類を用いて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-07T11:08:31Z) - Automatic Change-Point Detection in Time Series via Deep Learning [8.43086628139493]
ニューラルネットワークのトレーニングに基づいて,新しいオフライン検出手法を自動生成する方法を示す。
本稿では,そのような手法の誤差率を定量化する理論について述べる。
また,加速度計データに基づく活動変化の検出と位置推定にも強い効果が得られた。
論文 参考訳(メタデータ) (2022-11-07T20:59:14Z) - TASK3 DCASE2021 Challenge: Sound event localization and detection using
squeeze-excitation residual CNNs [4.4973334555746]
この調査は、昨年同じチームが実施した調査に基づいています。
この手法がそれぞれのデータセットをどのように改善するかを研究することが決定された。
この修正は,MICデータセットを用いたベースラインと比較して,システム性能の向上を示す。
論文 参考訳(メタデータ) (2021-07-30T11:34:15Z) - Continual Learning for Fake Audio Detection [62.54860236190694]
本論文では,連続学習に基づく手法である忘れずに偽物を検出することで,モデルに新たなスプーフィング攻撃をインクリメンタルに学習させる手法を提案する。
ASVspoof 2019データセットで実験が行われる。
論文 参考訳(メタデータ) (2021-04-15T07:57:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。