論文の概要: a-DCF: an architecture agnostic metric with application to
spoofing-robust speaker verification
- arxiv url: http://arxiv.org/abs/2403.01355v1
- Date: Sun, 3 Mar 2024 00:58:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 14:11:51.361757
- Title: a-DCF: an architecture agnostic metric with application to
spoofing-robust speaker verification
- Title(参考訳): a-DCF: Spoofing-robust Speaker Validationに応用したアーキテクチャ非依存メトリック
- Authors: Hye-jin Shim, Jee-weon Jung, Tomi Kinnunen, Nicholas Evans,
Jean-Francois Bonastre, Itshak Lapidot
- Abstract要約: アーキテクチャに依存しない検出コスト関数(a-DCF)を提案する。
A-DCFは、明確に定義されたクラス事前と検出コストモデルにより、ベイズリスクセンスにおける決定のコストを反映する。
アーキテクチャ上不均一なスプーフィング・ロバスト ASV ソリューションのベンチマーク評価により,a-DCF の利点を実証する。
- 参考スコア(独自算出の注目度): 21.428968328957897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spoofing detection is today a mainstream research topic. Standard metrics can
be applied to evaluate the performance of isolated spoofing detection solutions
and others have been proposed to support their evaluation when they are
combined with speaker detection. These either have well-known deficiencies or
restrict the architectural approach to combine speaker and spoof detectors. In
this paper, we propose an architecture-agnostic detection cost function
(a-DCF). A generalisation of the original DCF used widely for the assessment of
automatic speaker verification (ASV), the a-DCF is designed for the evaluation
of spoofing-robust ASV. Like the DCF, the a-DCF reflects the cost of decisions
in a Bayes risk sense, with explicitly defined class priors and detection cost
model. We demonstrate the merit of the a-DCF through the benchmarking
evaluation of architecturally-heterogeneous spoofing-robust ASV solutions.
- Abstract(参考訳): 現在、スプーフィング検出は主要な研究テーマである。
分離されたスプーフィング検出ソリューションの性能評価に標準指標を適用し,話者検出と組み合わせて評価する手法が提案されている。
これらはよく知られた欠陥を持つか、スピーカーとspoof検出器を組み合わせるためのアーキテクチャアプローチを制限するかのどちらかである。
本稿では,アーキテクチャ非依存検出コスト関数(a-dcf)を提案する。
自動話者検証 (ASV) の評価に広く用いられている元のDCFの一般化として、a-DCFはスプーフィングローバスト ASV の評価のために設計されている。
DCFと同様に、a-DCFは明確に定義されたクラス事前と検出コストモデルによってベイズリスクセンスにおける決定のコストを反映している。
アーキテクチャ上不均一なスプーフィング・ロバスト ASV ソリューションのベンチマーク評価により,a-DCF の利点を実証する。
関連論文リスト
- Toward Improving Synthetic Audio Spoofing Detection Robustness via Meta-Learning and Disentangled Training With Adversarial Examples [33.445126880876415]
自動話者検証システムに到達させる代わりに、スプーフ攻撃をフィルタリングする信頼性と堅牢なスプーフ検出システムを提案する。
データ不均衡問題に対処するために重み付き加法的角縁損失が提案され、スプーフィング攻撃に対する一般化を改善するために異なるマージンが割り当てられている。
データ拡張戦略として、スプーフィング音声に知覚不能な摂動を加えて、敵の例にのみ対応する正規化統計が実行されることを保証するために、補助的なバッチ正規化を用いる。
論文 参考訳(メタデータ) (2024-08-23T19:26:54Z) - ASVspoof 5: Crowdsourced Speech Data, Deepfakes, and Adversarial Attacks at Scale [59.25180900687571]
ASVspoof 5は、音声スプーフとディープフェイク攻撃の研究を促進する一連の課題の第5版である。
本稿では,2つの課題トラック,新しいデータベース,評価指標,評価プラットフォームについて述べる。
論文 参考訳(メタデータ) (2024-08-16T13:37:20Z) - Detecting Multimodal Situations with Insufficient Context and Abstaining from Baseless Predictions [75.45274978665684]
VLU(Vision-Language Understanding)ベンチマークには、提供されたコンテキストによってサポートされない仮定に答えが依存するサンプルが含まれている。
サンプル毎にコンテキストデータを収集し,エビデンスに基づくモデル予測を促進するためにコンテキスト選択モジュールをトレーニングする。
我々は,十分なコンテキストを欠いたサンプルを同定し,モデル精度を向上させる汎用なコンテキスト・アワレ認識検出器を開発した。
論文 参考訳(メタデータ) (2024-05-18T02:21:32Z) - Voice Spoofing Countermeasures: Taxonomy, State-of-the-art, experimental
analysis of generalizability, open challenges, and the way forward [2.393661358372807]
本報告では,手作り特徴,ディープラーニング,エンドツーエンド,汎用スプーフィング対策ソリューションを用いたスプーフィング検出に関する文献のレビューを行う。
本稿では,これらの対策の有効性をいくつかのデータセットで報告し,コーパス間で評価する。
論文 参考訳(メタデータ) (2022-10-02T03:53:37Z) - Optimizing Tandem Speaker Verification and Anti-Spoofing Systems [45.66319648049384]
本稿では,t-DCFの微分可能なバージョンを作成し,強化学習の手法を用いてタンデムシステムを直接最適化することを提案する。
この手法は,ASVSpoof19データセットにおけるt-DCFの相対的改善率を20%向上させる。
論文 参考訳(メタデータ) (2022-01-24T14:27:28Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - A Study on Evaluation Standard for Automatic Crack Detection Regard the
Random Fractal [15.811209242988257]
ディープラーニングに基づく自動き裂検出装置は、明らかに広く使われている平均精度(mAP)基準によって過小評価されている。
その結果, き裂検出の過小評価を補正するために, CovEval というフラクタル利用評価基準を提案する。
オブジェクト検出にいくつかの一般的なフレームワークを使用した実験では、CovEvalによると、モデルの方がクラック検出のスコアがはるかに高い。
論文 参考訳(メタデータ) (2020-07-23T15:46:29Z) - Tandem Assessment of Spoofing Countermeasures and Automatic Speaker
Verification: Fundamentals [59.34844017757795]
同一誤差率(EER)測定値を用いて,スプーフィング対策(CM)の信頼性を測る。
本稿では,タンデム検出コスト関数(t-DCF)の新たな拡張について述べる。
CMアセスメントにおけるt-DCFの導入は、アンチ・スプーフィングとASV研究コミュニティの緊密な連携を促進するのに役立つと期待されている。
論文 参考訳(メタデータ) (2020-07-12T12:44:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。