論文の概要: An initial investigation on optimizing tandem speaker verification and
countermeasure systems using reinforcement learning
- arxiv url: http://arxiv.org/abs/2002.03801v2
- Date: Wed, 8 Apr 2020 11:09:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 12:38:46.994683
- Title: An initial investigation on optimizing tandem speaker verification and
countermeasure systems using reinforcement learning
- Title(参考訳): 強化学習を用いたタンデム話者照合と対応システムの最適化に関する初期検討
- Authors: Anssi Kanervisto, Ville Hautam\"aki, Tomi Kinnunen, Junichi Yamagishi
- Abstract要約: 我々は, 強化学習を用いて, ASV と CM コンポーネントを併用して, より優れた t-DCF 尺度を学習する。
比較した標準的な教師あり学習技術よりも信頼性の高い結果が得られることを実証する。
- 参考スコア(独自算出の注目度): 45.66319648049384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The spoofing countermeasure (CM) systems in automatic speaker verification
(ASV) are not typically used in isolation of each other. These systems can be
combined, for example, into a cascaded system where CM produces first a
decision whether the input is synthetic or bona fide speech. In case the CM
decides it is a bona fide sample, then the ASV system will consider it for
speaker verification. End users of the system are not interested in the
performance of the individual sub-modules, but instead are interested in the
performance of the combined system. Such combination can be evaluated with
tandem detection cost function (t-DCF) measure, yet the individual components
are trained separately from each other using their own performance metrics. In
this work we study training the ASV and CM components together for a better
t-DCF measure by using reinforcement learning. We demonstrate that such
training procedure indeed is able to improve the performance of the combined
system, and does so with more reliable results than with the standard
supervised learning techniques we compare against.
- Abstract(参考訳): 自動話者検証(ASV)におけるスプーフィング対策(CM)システムは、互いに独立して使用されるものではない。
これらのシステムは、例えば、入力が合成音声かbona fide音声かをcmが最初に判断するカスケードシステムと組み合わせることができる。
CMがボナファイドのサンプルであると判断した場合、ASVシステムは話者検証のためにそれを検討する。
システムのエンドユーザは個々のサブモジュールのパフォーマンスに関心がなく、むしろ統合されたシステムのパフォーマンスに関心を持っている。
このような組み合わせはタンデム検出コスト関数(t-DCF)測定で評価できるが、個々のコンポーネントはそれぞれのパフォーマンスメトリクスを使用して互いに独立して訓練される。
本研究では, 強化学習を用いて, ASV と CM コンポーネントを併用して, より良い t-DCF 測定を行う。
そこで本研究では,これらの学習手法が複合システムの性能を実際に向上できることを示すとともに,従来の教師付き学習手法よりも信頼性の高い結果が得られることを示す。
関連論文リスト
- Pretraining End-to-End Keyword Search with Automatically Discovered Acoustic Units [8.86336076082867]
本研究では,E2E KWS システムを非転写データで事前学習する手法を提案する。
このようなモデルの微調整は、スクラッチからトレーニングしたモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2024-07-05T17:07:58Z) - OAEI Machine Learning Dataset for Online Model Generation [0.6472397166280683]
オントロジーアライメント評価イニシアチブ(OAEI)によるオントロジーと知識グラフマッチングシステムの評価
OAEIトラックのほとんどに対して、トレーニング、検証、テストセットを含むデータセットを導入します。
論文 参考訳(メタデータ) (2024-04-29T09:33:53Z) - Enhancement of a Text-Independent Speaker Verification System by using
Feature Combination and Parallel-Structure Classifiers [0.0]
本稿では,特徴抽出と分類という2つのモジュールについて検討する。
最も適切な音響特徴の選択は、頑健な話者検証を行う上で重要な要素である。
ノイズの多い環境でシステムを強化するために,前処理段階としてのマルチバンドノイズ除去手法を提案する。
論文 参考訳(メタデータ) (2024-01-26T17:19:59Z) - Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space [30.094557217931563]
ASVシステムは様々な種類の敵を用いて偽造することができる。
本稿では,ディープニューラルネットワークに基づく新しいバックエンド分類手法を提案する。
ASVspoof 2019論理アクセスデータセットで実験が行われる。
論文 参考訳(メタデータ) (2024-01-20T07:30:22Z) - Combining multiple matchers for fingerprint verification: A case study
in biosecure network of excellence [53.598636960435286]
指紋認証のための2つの参照システムは、追加の2つの非参照システムと共にテストされている。
実験結果から, 最適認識戦略は, 栄養素と相関測定の両方が関係していることが示唆された。
論文 参考訳(メタデータ) (2022-12-04T19:49:05Z) - Deep Feature Learning for Medical Acoustics [78.56998585396421]
本研究の目的は,医療音響の課題における学習内容の比較である。
ヒトの呼吸音と心臓の鼓動を健康的または病態の影響の2つのカテゴリに分類する枠組みが実装されている。
論文 参考訳(メタデータ) (2022-08-05T10:39:37Z) - Optimizing Tandem Speaker Verification and Anti-Spoofing Systems [45.66319648049384]
本稿では,t-DCFの微分可能なバージョンを作成し,強化学習の手法を用いてタンデムシステムを直接最適化することを提案する。
この手法は,ASVSpoof19データセットにおけるt-DCFの相対的改善率を20%向上させる。
論文 参考訳(メタデータ) (2022-01-24T14:27:28Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Improving Conversational Question Answering Systems after Deployment
using Feedback-Weighted Learning [69.42679922160684]
本稿では,二元的ユーザフィードバックを用いた初期教師付きシステムを改善するために,重要サンプリングに基づくフィードバック重み付き学習を提案する。
当社の作業は,実際のユーザとのインタラクションを活用し,デプロイ後の会話システムを改善する可能性を開くものだ。
論文 参考訳(メタデータ) (2020-11-01T19:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。