論文の概要: Squeezing value of cross-domain labels: a decoupled scoring approach for
speaker verification
- arxiv url: http://arxiv.org/abs/2010.14243v1
- Date: Tue, 27 Oct 2020 12:32:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 13:27:42.433118
- Title: Squeezing value of cross-domain labels: a decoupled scoring approach for
speaker verification
- Title(参考訳): クロスドメインラベルのスクイーズ値:話者検証のための分離スコアリング手法
- Authors: Lantian Li, Yang Zhang, Jiawen Kang, Thomas Fang Zheng, Dong Wang
- Abstract要約: ドメイン間データを追加するだけでは、登録テストミスマッチのある条件下でのパフォーマンスが向上しないことを示す。
クロスドメインラベルの値を最大に絞り込むことのできる分離されたスコアリング手法を提案する。
チャネル横断試験実験の結果,提案手法は高い有効性を示した。
- 参考スコア(独自算出の注目度): 24.627943147861153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain mismatch often occurs in real applications and causes serious
performance reduction on speaker verification systems. The common wisdom is to
collect cross-domain data and train a multi-domain PLDA model, with the hope to
learn a domain-independent speaker subspace. In this paper, we firstly present
an empirical study to show that simply adding cross-domain data does not help
performance in conditions with enrollment-test mismatch. Careful analysis shows
that this striking result is caused by the incoherent statistics between the
enrollment and test conditions. Based on this analysis, we present a decoupled
scoring approach that can maximally squeeze the value of cross-domain labels
and obtain optimal verification scores when the enrollment and test are
mismatched. When the statistics are coherent, the new formulation falls back to
the conventional PLDA. Experimental results on cross-channel test show that the
proposed approach is highly effective and is a principle solution to domain
mismatch.
- Abstract(参考訳): ドメインミスマッチは、しばしば実際のアプリケーションで起こり、話者検証システムで深刻なパフォーマンス低下を引き起こす。
共通の知恵は、ドメインに依存しない話者サブスペースを学ぶために、クロスドメインデータを収集し、マルチドメインPLDAモデルをトレーニングすることである。
本稿では,まず,クロスドメインデータを追加するだけでは,入試ミスマッチのある条件下での性能が向上しないことを示す。
注意深い分析は、この顕著な結果は、入学条件と試験条件の間の不整合統計によって引き起こされることを示している。
この分析に基づいて,クロスドメインラベルの値を最大に絞り込み,登録とテストのミスマッチ時に最適な検証スコアを得ることのできる分離スコアリング手法を提案する。
統計がコヒーレントであれば、新しい定式化は従来のpldaに遡る。
クロスチャネルテストによる実験の結果,提案手法は非常に効果的であり,ドメインミスマッチの原理的解決法であることがわかった。
関連論文リスト
- Federated Nonparametric Hypothesis Testing with Differential Privacy Constraints: Optimal Rates and Adaptive Tests [5.3595271893779906]
フェデレート学習は、さまざまな場所でデータが収集され分析される広範囲な設定で適用可能であることから、近年大きな注目を集めている。
分散差分プライバシー(DP)制約下でのホワイトノイズ・ウィズ・ドリフトモデルにおける非パラメトリック適合性試験について検討した。
論文 参考訳(メタデータ) (2024-06-10T19:25:19Z) - Boosting Cross-Domain Speech Recognition with Self-Supervision [35.01508881708751]
自動音声認識(ASR)のクロスドメイン性能は,トレーニングとテストのミスマッチにより著しく損なわれる可能性がある。
従来, 自己監督学習 (SSL) や擬似ラベル学習 (PL) は, 未ラベルデータの自己監督を利用してUDAに有効であることが示された。
この研究は、事前学習および微調整のパラダイムにおいて、ラベルなしデータを完全に活用する体系的なUDAフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-20T14:02:53Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z) - Context-Aware Drift Detection [0.0]
均質性の2サンプル試験は、既存のドリフト検出手法が構築される基礎となる。
条件分布処理効果の2サンプル試験の基礎の上に構築した,より一般的なドリフト検出フレームワークを開発した。
論文 参考訳(メタデータ) (2022-03-16T14:23:02Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - Joint Distribution Alignment via Adversarial Learning for Domain
Adaptive Object Detection [11.262560426527818]
教師なしのドメイン適応オブジェクト検出は、リッチラベル付きデータで訓練された元のソースドメインから、ラベルなしデータで新しいターゲットドメインに適応することを目的としている。
近年、主流のアプローチは、敵対的学習を通じてこのタスクを実行するが、それでも2つの制限に悩まされている。
上記の課題に対処するために,JADF(Joint Adaptive Detection framework)を提案する。
論文 参考訳(メタデータ) (2021-09-19T00:27:08Z) - Cross-domain Adaptation with Discrepancy Minimization for
Text-independent Forensic Speaker Verification [61.54074498090374]
本研究では,複数の音響環境下で収集したCRSS-Forensicsオーディオデータセットを紹介する。
我々は、VoxCelebデータを用いてCNNベースのネットワークを事前訓練し、次に、CRSS-Forensicsのクリーンな音声で高レベルのネットワーク層の一部を微調整するアプローチを示す。
論文 参考訳(メタデータ) (2020-09-05T02:54:33Z) - Discriminative Cross-Domain Feature Learning for Partial Domain
Adaptation [70.45936509510528]
部分的なドメイン適応は、より大きく多様なソースドメインからの知識を、より少ないクラス数でより小さなターゲットドメインに適応させることを目的としています。
ドメイン適応の最近の実践は、ターゲットドメインの擬似ラベルを組み込むことで、効果的な特徴を抽出する。
ターゲットデータを少数のソースデータのみにアライメントすることが不可欠である。
論文 参考訳(メタデータ) (2020-08-26T03:18:53Z) - Self-Challenging Improves Cross-Domain Generalization [81.99554996975372]
畳み込みニューラルネットワーク(CNN)は、ラベルと相関する支配的特徴を活性化することにより、画像分類を行う。
ドメイン外データに対するCNNの一般化を著しく改善する簡単なトレーニングである自己整合表現(RSC)を導入する。
RSCはトレーニングデータ上で活性化される主要な機能に対して反復的に挑戦し、ラベルと相関する残りの機能を有効にするようネットワークに強制する。
論文 参考訳(メタデータ) (2020-07-05T21:42:26Z) - Cross-domain Detection via Graph-induced Prototype Alignment [114.8952035552862]
カテゴリレベルのドメインアライメントを求めるグラフ誘発プロトタイプアライメント(GPA)フレームワークを提案する。
さらに,クラス不均衡がドメイン適応に与える影響を軽減するために,クラス重み付きコントラスト損失を設計する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-03-28T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。