論文の概要: A Speaker Verification Backend for Improved Calibration Performance
across Varying Conditions
- arxiv url: http://arxiv.org/abs/2002.03802v1
- Date: Wed, 5 Feb 2020 15:37:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 21:19:16.247485
- Title: A Speaker Verification Backend for Improved Calibration Performance
across Varying Conditions
- Title(参考訳): 可変条件における校正性能向上のための話者検証バックエンド
- Authors: Luciana Ferrer and Mitchell McLaren
- Abstract要約: そこで本研究では,事前校正性能を良好に向上する話者検証のための識別バックエンドを提案する。
バックエンドのすべてのパラメータは、話者検証タスクのバイナリクロスエントロピーを最適化するために共同で訓練される。
本手法は,従来の提案手法と類似した性能を提供するが,実装が簡単で,トレーニングデータに対する要件も少ないことを示す。
- 参考スコア(独自算出の注目度): 21.452221762153577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In a recent work, we presented a discriminative backend for speaker
verification that achieved good out-of-the-box calibration performance on most
tested conditions containing varying levels of mismatch to the training
conditions. This backend mimics the standard PLDA-based backend process used in
most current speaker verification systems, including the calibration stage. All
parameters of the backend are jointly trained to optimize the binary
cross-entropy for the speaker verification task. Calibration robustness is
achieved by making the parameters of the calibration stage a function of
vectors representing the conditions of the signal, which are extracted using a
model trained to predict condition labels. In this work, we propose a
simplified version of this backend where the vectors used to compute the
calibration parameters are estimated within the backend, without the need for a
condition prediction model. We show that this simplified method provides
similar performance to the previously proposed method while being simpler to
implement, and having less requirements on the training data. Further, we
provide an analysis of different aspects of the method including the effect of
initialization, the nature of the vectors used to compute the calibration
parameters, and the effect that the random seed and the number of training
epochs has on performance. We also compare the proposed method with the
trial-based calibration (TBC) method that, to our knowledge, was the
state-of-the-art for achieving good calibration across varying conditions. We
show that the proposed method outperforms TBC while also being several orders
of magnitude faster to run, comparable to the standard PLDA baseline.
- Abstract(参考訳): 近年の研究では,訓練条件に対する各種のミスマッチを含むほとんどの試験条件において,箱外キャリブレーション性能が良好である話者検証のための識別バックエンドを提案する。
このバックエンドは、キャリブレーションステージを含むほとんどの現在の話者認証システムで使用される標準のPLDAベースのバックエンドプロセスを模倣する。
バックエンドのすべてのパラメータは、話者検証タスクのバイナリクロスエントロピーを最適化するために共同で訓練される。
キャリブレーションステージのパラメータを信号の条件を表すベクトルの関数とし、条件ラベルを予測するために訓練されたモデルを用いて抽出することにより、キャリブレーションロバスト性を実現する。
本研究では,キャリブレーションパラメータの計算に用いるベクトルを,条件予測モデルを必要とせずにバックエンド内で推定する,このバックエンドの簡易バージョンを提案する。
本手法は,従来の提案手法と類似した性能を提供するが,実装が簡単で,トレーニングデータに対する要件も少ないことを示す。
さらに,初期化の影響,キャリブレーションパラメータの計算に使用されるベクトルの性質,ランダムシードとトレーニングエポックの数が性能に与える影響など,手法のさまざまな側面の分析を行った。
また,提案手法とtbc(trial-based calibration)法との比較を行った。
提案手法は,標準的なPLDAベースラインに匹敵する,TBCよりも数桁高速に動作可能であることを示す。
関連論文リスト
- Optimizing Estimators of Squared Calibration Errors in Classification [2.3020018305241337]
本稿では,2乗キャリブレーション誤差の推定器の比較と最適化を可能にする平均二乗誤差に基づくリスクを提案する。
キャリブレーション誤差を推定する際のトレーニングバリデーションテストパイプラインを提案する。
論文 参考訳(メタデータ) (2024-10-09T15:58:06Z) - C-TPT: Calibrated Test-Time Prompt Tuning for Vision-Language Models via Text Feature Dispersion [54.81141583427542]
深層学習において,ラベル付きデータを必要としない微調整手法としてテスト時間適応が注目されている。
本稿では,CLIPの固有特性を利用したテスト時プロンプトチューニング時の校正について検討する。
そこで本研究では,C-TPT(Calibrated Test-time Prompt Tuning)という,キャリブレーションの強化によるテスト時間中のプロンプトの最適化手法を提案する。
論文 参考訳(メタデータ) (2024-03-21T04:08:29Z) - Calibration by Distribution Matching: Trainable Kernel Calibration
Metrics [56.629245030893685]
カーネルベースのキャリブレーションメトリクスを導入し、分類と回帰の両方で一般的なキャリブレーションの形式を統一・一般化する。
これらの指標は、異なるサンプル推定を許容しており、キャリブレーションの目的を経験的リスク最小化に組み込むのが容易である。
決定タスクにキャリブレーションメトリクスを調整し、正確な損失推定を行ない、後悔しない決定を行うための直感的なメカニズムを提供する。
論文 参考訳(メタデータ) (2023-10-31T06:19:40Z) - Sharp Calibrated Gaussian Processes [58.94710279601622]
キャリブレーションされたモデルを設計するための最先端のアプローチは、ガウス過程の後方分散を膨らませることに依存している。
本稿では,バニラガウス過程の後方分散にインスパイアされた計算を用いて,予測量子化を生成するキャリブレーション手法を提案する。
我々のアプローチは合理的な仮定の下で校正されたモデルが得られることを示す。
論文 参考訳(メタデータ) (2023-02-23T12:17:36Z) - Modular Conformal Calibration [80.33410096908872]
回帰における再校正のためのアルゴリズムを多種多様なクラスで導入する。
このフレームワークは、任意の回帰モデルをキャリブレーションされた確率モデルに変換することを可能にする。
我々は17の回帰データセットに対するMCCの実証的研究を行った。
論文 参考訳(メタデータ) (2022-06-23T03:25:23Z) - Parameterized Temperature Scaling for Boosting the Expressive Power in
Post-Hoc Uncertainty Calibration [57.568461777747515]
我々は新しいキャリブレーション手法であるパラメタライズド温度スケーリング(PTS)を導入する。
最新のポストホックキャリブレータの精度保持性能は、その本質的な表現力によって制限されることを実証します。
当社の新しい精度保存手法が,多数のモデルアーキテクチャやデータセット,メトリクスにおいて,既存のアルゴリズムを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2021-02-24T10:18:30Z) - A Speaker Verification Backend with Robust Performance across Conditions [28.64769660252556]
話者検証の標準的な方法は、ディープニューラルネットワークを用いた話者埋め込みを抽出することである。
この方法は、キャリブレーションモデルのトレーニングに使用されるものと異なる条件でうまく動作しないシステムをもたらすことが知られている。
本稿では,入力の条件に適応するために,時間などの情報を自動的に抽出するアダプティブキャリブレータを導入することで,標準バックエンドを変更することを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:27:52Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z) - Calibrating Structured Output Predictors for Natural Language Processing [8.361023354729731]
本稿では,ニューラルネットワークに基づく構造化予測モデルに注目する出力要素の一般的なキャリブレーション手法を提案する。
提案手法は,任意のバイナリクラスキャリブレーションスキームとニューラルネットワークモデルを用いて適用することができる。
提案手法は, 話者認識, パート・オブ・音声, 質問応答における現在のキャリブレーション手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-09T04:14:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。