論文の概要: Investigation of Different Calibration Methods for Deep Speaker
Embedding based Verification Systems
- arxiv url: http://arxiv.org/abs/2203.15106v1
- Date: Mon, 28 Mar 2022 21:22:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-30 17:09:49.549124
- Title: Investigation of Different Calibration Methods for Deep Speaker
Embedding based Verification Systems
- Title(参考訳): 深部話者埋め込み型検証システムにおける異なるキャリブレーション手法の検討
- Authors: Galina Lavrentyeva, Sergey Novoselov, Andrey Shulipa, Marina Volkova,
Aleksandr Kozlov
- Abstract要約: 本稿では, ディープスピーカ埋込抽出器のスコアキャリブレーション法について検討する。
この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
- 参考スコア(独自算出の注目度): 66.61691401921296
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep speaker embedding extractors have already become new state-of-the-art
systems in the speaker verification field. However, the problem of verification
score calibration for such systems often remains out of focus. An irrelevant
score calibration leads to serious issues, especially in the case of unknown
acoustic conditions, even if we use a strong speaker verification system in
terms of threshold-free metrics. This paper presents an investigation over
several methods of score calibration: a classical approach based on the
logistic regression model; the recently presented magnitude estimation network
MagnetO that uses activations from the pooling layer of the trained deep
speaker extractor and generalization of such approach based on separate scale
and offset prediction neural networks. An additional focus of this research is
to estimate the impact of score normalization on the calibration performance of
the system. The obtained results demonstrate that there are no serious problems
if in-domain development data are used for calibration tuning. Otherwise, a
trade-off between good calibration performance and threshold-free system
quality arises. In most cases using adaptive s-norm helps to stabilize score
distributions and to improve system performance. Meanwhile, some experiments
demonstrate that novel approaches have their limits in score stabilization on
several datasets.
- Abstract(参考訳): ディープスピーカー埋込抽出器は,すでに話者検証分野における最先端システムとなっている。
しかし,このようなシステムの検証スコア校正の問題は,しばしば注目されていない。
無関係なスコアキャリブレーションは、特に未知の音響条件の場合、しきい値のない指標で強い話者検証システムを使用したとしても、深刻な問題を引き起こす。
本稿では,ロジスティック回帰モデルに基づく古典的アプローチ,訓練された深層話者抽出器のプーリング層からのアクティベーションを利用した最近提示された大きさ推定ネットワーク磁力,および分離スケールとオフセット予測ニューラルネットワークに基づくそのようなアプローチの一般化について検討する。
この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
その結果,キャリブレーションチューニングにドメイン内開発データを用いる場合,深刻な問題はないことがわかった。
そうでなければ、優れたキャリブレーション性能としきい値のないシステム品質のトレードオフが発生する。
ほとんどの場合、適応sノルムはスコア分布の安定化とシステム性能の向上に役立つ。
一方、いくつかの実験では、新しいアプローチがいくつかのデータセットのスコア安定化に限界があることが示されている。
関連論文リスト
- Improving Predictor Reliability with Selective Recalibration [15.319277333431318]
リカレーションは、事前訓練されたモデルで信頼性の高い信頼度を推定する最も効果的な方法の1つである。
そこで我々は,選択モデルがユーザの選択比率を下げることを学ぶテキスト選択的リカレーションを提案する。
以上の結果から,選択的再校正は幅広い選択基準と再校正基準よりも,キャリブレーション誤差が著しく低いことが示唆された。
論文 参考訳(メタデータ) (2024-10-07T18:17:31Z) - Calibration-Aware Bayesian Learning [37.82259435084825]
本稿では、キャリブレーション対応ベイズニューラルネットワーク(CA-BNN)と呼ばれる統合フレームワークを提案する。
ベイズ学習のように変分分布を最適化しながら、データ依存あるいはデータ非依存の正則化をそれぞれ適用する。
予測キャリブレーション誤差(ECE)と信頼性図を用いて,提案手法の利点を検証した。
論文 参考訳(メタデータ) (2023-05-12T14:19:15Z) - Benchmarking common uncertainty estimation methods with
histopathological images under domain shift and label noise [62.997667081978825]
リスクの高い環境では、深層学習モデルは不確実性を判断し、誤分類の可能性がかなり高い場合に入力を拒否しなければなりません。
我々は,全スライド画像の分類において,最もよく使われている不確実性と頑健さの厳密な評価を行う。
我々は一般的に,手法のアンサンブルが,ドメインシフトやラベルノイズに対するロバスト性の向上とともに,より良い不確実性評価につながることを観察する。
論文 参考訳(メタデータ) (2023-01-03T11:34:36Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Learning to Adapt to Domain Shifts with Few-shot Samples in Anomalous
Sound Detection [7.631596468553607]
異常検出は、産業機器の監視など、多くの重要な応用がある。
サンプルの少ない新しい条件に適応するフレームワークを提案する。
提案手法は,最近リリースされた各種機械の音響測定データセットを用いて評価する。
論文 参考訳(メタデータ) (2022-04-05T00:22:25Z) - Deep Discriminative to Kernel Density Graph for In- and Out-of-distribution Calibrated Inference [7.840433908659846]
ランダムフォレストやディープニューラルネットワークのような深い差別的アプローチは、最近、多くの重要な現実世界のシナリオで応用を見出した。
しかし、これらの学習アルゴリズムを安全クリティカルなアプリケーションにデプロイすることは、特に、配布内および配布外の両方のデータポイントの信頼性校正を確実にする際の懸念を提起する。
本稿では,IDとOODの校正問題を共同で解決する。
論文 参考訳(メタデータ) (2022-01-31T05:07:16Z) - A Speaker Verification Backend with Robust Performance across Conditions [28.64769660252556]
話者検証の標準的な方法は、ディープニューラルネットワークを用いた話者埋め込みを抽出することである。
この方法は、キャリブレーションモデルのトレーニングに使用されるものと異なる条件でうまく動作しないシステムをもたらすことが知られている。
本稿では,入力の条件に適応するために,時間などの情報を自動的に抽出するアダプティブキャリブレータを導入することで,標準バックエンドを変更することを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:27:52Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Calibration of Neural Networks using Splines [51.42640515410253]
キャリブレーション誤差の測定は、2つの経験的分布を比較します。
古典的コルモゴロフ・スミルノフ統計テスト(KS)にインスパイアされたビンニングフリーキャリブレーション尺度を導入する。
提案手法は,KS誤差に対する既存の手法と,他の一般的なキャリブレーション手法とを一貫して比較する。
論文 参考訳(メタデータ) (2020-06-23T07:18:05Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。