論文の概要: Probabilistic Spherical Discriminant Analysis: An Alternative to PLDA
for length-normalized embeddings
- arxiv url: http://arxiv.org/abs/2203.14893v1
- Date: Mon, 28 Mar 2022 16:54:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 13:38:02.685515
- Title: Probabilistic Spherical Discriminant Analysis: An Alternative to PLDA
for length-normalized embeddings
- Title(参考訳): 確率的球面判別分析:長さ正規化埋め込みにおけるPLDAの代替
- Authors: Niko Br\"ummer, Albert Swart, Ladislav Mo\v{s}ner, Anna Silnova,
Old\v{r}ich Plchot, Themos Stafylakis and Luk\'a\v{s} Burget
- Abstract要約: 話者認識では、コサインスコアリング(cosine score)またはPLDA(PLDA)と呼ばれる2つのスコアリングバックエンドが一般的である。
我々は超球面上の Von Mises-Fisher 分布をクラス内分布とクラス間分布の両方に用いた PLDA の類似体 PSDA を提案する。
シングル・エンロールとマルチ・エンロールの検証を含むあらゆる種類の試行は、より複雑な確率比を含むことができる。
- 参考スコア(独自算出の注目度): 8.073572195409866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In speaker recognition, where speech segments are mapped to embeddings on the
unit hypersphere, two scoring backends are commonly used, namely cosine scoring
or PLDA. Both have advantages and disadvantages, depending on the context.
Cosine scoring follows naturally from the spherical geometry, but for PLDA the
blessing is mixed -- length normalization Gaussianizes the between-speaker
distribution, but violates the assumption of a speaker-independent
within-speaker distribution. We propose PSDA, an analogue to PLDA that uses Von
Mises-Fisher distributions on the hypersphere for both within and between-class
distributions. We show how the self-conjugacy of this distribution gives
closed-form likelihood-ratio scores, making it a drop-in replacement for PLDA
at scoring time. All kinds of trials can be scored, including single-enroll and
multi-enroll verification, as well as more complex likelihood-ratios that could
be used in clustering and diarization. Learning is done via an EM-algorithm
with closed-form updates. We explain the model and present some first
experiments.
- Abstract(参考訳): 話者認識では、音声セグメントを単位超球面上の埋め込みにマッピングすると、2つのスコアリングバックエンドが一般的に使用される。
両方の利点とデメリットは、状況によって異なります。
コサインのスコアリングは球形形状から自然に従うが、PLDAでは祝福は混合される - 長さ正規化は話者間分布をガウシアン化するが、話者非依存の話者内分布の仮定に反する。
我々は超球面上の Von Mises-Fisher 分布をクラス内分布とクラス間分布の両方に用いた PLDA の類似体 PSDA を提案する。
この分布の自己共役性がクローズドフォームの確率-比スコアをどのように与えるかを示し,得点時にpldaの代替となることを示す。
シングルエンロールとマルチエンロールの検証に加えて、クラスタリングやダイアリゼーションに使用できるより複雑な可能性比など、あらゆる種類の試行結果を得ることができる。
学習は、クローズドフォームの更新を伴うEM-algorithmを通じて行われる。
モデルを説明し,最初の実験を行った。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Computing Marginal and Conditional Divergences between Decomposable
Models with Applications [7.89568731669979]
本稿では,2つの分解可能なモデルの任意の限界分布と条件分布の正確なα-ベータの偏差を計算する手法を提案する。
提案手法を用いて,まずベンチマーク画像データセットに適用することにより,分布変化を解析する方法を示す。
本稿では,現代の超伝導量子コンピュータにおける誤差の定量化手法を提案する。
論文 参考訳(メタデータ) (2023-10-13T14:17:25Z) - Adaptive Annealed Importance Sampling with Constant Rate Progress [68.8204255655161]
Annealed Importance Smpling (AIS)は、抽出可能な分布から重み付けされたサンプルを合成する。
本稿では,alpha$-divergencesに対する定数レートAISアルゴリズムとその効率的な実装を提案する。
論文 参考訳(メタデータ) (2023-06-27T08:15:28Z) - Fit Like You Sample: Sample-Efficient Generalized Score Matching from
Fast Mixing Diffusions [29.488555741982015]
幅広いマルコフ過程の混合時間と生成元 $mathcalL$ との密接な関係を示す。
我々はマルコフ連鎖を高速化し、より良いスコアマッチング損失を構築する技術に適応する。
特に、拡散のプレコンディショニング'をスコア損失の適切なプレコンディショニング'に変換することができる。
論文 参考訳(メタデータ) (2023-06-15T17:58:42Z) - Dior-CVAE: Pre-trained Language Models and Diffusion Priors for
Variational Dialog Generation [70.2283756542824]
Dior-CVAEは階層型条件変分オートエンコーダ(CVAE)である。
拡散モデルを用いて、従来の分布の複雑さを増大させ、PLMが生成した分布との整合性を高める。
2つのオープンドメインダイアログデータセットを対象とした実験により,大規模ダイアログ事前学習を必要とせずに,より多様な応答を生成できることが判明した。
論文 参考訳(メタデータ) (2023-05-24T11:06:52Z) - Differentially-Private Bayes Consistency [70.92545332158217]
差分プライバシー(DP)を満たすベイズ一貫した学習ルールを構築する。
ほぼ最適なサンプル複雑性を持つ半教師付き環境で,任意のVCクラスをプライベートに学習できることを実証する。
論文 参考訳(メタデータ) (2022-12-08T11:57:30Z) - Toroidal Probabilistic Spherical Discriminant Analysis [4.108785279329242]
話者認識では、コサインスコア(cosine score)とPLDA(PLDA)の2つのスコアリングバックエンドが一般的である。
我々は最近,ガウス分布の代わりにフォン・ミセス・フィッシャー分布を用いるPLDAに類似したPSDAを提案している。
トロイダルPSDA(T-PSDA)は,超球面のトロイダル部分多様体内での話者内および話者間の変動をモデル化し,PSDAを拡張した。
論文 参考訳(メタデータ) (2022-10-27T14:05:39Z) - Learnable Distribution Calibration for Few-Shot Class-Incremental
Learning [122.2241120474278]
FSCIL(Few-shot class-incremental Learning)は、古いクラス分布を記憶し、少数のトレーニングサンプルから新しいクラス分布を推定するという課題に直面している。
本稿では,これら2つの課題を統一フレームワークを用いて体系的に解決することを目的とした,学習可能な分布校正手法を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:40:26Z) - Variational Autoencoder Kernel Interpretation and Selection for
Classification [59.30734371401315]
本研究では,変分オートエンコーダの畳み込みエンコーダによって生成された特徴に基づく確率的分類器のカーネル選択手法を提案する。
提案した実装では、各カーネルに対して各分散が生成されるため、各潜伏変数を最終エンコーダの畳み込み層の単一カーネルに関連付けられた分布からサンプリングした。
サンプル化された潜伏変数で関連する機能を選択することで、カーネルの選択を実行し、非形式的機能とカーネルをフィルタリングすることができる。
論文 参考訳(メタデータ) (2022-09-10T17:22:53Z) - Cycle Consistent Probability Divergences Across Different Spaces [38.43511529063335]
確率分布の相違は、統計的推測と機械学習の核心にある。
本研究は, 異方性, 異方性, 異方性, 異なる空間上の分布をマッチングするための, アンバランスなモンジュ最適輸送定式化を提案する。
論文 参考訳(メタデータ) (2021-11-22T16:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。