論文の概要: Toroidal Probabilistic Spherical Discriminant Analysis
- arxiv url: http://arxiv.org/abs/2210.15441v1
- Date: Thu, 27 Oct 2022 14:05:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 15:42:03.344425
- Title: Toroidal Probabilistic Spherical Discriminant Analysis
- Title(参考訳): トロイダル確率球面判別分析
- Authors: Anna Silnova and Niko Br\"ummer and Albert Swart and Luk\'a\v{s}
Burget
- Abstract要約: 話者認識では、コサインスコア(cosine score)とPLDA(PLDA)の2つのスコアリングバックエンドが一般的である。
我々は最近,ガウス分布の代わりにフォン・ミセス・フィッシャー分布を用いるPLDAに類似したPSDAを提案している。
トロイダルPSDA(T-PSDA)は,超球面のトロイダル部分多様体内での話者内および話者間の変動をモデル化し,PSDAを拡張した。
- 参考スコア(独自算出の注目度): 4.108785279329242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In speaker recognition, where speech segments are mapped to embeddings on the
unit hypersphere, two scoring back-ends are commonly used, namely cosine
scoring and PLDA. We have recently proposed PSDA, an analog to PLDA that uses
Von Mises-Fisher distributions instead of Gaussians. In this paper, we present
toroidal PSDA (T-PSDA). It extends PSDA with the ability to model within and
between-speaker variabilities in toroidal submanifolds of the hypersphere. Like
PLDA and PSDA, the model allows closed-form scoring and closed-form EM updates
for training. On VoxCeleb, we find T-PSDA accuracy on par with cosine scoring,
while PLDA accuracy is inferior. On NIST SRE'21 we find that T-PSDA gives large
accuracy gains compared to both cosine scoring and PLDA.
- Abstract(参考訳): 話者認識では、音声セグメントを単位超球面上の埋め込みにマッピングすると、2つのスコアリングバックエンド、すなわちコサインスコアとPLDAが一般的に使用される。
我々は最近,ガウス分布の代わりにフォン・ミセス・フィッシャー分布を用いるPLDAの類似であるPSDAを提案した。
本稿ではトロイダルPSDA(T-PSDA)について述べる。
psdaを拡張し、超球面のトロイダル部分多様体内および話者間変動をモデル化する能力を持つ。
PLDAやPSDAと同様に、モデルはトレーニングのためのクローズドフォームスコアリングとクローズドフォームEM更新を可能にする。
VoxCelebではコサインスコアと同等のT-PSDA精度を示し,PLDA精度は劣っている。
NIST SRE'21 では,T-PSDA はコサインスコアとPLDA と比較して高い精度が得られた。
関連論文リスト
- DASA: Difficulty-Aware Semantic Augmentation for Speaker Verification [55.306583814017046]
本稿では,話者認証のための難易度認識型セマンティック拡張(DASA)手法を提案する。
DASAは、話者埋め込み空間における多様なトレーニングサンプルを、無視できる余分な計算コストで生成する。
最も良い結果は、CN-Celeb評価セット上でのEER測定値の14.6%の相対的な減少を達成する。
論文 参考訳(メタデータ) (2023-10-18T17:07:05Z) - GPLaSDI: Gaussian Process-based Interpretable Latent Space Dynamics Identification through Deep Autoencoder [0.0]
潜在空間ODEに依存する新しいLa Gaussianベースのフレームワークを導入する。
本稿では,バーガース方程式,プラズマ物理学におけるフラソフ方程式,上昇する熱バブル問題に対する我々のアプローチの有効性を実証する。
提案手法は,200~10万倍の高速化を実現し,相対誤差を最大7%向上する。
論文 参考訳(メタデータ) (2023-08-10T23:54:12Z) - FP-Diffusion: Improving Score-based Diffusion Models by Enforcing the
Underlying Score Fokker-Planck Equation [72.19198763459448]
雑音が増大する傾向にあるデータ密度に対応する雑音条件スコア関数の族を学習する。
これらの摂動データ密度は、密度の時空間進化を管理する偏微分方程式(PDE)であるフォッカー・プランク方程式(Fokker-Planck equation, FPE)によって結合される。
我々は、摂動データ密度の雑音条件スコアを特徴付けるスコアFPEと呼ばれる対応する方程式を導出する。
論文 参考訳(メタデータ) (2022-10-09T16:27:25Z) - Efficacy of noisy dynamical decoupling [0.0]
動的デカップリング(英: Dynamical Decoupling, DD)とは、量子系における誤りの軽減法である。
ノイズパルスが存在する場合、DDは必ずしもエラーを軽減するとは限らない。
DDパルスからの付加ノイズが、元のバックグラウンドノイズを平均化する能力の増大を上回りません。
論文 参考訳(メタデータ) (2022-09-19T14:19:11Z) - DR-DSGD: A Distributionally Robust Decentralized Learning Algorithm over
Graphs [54.08445874064361]
本稿では,分散環境下での正規化された分散ロバストな学習問題を解くことを提案する。
Kullback-Liebler正規化関数をロバストなmin-max最適化問題に追加することにより、学習問題を修正されたロバストな問題に還元することができる。
提案アルゴリズムは, 最低分布検定精度を最大10%向上できることを示す。
論文 参考訳(メタデータ) (2022-08-29T18:01:42Z) - Enhanced Laser-Scan Matching with Online Error Estimation for Highway
and Tunnel Driving [0.0]
Lidarデータは、自動運転車やモバイルロボットプラットフォームのナビゲーションのためのポイントクラウドを生成するために使用できる。
本稿では,2つの新しい改良点を提供するスキャンマッチングアルゴリズムであるIterative Closest Ellipsoidal Transform (ICET)を提案する。
論文 参考訳(メタデータ) (2022-07-29T13:42:32Z) - Probabilistic Spherical Discriminant Analysis: An Alternative to PLDA
for length-normalized embeddings [8.073572195409866]
話者認識では、コサインスコアリング(cosine score)またはPLDA(PLDA)と呼ばれる2つのスコアリングバックエンドが一般的である。
我々は超球面上の Von Mises-Fisher 分布をクラス内分布とクラス間分布の両方に用いた PLDA の類似体 PSDA を提案する。
シングル・エンロールとマルチ・エンロールの検証を含むあらゆる種類の試行は、より複雑な確率比を含むことができる。
論文 参考訳(メタデータ) (2022-03-28T16:54:35Z) - Deep Bayesian ICP Covariance Estimation [3.5136071950790737]
イテレーティブクローズトポイント(ICP)ポイントクラウド登録アルゴリズムは、状態推定とセンサ融合のために不可欠である。
我々は、ICPの主なエラー源は、センサノイズからシーン形状に至るまで、入力データそのものにあると主張している。
近年の深層学習によるポイントクラウドの活用により,ICPのエラーモデルを学ぶためのデータ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2022-02-23T16:42:04Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Variational Hyper-Encoding Networks [62.74164588885455]
ニューラルネットワークパラメータの分布を符号化するHyperVAEというフレームワークを提案する。
遅延符号の後部分布を予測し,行列ネットワークデコーダを用いて後部分布q(theta)を生成する。
論文 参考訳(メタデータ) (2020-05-18T06:46:09Z) - Simple and Effective Prevention of Mode Collapse in Deep One-Class
Classification [93.2334223970488]
深部SVDDにおける超球崩壊を防止するための2つの正則化器を提案する。
第1の正則化器は、標準のクロスエントロピー損失によるランダムノイズの注入に基づいている。
第2の正規化器は、小さすぎるとミニバッチ分散をペナライズする。
論文 参考訳(メタデータ) (2020-01-24T03:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。