論文の概要: Siamese Neural Network with Joint Bayesian Model Structure for Speaker
Verification
- arxiv url: http://arxiv.org/abs/2104.03004v1
- Date: Wed, 7 Apr 2021 09:17:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 12:32:11.466038
- Title: Siamese Neural Network with Joint Bayesian Model Structure for Speaker
Verification
- Title(参考訳): 話者検証のための結合ベイズモデル構造をもつシームズニューラルネットワーク
- Authors: Xugang Lu, Peng Shen, Yu Tsao, Hisashi Kawai
- Abstract要約: 本稿では,話者検証のための新しいサイムズニューラルネットワーク(SiamNN)を提案する。
サンプルの結合分布は、JB(Joint Bayesian)に基づく生成モデルに基づいて最初に定式化される。
話者照合のための二項識別タスクとして,ペアワイズしたサンプルを用いてモデルパラメータを訓練する。
- 参考スコア(独自算出の注目度): 54.96267179988487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative probability models are widely used for speaker verification (SV).
However, the generative models are lack of discriminative feature selection
ability. As a hypothesis test, the SV can be regarded as a binary
classification task which can be designed as a Siamese neural network (SiamNN)
with discriminative training. However, in most of the discriminative training
for SiamNN, only the distribution of pair-wised sample distances is considered,
and the additional discriminative information in joint distribution of samples
is ignored. In this paper, we propose a novel SiamNN with consideration of the
joint distribution of samples. The joint distribution of samples is first
formulated based on a joint Bayesian (JB) based generative model, then a SiamNN
is designed with dense layers to approximate the factorized affine transforms
as used in the JB model. By initializing the SiamNN with the learned model
parameters of the JB model, we further train the model parameters with the
pair-wised samples as a binary discrimination task for SV. We carried out SV
experiments on data corpus of speakers in the wild (SITW) and VoxCeleb.
Experimental results showed that our proposed model improved the performance
with a large margin compared with state of the art models for SV.
- Abstract(参考訳): 生成確率モデルは話者検証(SV)に広く用いられている。
しかし、生成モデルは識別的特徴選択能力の欠如である。
仮説テストとして、SVは二分分類タスクと見なすことができ、識別訓練付きシームズニューラルネットワーク(SiamNN)として設計することができる。
しかし、samnnの判別訓練のほとんどにおいて、対方向のサンプル距離の分布のみを考慮し、サンプルの合同分布における追加の判別情報を無視する。
本稿では,サンプルの結合分布を考慮したSiamNNを提案する。
サンプルの結合分布は、結合ベイズ(JB)に基づく生成モデルに基づいて最初に定式化され、次に、SiamNNは、JBモデルで用いられる因子化アフィン変換を近似するために、密度層で設計される。
JBモデルの学習モデルパラメータを用いてSiamNNを初期化することにより、SVのバイナリ識別タスクとしてペアワイズ標本を用いてモデルパラメータをトレーニングする。
野生の話者のデータコーパス(SITW)とVoxCeleb(VoxCeleb)についてSV実験を行った。
実験の結果,提案したモデルでは,SVのアートモデルと比較すると,大きなマージンで性能が向上した。
関連論文リスト
- Diffusion-TTA: Test-time Adaptation of Discriminative Models via
Generative Feedback [97.0874638345205]
生成モデルは、識別モデルのための優れたテストタイムアダプタになり得る。
提案手法であるDiffusion-TTAは,事前学習した判別モデルを,テストセットの各未学習例に適応させる。
拡散-TTAは,様々な大規模事前学習型判別モデルの精度を著しく向上させることを示した。
論文 参考訳(メタデータ) (2023-11-27T18:59:53Z) - Optimal Transport Model Distributional Robustness [33.24747882707421]
これまでの研究は主に、データ空間における分散ロバスト性を活用することに焦点を当ててきた。
我々は、最適なロバストな中心モデル分布を学習できる理論を開発する。
我々のフレームワークはSharpness-Aware Minimizationの確率的拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-07T06:15:12Z) - A Hybrid of Generative and Discriminative Models Based on the
Gaussian-coupled Softmax Layer [5.33024001730262]
本稿では,1つのニューラルネットワークにおける識別モデルと生成モデルのハイブリッドを学習する手法を提案する。
提案手法を半教師付き学習と信頼性校正に適用できることを実証する。
論文 参考訳(メタデータ) (2023-05-10T05:48:22Z) - Equi-Tuning: Group Equivariant Fine-Tuning of Pretrained Models [56.88106830869487]
我々は、(潜在的に非同変な)事前訓練されたモデルを群同変モデルに変換する新しい微調整法である、同調を導入する。
本稿では、画像分類、合成言語における一般化、自然言語生成における公平性という3つの異なるタスクに対する等価チューニングの応用について述べる。
論文 参考訳(メタデータ) (2022-10-13T08:45:23Z) - A Statistical-Modelling Approach to Feedforward Neural Network Model Selection [0.8287206589886881]
フィードフォワードニューラルネットワーク(FNN)は非線形回帰モデルと見なすことができる。
FNNのためのベイズ情報基準(BIC)を用いて,新しいモデル選択法を提案する。
サンプル外性能よりもBICを選択することは、真のモデルを回復する確率を増大させる。
論文 参考訳(メタデータ) (2022-07-09T11:07:04Z) - Gradient-based Bayesian Experimental Design for Implicit Models using
Mutual Information Lower Bounds [20.393359858407162]
ベイズ実験設計のためのフレームワーク(BED)を暗黙のモデルで導入する。データ生成分布は難解だが、そこからのサンプリングは可能である。
このようなモデルに最適な実験設計を見つけるために、ニューラルネットワークがパラメータとする相互情報の低い境界を最大化します。
ニューラルネットワークをサンプルデータ上でトレーニングすることで,勾配アセンシングを用いたネットワークパラメータと設計を同時に更新する。
論文 参考訳(メタデータ) (2021-05-10T13:59:25Z) - Statistical inference of the inter-sample Dice distribution for
discriminative CNN brain lesion segmentation models [0.0]
識別畳み込みニューラルネットワーク(CNN)は多くの脳病変セグメンテーションタスクでよく機能している。
識別的CNNのセグメンテーションサンプリングは、訓練されたモデルの堅牢性を評価するために使用される。
厳格な信頼に基づく決定ルールが提案され、特定の患者に対してCNNモデルを拒絶するか受け入れるかが決定される。
論文 参考訳(メタデータ) (2020-12-04T18:18:24Z) - Statistical model-based evaluation of neural networks [74.10854783437351]
ニューラルネットワーク(NN)の評価のための実験装置を開発する。
このセットアップは、NNs vis-a-vis minimum-mean-square-error (MMSE)パフォーマンス境界のベンチマークに役立つ。
これにより、トレーニングデータサイズ、データ次元、データ幾何学、ノイズ、トレーニング条件とテスト条件のミスマッチの影響をテストできます。
論文 参考訳(メタデータ) (2020-11-18T00:33:24Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。