論文の概要: A Robust Speaker Clustering Method Based on Discrete Tied Variational
Autoencoder
- arxiv url: http://arxiv.org/abs/2003.01955v1
- Date: Wed, 4 Mar 2020 08:54:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 13:54:10.516425
- Title: A Robust Speaker Clustering Method Based on Discrete Tied Variational
Autoencoder
- Title(参考訳): 離散結合型可変オートエンコーダに基づくロバスト話者クラスタリング法
- Authors: Chen Feng, Jianzong Wang, Tongxu Li, Junqing Peng, Jing Xiao
- Abstract要約: 集約階層クラスタ(AHC)に基づく従来の話者クラスタリング手法は、長時間実行の欠点があり、環境騒音に敏感である。
本稿では,相互情報(MI)に基づく新しい話者クラスタリング手法と,雑音に対するロバスト性を高めるためにタイド変分オートエンコーダ(TVAE)の啓蒙の下で,離散変数を持つ非線形モデルを提案する。
- 参考スコア(独自算出の注目度): 27.211505187332385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the speaker clustering model based on aggregation hierarchy cluster
(AHC) is a common method to solve two main problems: no preset category number
clustering and fix category number clustering. In general, model takes features
like i-vectors as input of probability and linear discriminant analysis model
(PLDA) aims to form the distance matric in long voice application scenario, and
then clustering results are obtained through the clustering model. However,
traditional speaker clustering method based on AHC has the shortcomings of
long-time running and remains sensitive to environment noise. In this paper, we
propose a novel speaker clustering method based on Mutual Information (MI) and
a non-linear model with discrete variable, which under the enlightenment of
Tied Variational Autoencoder (TVAE), to enhance the robustness against noise.
The proposed method named Discrete Tied Variational Autoencoder (DTVAE) which
shortens the elapsed time substantially. With experience results, it
outperforms the general model and yields a relative Accuracy (ACC) improvement
and significant time reduction.
- Abstract(参考訳): 近年、アグリゲーション階層クラスタ(AHC)に基づく話者クラスタリングモデルは、プリセットされたカテゴリ番号クラスタリングと固定されたカテゴリ番号クラスタリングの2つの主要な問題を解決する一般的な方法である。
一般に,iベクターのような特徴を確率の入力として用い,PLDA(線形判別分析モデル)は長距離音声アプリケーションシナリオにおいて距離行列を形成し,クラスタリングモデルを用いてクラスタリング結果を得る。
しかし、AHCに基づく従来の話者クラスタリング手法は、長時間実行の欠点があり、環境騒音に敏感である。
本稿では,相互情報(MI)に基づく新しい話者クラスタリング手法と,雑音に対するロバスト性を高めるためにTVAE(Tied Variational Autoencoder)の啓蒙の下で,離散変数を持つ非線形モデルを提案する。
提案手法はDTVAE (Disdisrete Tied Variational Autoencoder) と呼ばれ,時間経過を大幅に短縮する。
経験結果により、一般的なモデルよりも優れ、相対的精度(ACC)の改善と大幅な時間短縮をもたらす。
関連論文リスト
- Dynamic Clustering and Cluster Contrastive Learning for Unsupervised
Person Re-identification [29.167783500369442]
教師なしRe-ID手法は、ラベルのないデータから堅牢で差別的な特徴を学習することを目的としている。
本稿では,動的クラスタリングとクラスタコントラスト学習(DCCC)手法を提案する。
提案したDCCCの有効性を検証するために, 広く利用されている複数の公開データセットの実験を行った。
論文 参考訳(メタデータ) (2023-03-13T01:56:53Z) - Highly Efficient Real-Time Streaming and Fully On-Device Speaker
Diarization with Multi-Stage Clustering [18.62774420511154]
異なる長さの入力に異なるクラスタリングアルゴリズムを使用するマルチステージクラスタリング戦略は、話者ダイアリゼーションアプリケーションの多面的課題に対処することができる。
この戦略は、CPU、メモリ、バッテリの予算が厳しいオンデバイススピーカーダイアリゼーションシステムのストリーミングに不可欠である。
論文 参考訳(メタデータ) (2022-10-25T01:20:24Z) - Tight integration of neural- and clustering-based diarization through
deep unfolding of infinite Gaussian mixture model [84.57667267657382]
本稿では,統合フレームワークにトレーニング可能なクラスタリングアルゴリズムを導入する。
話者埋め込みはトレーニング中に最適化され、iGMMクラスタリングに適合する。
実験の結果,提案手法はダイアリゼーション誤差率において従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-02-14T07:45:21Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - IB-GAN: A Unified Approach for Multivariate Time Series Classification
under Class Imbalance [1.854931308524932]
GAN(Generative Adversarial Networks)による非パラメトリックデータ拡張は、有望なソリューションを提供する。
本稿では,データ拡張と分類を1段階のプロセスで結合する新しい手法であるImputation Balanced GAN(IB-GAN)を提案する。
論文 参考訳(メタデータ) (2021-10-14T15:31:16Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - Unsupervised Clustered Federated Learning in Complex Multi-source
Acoustic Environments [75.8001929811943]
現実的で挑戦的なマルチソース・マルチルーム音響環境を導入する。
本稿では,音響シーンの変動を考慮したクラスタリング制御手法を提案する。
提案手法はクラスタリングに基づく測度を用いて最適化され,ネットワークワイド分類タスクによって検証される。
論文 参考訳(メタデータ) (2021-06-07T14:51:39Z) - Progressive Cluster Purification for Unsupervised Feature Learning [48.87365358296371]
教師なしの特徴学習では、サンプル特異性に基づく手法はクラス間の情報を無視する。
本稿では,プログレッシブクラスタ形成時にクラス不整合サンプルを除外するクラスタリングに基づく新しい手法を提案する。
我々の手法は、プログレッシブ・クラスタ・パーフィケーション(PCP)と呼ばれ、訓練中に徐々にクラスタ数を減らし、プログレッシブ・クラスタリングを実装している。
論文 参考訳(メタデータ) (2020-07-06T08:11:03Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z) - Autoencoder-based time series clustering with energy applications [0.0]
時系列クラスタリングは、データの特定の性質のため、難しい作業である。
本稿では,畳み込み型オートエンコーダとk-メノイドアルゴリズムの組み合わせによる時系列クラスタリングについて検討する。
論文 参考訳(メタデータ) (2020-02-10T10:04:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。