論文の概要: Reformulating Speaker Diarization as Community Detection With Emphasis
On Topological Structure
- arxiv url: http://arxiv.org/abs/2204.12112v1
- Date: Tue, 26 Apr 2022 07:18:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 20:11:35.178672
- Title: Reformulating Speaker Diarization as Community Detection With Emphasis
On Topological Structure
- Title(参考訳): 位相構造に着目した話者ダイアリゼーションのコミュニティ検出への応用
- Authors: Siqi Zheng, Hongbin Suo
- Abstract要約: クラスタリングベースの話者ダイアリゼーションは、現実において主要なアプローチの1つとして定着している。
本稿では,クラスタリングに基づくダイアリゼーションをコミュニティ検出問題とみなす。
- 参考スコア(独自算出の注目度): 10.508187462682308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering-based speaker diarization has stood firm as one of the major
approaches in reality, despite recent development in end-to-end diarization.
However, clustering methods have not been explored extensively for speaker
diarization. Commonly-used methods such as k-means, spectral clustering, and
agglomerative hierarchical clustering only take into account properties such as
proximity and relative densities. In this paper we propose to view
clustering-based diarization as a community detection problem. By doing so the
topological structure is considered. This work has four major contributions.
First it is shown that Leiden community detection algorithm significantly
outperforms the previous methods on the clustering of speaker-segments. Second,
we propose to use uniform manifold approximation to reduce dimension while
retaining global and local topological structure. Third, a masked filtering
approach is introduced to extract "clean" speaker embeddings. Finally, the
community structure is applied to an end-to-end post-processing network to
obtain diarization results. The final system presents a relative DER reduction
of up to 70 percent. The breakdown contribution of each component is analyzed.
- Abstract(参考訳): クラスタリングベースの話者ダイアリゼーションは、最近のエンドツーエンドダイアリゼーションの発展にもかかわらず、現実における主要なアプローチの1つとして定着している。
しかし,話者ダイアリゼーションのためのクラスタリング手法は広く検討されていない。
k平均、スペクトルクラスタリング、凝集階層クラスタリングなどの一般的な手法は、近接密度や相対密度などの特性のみを考慮に入れている。
本稿では,クラスタリングに基づくダイアリゼーションをコミュニティ検出問題として考察する。
これにより、トポロジカルな構造が考慮される。
この作品には4つの大きな貢献がある。
まず,ライデンコミュニティ検出アルゴリズムは,従来の話者セグメントのクラスタリング手法を大きく上回ることを示した。
第2に,大域的および局所的な位相構造を維持しながら次元を小さくするために一様多様体近似を用いることを提案する。
第3に,「クリーン」話者埋め込みを抽出するためのマスクフィルタリング手法を導入する。
最後に、コミュニティ構造をエンドツーエンドのポストプロセッシングネットワークに適用してダイアリゼーション結果を得る。
最終システムは、最大70%の相対的なDER削減を示す。
各コンポーネントの分解貢献を分析する。
関連論文リスト
- Supervised Hierarchical Clustering using Graph Neural Networks for
Speaker Diarization [41.30830281043803]
話者ダイアリゼーションのためのSupervised HierArchical gRaph Clusteringアルゴリズム(SHARC)を提案する。
本稿では,グラフニューラルネットワーク(GNN)を用いた階層構造を導入し,クラスタリングを行う。
教師付きクラスタリングは、ノード密度とエッジ存在確率を用いて、収束するまでセグメントをマージする。
論文 参考訳(メタデータ) (2023-02-24T16:16:41Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Perfect Spectral Clustering with Discrete Covariates [68.8204255655161]
本稿では,大規模なスパースネットワークのクラスにおいて,高い確率で完全クラスタリングを実現するスペクトルアルゴリズムを提案する。
本手法は,スペクトルクラスタリングによる一貫した潜在構造回復を保証する最初の方法である。
論文 参考訳(メタデータ) (2022-05-17T01:41:06Z) - Natural Hierarchical Cluster Analysis by Nearest Neighbors with
Near-Linear Time Complexity [0.0]
そこで本研究では,クラスタの自然な階層化を実現する,近接クラスタリングアルゴリズムを提案する。
集約的および分割的階層的クラスタリングアルゴリズムとは対照的に,我々のアプローチはアルゴリズムの反復的な動作に依存しない。
論文 参考訳(メタデータ) (2022-03-15T16:03:42Z) - Tight integration of neural- and clustering-based diarization through
deep unfolding of infinite Gaussian mixture model [84.57667267657382]
本稿では,統合フレームワークにトレーニング可能なクラスタリングアルゴリズムを導入する。
話者埋め込みはトレーニング中に最適化され、iGMMクラスタリングに適合する。
実験の結果,提案手法はダイアリゼーション誤差率において従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-02-14T07:45:21Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - End-to-End Speaker Diarization as Post-Processing [64.12519350944572]
クラスタリングに基づくダイアリゼーション手法は、フレームを話者数のクラスタに分割する。
いくつかのエンドツーエンドのダイアリゼーション手法は、問題をマルチラベル分類として扱うことで重なり合う音声を処理できる。
本稿では,クラスタリングによる結果の処理後処理として,2話者のエンドツーエンドダイアリゼーション手法を提案する。
論文 参考訳(メタデータ) (2020-12-18T05:31:07Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。