論文の概要: Self-Tuning Spectral Clustering for Speaker Diarization
- arxiv url: http://arxiv.org/abs/2410.00023v1
- Date: Mon, 16 Sep 2024 05:07:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 15:29:12.972314
- Title: Self-Tuning Spectral Clustering for Speaker Diarization
- Title(参考訳): 話者ダイアリゼーションのためのセルフチューニングスペクトルクラスタリング
- Authors: Nikhil Raghav, Avisek Gupta, Md Sahidullah, Swagatam Das,
- Abstract要約: 我々は,p近傍の親和性行列(SC-pNA)上に,Emphspectral clusteringと呼ばれるスパース親和性行列を生成する新しいプルーニングアルゴリズムを提案する。
提案手法は,外部チューニングデータの必要性を排除し,ノード固有の固定近傍選択を改善する。
挑戦的なDIHARD-IIIデータセットの実験結果は、SC-pNAの優位性を強調している。
- 参考スコア(独自算出の注目度): 19.487611671681968
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spectral clustering has proven effective in grouping speech representations for speaker diarization tasks, although post-processing the affinity matrix remains difficult due to the need for careful tuning before constructing the Laplacian. In this study, we present a novel pruning algorithm to create a sparse affinity matrix called \emph{spectral clustering on p-neighborhood retained affinity matrix} (SC-pNA). Our method improves on node-specific fixed neighbor selection by allowing a variable number of neighbors, eliminating the need for external tuning data as the pruning parameters are derived directly from the affinity matrix. SC-pNA does so by identifying two clusters in every row of the initial affinity matrix, and retains only the top $p\%$ similarity scores from the cluster containing larger similarities. Spectral clustering is performed subsequently, with the number of clusters determined as the maximum eigengap. Experimental results on the challenging DIHARD-III dataset highlight the superiority of SC-pNA, which is also computationally more efficient than existing auto-tuning approaches.
- Abstract(参考訳): スペクトルクラスタリングは話者ダイアリゼーションタスクの音声表現をグループ化するのに有効であることが証明されている。
本研究では,p近傍の親和性マトリクス(SC-pNA)上に,疎親和性マトリクス(emph{spectral clustering)と呼ばれる疎親和性マトリクス(sparse affinity matrix)を作成する新しいプルーニングアルゴリズムを提案する。
提案手法は,隣接変数の可変数を許容し,親和性行列から直接プルーニングパラメータを導出する外部チューニングデータを不要にすることで,ノード固有の固定近傍選択を改善する。
SC-pNAは初期親和性行列の各行に2つのクラスタを識別し、より大きな類似性を含むクラスタの上位$p\%$類似性スコアのみを保持する。
その後、スペクトルクラスタリングが行われ、最大固有ギャップとして決定されるクラスタの数が決定される。
挑戦的なDIHARD-IIIデータセットの実験結果は、既存の自動チューニング手法よりも計算効率が高いSC-pNAの優位性を強調している。
関連論文リスト
- Heteroskedastic Tensor Clustering [20.979358557219953]
我々は、$mathsfHightext-orderHeteroClustering$$mathsfHHC$という2段階の手法を提案する。
まず、$mathsfThresholdedDeflatedtext-HeteroPCA$と呼ばれる新しいスペクトルアルゴリズムを使ってテンソル部分空間の推定を行い、続いてクラスタノードを取得するためにおよそ$k$-meansを実行する。
我々のアルゴリズムは、SNRが計算限界を超える限り、正確なクラスタリングを確実に達成する。
論文 参考訳(メタデータ) (2023-11-04T02:50:40Z) - Superclustering by finding statistically significant separable groups of
optimal gaussian clusters [0.0]
本稿では,BIC基準の観点から,最適なデータセットをグループ化することで,データセットをクラスタリングするアルゴリズムを提案する。
このアルゴリズムの重要な利点は、既に訓練済みのクラスタに基づいて、新しいデータの正しいスーパークラスタを予測する能力である。
論文 参考訳(メタデータ) (2023-09-05T23:49:46Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Local Sample-weighted Multiple Kernel Clustering with Consensus
Discriminative Graph [73.68184322526338]
マルチカーネルクラスタリング(MKC)は、ベースカーネルの集合から最適な情報融合を実現するためにコミットされる。
本稿では,新しい局所サンプル重み付きマルチカーネルクラスタリングモデルを提案する。
実験により, LSWMKCはより優れた局所多様体表現を有し, 既存のカーネルやグラフベースのクラスタリングアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T05:00:38Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Improving Spectral Clustering Using Spectrum-Preserving Node Reduction [1.52292571922932]
我々は、スペクトル保存ノード還元を用いて固有分解を加速し、データセットの簡潔な表現を生成する。
実験の結果,最先端手法と比較してクラスタリング性能が劇的に向上した。
論文 参考訳(メタデータ) (2021-10-24T01:43:12Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Doubly Stochastic Subspace Clustering [9.815735805354905]
多くの最先端サブスペースクラスタリング法は、まずデータポイント間の親和性行列を構築し、その親和性にスペクトルクラスタリングを適用することによって、2段階のプロセスに従う。
本研究では、データの自己表現表現と、スペクトルクラスタリングによく正規化された親和性行列の両方を学習する。
実験により,コンピュータビジョンにおける多くの共通データセットに対して,最先端のサブスペースクラスタリング性能が得られた。
論文 参考訳(メタデータ) (2020-11-30T14:56:54Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Auto-Tuning Spectral Clustering for Speaker Diarization Using Normalized
Maximum Eigengap [43.82618103722998]
本稿では,話者ダイアリゼーションの文脈において,クラスタリングアルゴリズムのパラメータを自動チューニングできる新しいスペクトルクラスタリングフレームワークを提案する。
CALLHOME評価セットにおける話者誤り率の17%の相対的な改善は,自動チューニングによるスペクトルクラスタリングの有効性を示す。
論文 参考訳(メタデータ) (2020-03-05T02:50:37Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。