論文の概要: Randomized Spectral Clustering in Large-Scale Stochastic Block Models
- arxiv url: http://arxiv.org/abs/2002.00839v3
- Date: Thu, 6 Jan 2022 16:04:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 05:14:06.892035
- Title: Randomized Spectral Clustering in Large-Scale Stochastic Block Models
- Title(参考訳): 大規模確率ブロックモデルにおけるランダム化スペクトルクラスタリング
- Authors: Hai Zhang and Xiao Guo and Xiangyu Chang
- Abstract要約: 統計的観点からランダム化されたスケッチアルゴリズムを用いてスペクトルクラスタリングについて検討する。
弱い条件下では、ランダム化されたスペクトルクラスタリングアルゴリズムは、元のスペクトルクラスタリングアルゴリズムと同じ理論的境界に導かれる。
Rclustと呼ばれる新しいRパッケージが開発され、一般に公開されている。
- 参考スコア(独自算出の注目度): 13.366036495177923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spectral clustering has been one of the widely used methods for community
detection in networks. However, large-scale networks bring computational
challenges to the eigenvalue decomposition therein. In this paper, we study the
spectral clustering using randomized sketching algorithms from a statistical
perspective, where we typically assume the network data are generated from a
stochastic block model that is not necessarily of full rank. To do this, we
first use the recently developed sketching algorithms to obtain two randomized
spectral clustering algorithms, namely, the random projection-based and the
random sampling-based spectral clustering. Then we study the theoretical bounds
of the resulting algorithms in terms of the approximation error for the
population adjacency matrix, the misclassification error, and the estimation
error for the link probability matrix. It turns out that, under mild
conditions, the randomized spectral clustering algorithms lead to the same
theoretical bounds as those of the original spectral clustering algorithm. We
also extend the results to degree-corrected stochastic block models. Numerical
experiments support our theoretical findings and show the efficiency of
randomized methods. A new R package called Rclust is developed and made
available to the public.
- Abstract(参考訳): スペクトルクラスタリングは、ネットワーク内で広く使われているコミュニティ検出手法の1つである。
しかし、大規模ネットワークは固有値分解に計算課題をもたらす。
本稿では,統計学的観点からランダム化スケッチアルゴリズムを用いたスペクトルクラスタリングについて検討し,ネットワークデータは必ずしも完全ランクではない確率的ブロックモデルから生成されると仮定する。
そこで我々は,最近開発したスケッチアルゴリズムを用いて,ランダム投影法とランダムサンプリング法によるスペクトルクラスタリング法という2つのランダム化スペクトルクラスタリングアルゴリズムを得た。
次に, 集団隣接行列に対する近似誤差, 誤分類誤差, リンク確率行列に対する推定誤差の観点から, 得られたアルゴリズムの理論的境界について検討する。
穏やかな条件下では、ランダム化されたスペクトルクラスタリングアルゴリズムは、元のスペクトルクラスタリングアルゴリズムと同じ理論的境界をもたらすことが判明した。
また、結果を次数補正確率ブロックモデルに拡張する。
数値実験は理論的な知見をサポートし,ランダム化手法の効率を示す。
Rclustと呼ばれる新しいRパッケージが開発され、一般に公開されている。
関連論文リスト
- Consistency of Lloyd's Algorithm Under Perturbations [11.56433365648479]
ロイドのアルゴリズムは最も広く使われているクラスタリングアルゴリズムの1つである。
準ガウス混合のサンプルに対するロイドのアルゴリズムの誤クラスタリング速度は、$O(log(n))$ iterationsの後に指数関数的に有界であることを示す。
論文 参考訳(メタデータ) (2023-09-01T16:45:52Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - A Distributed Block Chebyshev-Davidson Algorithm for Parallel Spectral
Clustering [7.632758664232665]
スペクトルクラスタリングにおけるスペクトル解析のための大規模先行固有値問題の解法として,分散Block Chebyshev-Davidsonアルゴリズムを開発した。
チェビシェフ・ダビッドソンアルゴリズムの効率は、推定にコストがかかる固有値スペクトルの事前の知識に依存している。
分散バージョンと並列バージョンは、魅力的なスケーラビリティで開発されている。
論文 参考訳(メタデータ) (2022-12-08T18:06:13Z) - Perfect Spectral Clustering with Discrete Covariates [68.8204255655161]
本稿では,大規模なスパースネットワークのクラスにおいて,高い確率で完全クラスタリングを実現するスペクトルアルゴリズムを提案する。
本手法は,スペクトルクラスタリングによる一貫した潜在構造回復を保証する最初の方法である。
論文 参考訳(メタデータ) (2022-05-17T01:41:06Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - Spectral clustering under degree heterogeneity: a case for the random
walk Laplacian [83.79286663107845]
本稿では,ランダムウォークラプラシアンを用いたグラフスペクトル埋め込みが,ノード次数に対して完全に補正されたベクトル表現を生成することを示す。
次数補正ブロックモデルの特別な場合、埋め込みはK個の異なる点に集中し、コミュニティを表す。
論文 参考訳(メタデータ) (2021-05-03T16:36:27Z) - Spectral clustering on spherical coordinates under the degree-corrected
stochastic blockmodel [5.156484100374058]
次数補正ブロックモデルに基づく新しいスペクトルクラスタリングアルゴリズムを提案する。
その結果,コンピュータネットワークにおける競合手法よりも性能が向上した。
論文 参考訳(メタデータ) (2020-11-09T16:55:38Z) - Spectral Clustering using Eigenspectrum Shape Based Nystrom Sampling [19.675277307158435]
本稿では,新しいサンプリング手法であるCentroid Minimum Sum of Squared similarities (CMS3)と,それをいつ使用するかを示す,スケーラブルなNystromベースのクラスタリングアルゴリズムを提案する。
我々のデータセットはデータセットの固有スペクトル形状に依存しており、他の最先端手法と比較して、テストにおいて競合する低ランク近似が得られる。
論文 参考訳(メタデータ) (2020-07-21T17:49:03Z) - Randomized spectral co-clustering for large-scale directed networks [15.486507430729052]
共同クラスタリングは、有向ネットワークの送信者と受信者を同時にクラスタ化することを目的としている。
スケッチ技術を活用し、2つのランダム化スペクトルコクラスタリングアルゴリズムを導出する。
我々は、それらの近似誤差率と誤クラスタリング誤差率を確立し、共クラスタリング文学の最先端結果よりも優れた境界を示す。
論文 参考訳(メタデータ) (2020-04-25T15:00:55Z) - Optimal Randomized First-Order Methods for Least-Squares Problems [56.05635751529922]
このアルゴリズムのクラスは、最小二乗問題に対する最も高速な解法のうち、いくつかのランダム化手法を含んでいる。
我々は2つの古典的埋め込み、すなわちガウス射影とアダマール変換のサブサンプリングに焦点を当てる。
得られたアルゴリズムは条件数に依存しない最小二乗問題の解法として最も複雑である。
論文 参考訳(メタデータ) (2020-02-21T17:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。