論文の概要: CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on
Multi-scale Data
- arxiv url: http://arxiv.org/abs/2006.04435v1
- Date: Mon, 8 Jun 2020 09:46:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 00:06:27.228281
- Title: CAST: A Correlation-based Adaptive Spectral Clustering Algorithm on
Multi-scale Data
- Title(参考訳): CAST:マルチスケールデータを用いた相関型適応スペクトルクラスタリングアルゴリズム
- Authors: Xiang Li, Ben Kao, Caihua Shan, Dawei Yin, Martin Ester
- Abstract要約: マルチスケールクラスタデータにスペクトルクラスタリングを適用する際の問題点について検討する。
マルチスケールデータの場合、スパースクラスタのオブジェクトが遠く離れているため、距離ベースの類似性は有効ではない。
係数行列を正規化するためにトレースラッソを適用するアルゴリズムCASTを提案する。
- 参考スコア(独自算出の注目度): 34.89460002735166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of applying spectral clustering to cluster multi-scale
data, which is data whose clusters are of various sizes and densities.
Traditional spectral clustering techniques discover clusters by processing a
similarity matrix that reflects the proximity of objects. For multi-scale data,
distance-based similarity is not effective because objects of a sparse cluster
could be far apart while those of a dense cluster have to be sufficiently
close. Following [16], we solve the problem of spectral clustering on
multi-scale data by integrating the concept of objects' "reachability
similarity" with a given distance-based similarity to derive an objects'
coefficient matrix. We propose the algorithm CAST that applies trace Lasso to
regularize the coefficient matrix. We prove that the resulting coefficient
matrix has the "grouping effect" and that it exhibits "sparsity". We show that
these two characteristics imply very effective spectral clustering. We evaluate
CAST and 10 other clustering methods on a wide range of datasets w.r.t. various
measures. Experimental results show that CAST provides excellent performance
and is highly robust across test cases of multi-scale data.
- Abstract(参考訳): 本研究では,クラスタの大きさや密度の異なるマルチスケールデータに対して,スペクトルクラスタリングを適用する問題について検討する。
従来のスペクトルクラスタリング技術は、オブジェクトの近接を反映した類似性行列を処理してクラスタを発見する。
マルチスケールデータでは、疎クラスターのオブジェクトは遠く離れる可能性があり、密集したクラスタのオブジェクトは十分近くでなければならないため、距離ベースの類似性は有効ではない。
対象の「到達可能性類似性」の概念と与えられた距離に基づく類似性を統合し、対象の係数行列を導出することにより、マルチスケールデータにおけるスペクトルクラスタリングの問題を解く。
係数行列を正規化するためにトレースラッソを適用するアルゴリズムCASTを提案する。
結果の係数行列が「群効果」を持ち、「疎らさ」を示すことを証明した。
これら2つの特徴は,非常に効果的なスペクトルクラスタリングを示す。
我々は,CASTと他の10のクラスタリング手法を,幅広いデータセットを用いて評価した。
実験結果から,CASTは優れた性能を示し,マルチスケールデータのテストケースでは非常に堅牢であることがわかった。
関連論文リスト
- Superclustering by finding statistically significant separable groups of
optimal gaussian clusters [0.0]
本稿では,BIC基準の観点から,最適なデータセットをグループ化することで,データセットをクラスタリングするアルゴリズムを提案する。
このアルゴリズムの重要な利点は、既に訓練済みのクラスタに基づいて、新しいデータの正しいスーパークラスタを予測する能力である。
論文 参考訳(メタデータ) (2023-09-05T23:49:46Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - LSEC: Large-scale spectral ensemble clustering [8.545202841051582]
本稿では,効率と効率のバランスを良くするために,大規模スペクトルアンサンブルクラスタリング(LSEC)手法を提案する。
LSEC法は既存のアンサンブルクラスタリング法よりも計算複雑性が低い。
論文 参考訳(メタデータ) (2021-06-18T00:42:03Z) - Divide-and-conquer based Large-Scale Spectral Clustering [8.545202841051582]
そこで本研究では,分散・分散型大規模スペクトルクラスタリング手法を提案し,効率と効率のバランスを良くする。
提案手法は,既存の大規模スペクトルクラスタリングよりも計算量が少ない。
論文 参考訳(メタデータ) (2021-04-30T15:09:45Z) - Multiscale Clustering of Hyperspectral Images Through Spectral-Spatial
Diffusion Geometry [9.619814126465206]
クラスタリングアルゴリズムはデータセットを類似点のグループに分割する。
本論文の主な貢献は,マルチスケール空間規則化拡散学習(M-SRDL)クラスタリングアルゴリズムである。
マルチスケールクラスタリングフレームワークに空間正規化を組み込むことは、hsiデータに適用するとより滑らかでより一貫性のあるクラスタに対応できることを示す。
論文 参考訳(メタデータ) (2021-03-29T17:24:28Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Spectral Clustering with Smooth Tiny Clusters [14.483043753721256]
本稿では,データのスムーズさを初めて考慮した新しいクラスタリングアルゴリズムを提案する。
私たちのキーとなるアイデアは、スムーズなグラフを構成する小さなクラスタをクラスタ化することです。
本稿では,マルチスケールな状況に着目するが,データのスムーズさの考え方はどのクラスタリングアルゴリズムにも確実に拡張できる。
論文 参考訳(メタデータ) (2020-09-10T05:21:20Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。