論文の概要: Using the left Gram matrix to cluster high dimensional data
- arxiv url: http://arxiv.org/abs/2202.08236v1
- Date: Wed, 16 Feb 2022 18:31:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 14:26:18.801314
- Title: Using the left Gram matrix to cluster high dimensional data
- Title(参考訳): 左グラム行列を用いた高次元データのクラスタリング
- Authors: Shahina Rahman, Valen E. Johnson and Suhasini Subba Rao
- Abstract要約: 正規化左グラム行列 G = XX'/P に基づくクラスタリングアルゴリズムについて述べる。
これは NxN 行列 G に基づいているため、特徴行列 X のクラスタリングに基づく多くの手法よりも計算コストが低い。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For high dimensional data, where P features for N objects (P >> N) are
represented in an NxP matrix X, we describe a clustering algorithm based on the
normalized left Gram matrix, G = XX'/P. Under certain regularity conditions,
the rows in G that correspond to objects in the same cluster converge to the
same mean vector. By clustering on the row means, the algorithm does not
require preprocessing by dimension reduction or feature selection techniques
and does not require specification of tuning or hyperparameter values. Because
it is based on the NxN matrix G, it has a lower computational cost than many
methods based on clustering the feature matrix X. When compared to 14 other
clustering algorithms applied to 32 benchmarked microarray datasets, the
proposed algorithm provided the most accurate estimate of the underlying
cluster configuration more than twice as often as its closest competitors.
- Abstract(参考訳): N オブジェクト (P >> N) の P 特徴が NxP 行列 X で表現される高次元データに対して、正規化左文法行列 G = XX'/P に基づくクラスタリングアルゴリズムを記述する。
ある正則性条件の下では、同一クラスタ内のオブジェクトに対応するGの行は同じ平均ベクトルに収束する。
ロウ手段でクラスタリングすることで、アルゴリズムは次元縮小や特徴選択技術による前処理を必要とせず、チューニングやハイパーパラメータの仕様も必要としない。
nxn行列gに基づいており、特徴行列xのクラスタリングに基づく多くの方法よりも計算コストが低く、ベンチマークされた32のマイクロアレイデータセットに適用される他の14のクラスタリングアルゴリズムと比較すると、提案アルゴリズムは最も正確なクラスタ構成の推定を最も近い競合相手の2倍以上提供した。
関連論文リスト
- Superclustering by finding statistically significant separable groups of
optimal gaussian clusters [0.0]
本稿では,BIC基準の観点から,最適なデータセットをグループ化することで,データセットをクラスタリングするアルゴリズムを提案する。
このアルゴリズムの重要な利点は、既に訓練済みのクラスタに基づいて、新しいデータの正しいスーパークラスタを予測する能力である。
論文 参考訳(メタデータ) (2023-09-05T23:49:46Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - ck-means, a novel unsupervised learning method that combines fuzzy and
crispy clustering methods to extract intersecting data [1.827510863075184]
本稿では,2つの特徴以上の共通点を共有するデータをクラスタリングする手法を提案する。
この手法の主な考え方は、ファジィ C-Means (FCM) アルゴリズムを用いてファジィクラスタを生成することである。
このアルゴリズムはまた、シルエット指数(SI)によって与えられるクラスタの一貫性に従って、FCMとk平均アルゴリズムのための最適なクラスタ数を見つけることができる。
論文 参考訳(メタデータ) (2022-06-17T19:29:50Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - DRBM-ClustNet: A Deep Restricted Boltzmann-Kohonen Architecture for Data
Clustering [0.0]
DRBM-ClustNetと呼ばれるデータクラスタリングのためのベイジアンDeep Restricted Boltzmann-Kohonenアーキテクチャを提案する。
ラベルなしデータの処理は、非線形分離可能なデータセットの効率的なクラスタリングのために、3段階に分けて行われる。
このフレームワークはクラスタリングの精度に基づいて評価され、他の最先端クラスタリング手法と比較してランク付けされる。
論文 参考訳(メタデータ) (2022-05-13T15:12:18Z) - Optimal Variable Clustering for High-Dimensional Matrix Valued Data [3.1138411427556445]
本稿では,行列形式で配置された特徴に対して,新しい潜在変数モデルを提案する。
軽度条件下では,高次元設定でクラスタリングの整合性が得られる。
この重みを使用すれば、アルゴリズムが最小値の速度最適化であることが保証されるという意味で、最適な重みを識別する。
論文 参考訳(メタデータ) (2021-12-24T02:13:04Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Clustering of Nonnegative Data and an Application to Matrix Completion [0.0]
本研究では, それらの部分空間間の相関関係を, 一定の尺度で解析する。
我々は,クラスタリングアルゴリズムを用いて,ある自然条件を満たすデータ行列上で,標準的な行列補完アルゴリズムより優れている行列補完アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-09-02T18:24:47Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。