論文の概要: Ball k-means
- arxiv url: http://arxiv.org/abs/2005.00784v1
- Date: Sat, 2 May 2020 10:39:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 12:08:58.693836
- Title: Ball k-means
- Title(参考訳): ボールk-means
- Authors: Shuyin Xia, Daowan Peng, Deyu Meng, Changqing Zhang, Guoyin Wang,
Zizhong Chen, Wei Wei
- Abstract要約: Ball k-meansアルゴリズムは、ポイントセントロイド距離計算の削減に集中して、クラスタを記述するためにボールを使用する。
高速、余分なパラメータなし、単純設計のボールk平均アルゴリズムは、素早いk平均アルゴリズムを全面的に置き換える。
- 参考スコア(独自算出の注目度): 53.89505717006118
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel accelerated exact k-means algorithm called the
Ball k-means algorithm, which uses a ball to describe a cluster, focusing on
reducing the point-centroid distance computation. The Ball k-means can
accurately find the neighbor clusters for each cluster resulting distance
computations only between a point and its neighbor clusters' centroids instead
of all centroids. Moreover, each cluster can be divided into a stable area and
an active area, and the later one can be further divided into annulus areas.
The assigned cluster of the points in the stable area is not changed in the
current iteration while the points in the annulus area will be adjusted within
a few neighbor clusters in the current iteration. Also, there are no upper or
lower bounds in the proposed Ball k-means. Furthermore, reducing
centroid-centroid distance computation between iterations makes it efficient
for large k clustering. The fast speed, no extra parameters and simple design
of the Ball k-means make it an all-around replacement of the naive k-means
algorithm.
- Abstract(参考訳): 本稿では,ボールを用いてクラスタを記述し,ポイントセントロイド距離計算の削減に焦点をあてた,高速なk-meansアルゴリズムであるBall k-meansアルゴリズムを提案する。
ボールk平均は、各クラスタの隣接クラスタを正確に見つけることができ、結果として、すべてのcentroidではなく、ポイントとその隣接クラスタのcentroid間の距離計算が行われる。
さらに、各クラスターを安定した領域と活発な領域に分けることができ、後者はさらに環状領域に分けることができる。
安定領域内のポイントの割り当てられたクラスタは、現在のイテレーションでは変更されず、アンギュラス領域のポイントは、現在のイテレーションでいくつかの隣のクラスタ内で調整される。
また、提案する球体 k-平均には上界や下界はない。
さらに、イテレーション間の遠心距離計算の削減は、大規模なkクラスタリングに効率的である。
高速、余分なパラメータなし、ボール k-means の単純な設計により、ナイーブ k-means アルゴリズムを全周的に置き換えることができる。
関連論文リスト
- Accelerating k-Means Clustering with Cover Trees [0.30693357740321775]
表木指数に基づく新しいk-meansアルゴリズムを提案し, オーバーヘッドが比較的低く, 性能も良好である。
木集約と境界に基づくフィルタリングの利点を組み合わせたハイブリッドアルゴリズムを得る。
論文 参考訳(メタデータ) (2024-10-19T14:02:42Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - An enhanced method of initial cluster center selection for K-means
algorithm [0.0]
K-meansアルゴリズムの初期クラスタ選択を改善するための新しい手法を提案する。
Convex Hullアルゴリズムは、最初の2つのセントロイドの計算を容易にし、残りの2つは、以前選択された中心からの距離に応じて選択される。
We obtained only 7.33%, 7.90%, and 0% clustering error in Iris, Letter, and Ruspini data。
論文 参考訳(メタデータ) (2022-10-18T00:58:50Z) - A density peaks clustering algorithm with sparse search and K-d tree [16.141611031128427]
この問題を解決するために,スパース探索とK-d木を用いた密度ピーククラスタリングアルゴリズムを開発した。
分散特性が異なるデータセット上で、他の5つの典型的なクラスタリングアルゴリズムと比較して実験を行う。
論文 参考訳(メタデータ) (2022-03-02T09:29:40Z) - K-Splits: Improved K-Means Clustering Algorithm to Automatically Detect
the Number of Clusters [0.12313056815753944]
本稿では,k-meansに基づく改良された階層型アルゴリズムであるk-splitsを紹介する。
提案手法の主な利点は,精度と速度である。
論文 参考訳(メタデータ) (2021-10-09T23:02:57Z) - Accelerating Spherical k-Means [1.7188280334580197]
球k平均(Spherical k-means)は、文書ベクトルのようなスパースおよび高次元データのためのクラスタリングアルゴリズムである。
エルカンとハマーリーのアルゴリズムのような多くの加速技術はユークリッド距離の三角形の不等式に依存している。
本稿では,エルカンとハメリーの加速度をユークリッド距離の代わりにコサインと直接連携する球k平均アルゴリズムに組み込む。
論文 参考訳(メタデータ) (2021-07-08T19:24:09Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - (k, l)-Medians Clustering of Trajectories Using Continuous Dynamic Time
Warping [57.316437798033974]
本研究では,トラジェクトリの集中型クラスタリングの問題について考察する。
我々はDTWの連続バージョンを距離測定として使用することを提案し、これをCDTW(Continuous dynamic time warping)と呼ぶ。
一連の軌道から中心を計算し、その後反復的に改善する実践的な方法を示す。
論文 参考訳(メタデータ) (2020-12-01T13:17:27Z) - Differentially Private Clustering: Tight Approximation Ratios [57.89473217052714]
基本的なクラスタリング問題に対して,効率的な微分プライベートアルゴリズムを提案する。
この結果から,SampleとAggregateのプライバシーフレームワークのアルゴリズムの改善が示唆された。
1-Clusterアルゴリズムで使用されるツールの1つは、ClosestPairのより高速な量子アルゴリズムを適度な次元で得るために利用できる。
論文 参考訳(メタデータ) (2020-08-18T16:22:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。