論文の概要: Parametric entropy based Cluster Centriod Initialization for k-means
clustering of various Image datasets
- arxiv url: http://arxiv.org/abs/2308.07705v1
- Date: Tue, 15 Aug 2023 11:28:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 13:10:15.761705
- Title: Parametric entropy based Cluster Centriod Initialization for k-means
clustering of various Image datasets
- Title(参考訳): パラメトリックエントロピーに基づくクラスター遠心初期化による各種画像データセットのk平均クラスタリング
- Authors: Faheem Hussayn and Shahid M Shah
- Abstract要約: k-meansはクラスタ分析に最もよく使われているが、最も単純なアルゴリズムの1つである。
本稿では,パラメトリックエントロピーを用いた画像データ上でのk-meansの性能解析を行う。
一般画像データセットに対する最適適合エントロピー尺度を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the most employed yet simple algorithm for cluster analysis is the
k-means algorithm. k-means has successfully witnessed its use in artificial
intelligence, market segmentation, fraud detection, data mining, psychology,
etc., only to name a few. The k-means algorithm, however, does not always yield
the best quality results. Its performance heavily depends upon the number of
clusters supplied and the proper initialization of the cluster centroids or
seeds. In this paper, we conduct an analysis of the performance of k-means on
image data by employing parametric entropies in an entropy based centroid
initialization method and propose the best fitting entropy measures for general
image datasets. We use several entropies like Taneja entropy, Kapur entropy,
Aczel Daroczy entropy, Sharma Mittal entropy. We observe that for different
datasets, different entropies provide better results than the conventional
methods. We have applied our proposed algorithm on these datasets: Satellite,
Toys, Fruits, Cars, Brain MRI, Covid X-Ray.
- Abstract(参考訳): クラスタ分析に最もよく用いられるが、単純なアルゴリズムの1つはk-meansアルゴリズムである。
k-meansは、人工知能、市場セグメンテーション、不正検出、データマイニング、心理学などにおいて、その使用を成功裏に目撃した。
しかし、k-meansアルゴリズムは必ずしも最高の品質結果をもたらすとは限らない。
その性能は、供給されるクラスターの数と、クラスターセントロイドまたは種子の適切な初期化に大きく依存する。
本稿では,エントロピーに基づく遠心初期化法におけるパラメトリックエントロピーを用いて,画像データに対するk平均の性能解析を行い,一般画像データセットに対する最適な適合エントロピー対策を提案する。
我々は、Taneja entropy、Kapur entropy、Aczel Daroczy entropy、Sharma Mittal entropyなどのエントロピーを使用する。
異なるデータセットに対して、異なるエントロピーが従来の方法よりも優れた結果をもたらすことを観察する。
提案アルゴリズムをこれらのデータセットに適用した: Satellite, Toys, Fruits, Cars, Brain MRI, Covid X-Ray。
関連論文リスト
- Automated regime detection in multidimensional time series data using
sliced Wasserstein k-means clustering [0.0]
本稿では,時系列データに適用したWasserstein k-meansクラスタリングアルゴリズムの挙動について検討する。
我々は,多次元ワッサースタイン距離をスライスしたワッサーシュタイン距離として近似することにより,この手法を多次元時系列データに拡張する。
実数次元金融時系列において, sWk-means法は, 異なる市場状況を特定するのに有効であることを示す。
論文 参考訳(メタデータ) (2023-10-02T15:37:56Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - An enhanced method of initial cluster center selection for K-means
algorithm [0.0]
K-meansアルゴリズムの初期クラスタ選択を改善するための新しい手法を提案する。
Convex Hullアルゴリズムは、最初の2つのセントロイドの計算を容易にし、残りの2つは、以前選択された中心からの距離に応じて選択される。
We obtained only 7.33%, 7.90%, and 0% clustering error in Iris, Letter, and Ruspini data。
論文 参考訳(メタデータ) (2022-10-18T00:58:50Z) - How to Use K-means for Big Data Clustering? [2.1165011830664677]
K-meansはEuclidean Minimum Sum-of-Squares Clustering (MSSC)モデルの下で最もシンプルで広く使われているアルゴリズムである。
ビッグデータクラスタリングにK-means++アルゴリズムとK-means++アルゴリズムを用いる並列方式を提案する。
論文 参考訳(メタデータ) (2022-04-14T08:18:01Z) - Differentially-Private Clustering of Easy Instances [67.04951703461657]
異なるプライベートクラスタリングでは、個々のデータポイントに関する情報を公開せずに、$k$のクラスタセンターを特定することが目標だ。
我々は、データが"簡単"である場合にユーティリティを提供する実装可能な差分プライベートクラスタリングアルゴリズムを提供する。
我々は、非プライベートクラスタリングアルゴリズムを簡単なインスタンスに適用し、結果をプライベートに組み合わせることのできるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-29T08:13:56Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Clustering of Big Data with Mixed Features [3.3504365823045044]
我々は混合型の大規模データのための新しいクラスタリングアルゴリズムを開発した。
このアルゴリズムは、比較的低い密度値の外れ値とクラスターを検出することができる。
本研究では,本アルゴリズムが実際に有効であることを示す実験結果を示す。
論文 参考訳(メタデータ) (2020-11-11T19:54:38Z) - Differentially Private Clustering: Tight Approximation Ratios [57.89473217052714]
基本的なクラスタリング問題に対して,効率的な微分プライベートアルゴリズムを提案する。
この結果から,SampleとAggregateのプライバシーフレームワークのアルゴリズムの改善が示唆された。
1-Clusterアルゴリズムで使用されるツールの1つは、ClosestPairのより高速な量子アルゴリズムを適度な次元で得るために利用できる。
論文 参考訳(メタデータ) (2020-08-18T16:22:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。