論文の概要: Performance evaluation results of evolutionary clustering algorithm star
for clustering heterogeneous datasets
- arxiv url: http://arxiv.org/abs/2105.02810v1
- Date: Fri, 30 Apr 2021 08:17:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 00:00:08.414516
- Title: Performance evaluation results of evolutionary clustering algorithm star
for clustering heterogeneous datasets
- Title(参考訳): 不均一データセットクラスタリングのための進化的クラスタリングアルゴリズムstarの性能評価結果
- Authors: Bryar A. Hassan, TarikA. Rashid, Seyedali Mirjalili
- Abstract要約: 本稿では,進化的クラスタリングアルゴリズムstar(eca*)の性能評価のためのデータを提案する。
従来の5つのクラスタリングアルゴリズムに対するeca*の性能を調べるために、2つの実験手法が用いられた。
- 参考スコア(独自算出の注目度): 15.154538450706474
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This article presents the data used to evaluate the performance of
evolutionary clustering algorithm star (ECA*) compared to five traditional and
modern clustering algorithms. Two experimental methods are employed to examine
the performance of ECA* against genetic algorithm for clustering++
(GENCLUST++), learning vector quantisation (LVQ) , expectation maximisation
(EM) , K-means++ (KM++) and K-means (KM). These algorithms are applied to 32
heterogenous and multi-featured datasets to determine which one performs well
on the three tests. For one, ther paper examines the efficiency of ECA* in
contradiction of its corresponding algorithms using clustering evaluation
measures. These validation criteria are objective function and cluster quality
measures. For another, it suggests a performance rating framework to measurethe
the performance sensitivity of these algorithms on varos dataset features
(cluster dimensionality, number of clusters, cluster overlap, cluster shape and
cluster structure). The contributions of these experiments are two-folds: (i)
ECA* exceeds its counterpart aloriths in ability to find out the right cluster
number; (ii) ECA* is less sensitive towards dataset features compared to its
competitive techniques. Nonetheless, the results of the experiments performed
demonstrate some limitations in the ECA*: (i) ECA* is not fully applied based
on the premise that no prior knowledge exists; (ii) Adapting and utilising ECA*
on several real applications has not been achieved yet.
- Abstract(参考訳): 本稿では、従来の5つのクラスタリングアルゴリズムと比較して、進化的クラスタリングアルゴリズムスター(ECA*)の性能を評価するために使用されるデータについて述べる。
クラスタリング++(GENCLUST++)、学習ベクトル量子化(LVQ)、期待最大化(EM)、K-means++(KM++)、K-means(KM)の遺伝的アルゴリズムに対するECA*の性能を実験的に検討する。
これらのアルゴリズムは32の異種および多機能データセットに適用され、3つのテストでどれがうまく機能するかを決定する。
例えば、therの論文は、クラスタリング評価尺度を用いて、対応するアルゴリズムと矛盾するeca*の効率を検証している。
これらの評価基準は客観的関数とクラスタ品質測定である。
また、varosデータセット機能(クラスタ次元、クラスタ数、クラスタ重なり、クラスタ形状、クラスタ構造)におけるこれらのアルゴリズムのパフォーマンス感度を測定するためのパフォーマンス評価フレームワークも提案している。
これらの実験の貢献は2つある: (i) ECA*は、正しいクラスタ番号を見つける能力において、対応するアロリスを超える; (ii) ECA*は、競合する技術に比べてデータセット機能に敏感でない。
にもかかわらず、実験の結果はECA*のいくつかの制限を証明している: (i) ECA* は、事前の知識が存在しないという前提に基づいて完全には適用されていない; (ii) ECA* を複数の実アプリケーションに適用し活用することは、まだ達成されていない。
関連論文リスト
- Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Comparison of Clustering Algorithms for Statistical Features of
Vibration Data Sets [0.4806505912512235]
振動データセットの時間と周波数領域から抽出した統計的特徴に対して,クラスタリングアルゴリズムK平均クラスタリング,OPTICS,およびガウス混合モデルクラスタリング(GMM)を広範囲に比較した。
本研究は, 平均的特徴(平均, 中間値), 分散的特徴(標準偏差, 原子間距離)が, 形状的特徴(骨格性, クルトーシス)よりも有意に優れていたことを示した。
クラスタ数の増加に伴い、クラスタリングアルゴリズムは、いくつかの特定のアルゴリズム制限があるにも関わらず、パフォーマンスが向上した。
論文 参考訳(メタデータ) (2023-05-11T12:19:30Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - A Novel Cluster Detection of COVID-19 Patients and Medical Disease
Conditions Using Improved Evolutionary Clustering Algorithm Star [0.9990687944474739]
我々は、現在の進化的クラスタリングアルゴリズムスター(ECA*)を3つの方法で改善する。
最先端アルゴリズムに対するiECA*の性能評価実験を行った。
論文 参考訳(メタデータ) (2021-09-20T12:47:09Z) - HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。
厳格なベンチマークのベストプラクティスに関する合意はありません。
このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文 参考訳(メタデータ) (2021-02-13T15:01:34Z) - A Multi-disciplinary Ensemble Algorithm for Clustering Heterogeneous
Datasets [0.76146285961466]
本稿では,社会階級ランキングとメタヒューリスティックアルゴリズムに基づく進化的クラスタリングアルゴリズム(ECAStar)を提案する。
ECAStarは、再共生進化演算子、レヴィ飛行最適化、いくつかの統計技術と統合されている。
従来の5つのアプローチに対してECAStarを評価する実験を行った。
論文 参考訳(メタデータ) (2021-01-01T07:20:50Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Contrastive Clustering [57.71729650297379]
本稿では,インスタンスレベルのコントラスト学習を明示的に行うContrastive Clustering (CC)を提案する。
特にCCは、CIFAR-10(CIFAR-100)データセット上で0.705(0.431)のNMIを達成しており、最高のベースラインと比較して最大19%(39%)のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-09-21T08:54:40Z) - Simple and Scalable Sparse k-means Clustering via Feature Ranking [14.839931533868176]
直感的で実装が簡単で,最先端のアルゴリズムと競合する,スパースk平均クラスタリングのための新しいフレームワークを提案する。
本手法は,属性のサブセットのクラスタリングや部分的に観測されたデータ設定など,タスク固有のアルゴリズムに容易に一般化できる。
論文 参考訳(メタデータ) (2020-02-20T02:41:02Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。