論文の概要: A Multi-disciplinary Ensemble Algorithm for Clustering Heterogeneous
Datasets
- arxiv url: http://arxiv.org/abs/2102.08361v1
- Date: Fri, 1 Jan 2021 07:20:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 11:05:51.696345
- Title: A Multi-disciplinary Ensemble Algorithm for Clustering Heterogeneous
Datasets
- Title(参考訳): 異種データセットのクラスタリングのための多分野アンサンブルアルゴリズム
- Authors: Bryar A. Hassan, Tarik A. Rashid
- Abstract要約: 本稿では,社会階級ランキングとメタヒューリスティックアルゴリズムに基づく進化的クラスタリングアルゴリズム(ECAStar)を提案する。
ECAStarは、再共生進化演算子、レヴィ飛行最適化、いくつかの統計技術と統合されている。
従来の5つのアプローチに対してECAStarを評価する実験を行った。
- 参考スコア(独自算出の注目度): 0.76146285961466
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Clustering is a commonly used method for exploring and analysing data where
the primary objective is to categorise observations into similar clusters. In
recent decades, several algorithms and methods have been developed for
analysing clustered data. We notice that most of these techniques
deterministically define a cluster based on the value of the attributes,
distance, and density of homogenous and single-featured datasets. However,
these definitions are not successful in adding clear semantic meaning to the
clusters produced. Evolutionary operators and statistical and
multi-disciplinary techniques may help in generating meaningful clusters. Based
on this premise, we propose a new evolutionary clustering algorithm (ECAStar)
based on social class ranking and meta-heuristic algorithms for stochastically
analysing heterogeneous and multiple-featured datasets. The ECAStar is
integrated with recombinational evolutionary operators, Levy flight
optimisation, and some statistical techniques, such as quartiles and
percentiles, as well as the Euclidean distance of the K-means algorithm.
Experiments are conducted to evaluate the ECAStar against five conventional
approaches: K-means (KM), K-meansPlusPlus (KMPlusPlus), expectation
maximisation (EM), learning vector quantisation (LVQ), and the genetic
algorithm for clusteringPlusPlus (GENCLUSTPlusPlus).
- Abstract(参考訳): クラスタリングは、観測を類似のクラスタに分類することが主な目的であるデータを探索し分析するための一般的な方法である。
近年,クラスタ化データを解析するためのアルゴリズムや手法が開発されている。
これらの手法のほとんどは、同種および単一機能データセットの属性、距離、密度の値に基づいて、決定論的にクラスタを定義する。
しかし、これらの定義は生成されたクラスタに明確な意味的意味を加えることに成功していない。
進化的演算子と統計学および多分野技術は有意義なクラスターを生成するのに役立つ。
この前提に基づいて,異種・多機能データセットを統計的に分析するための社会階級ランキングとメタヒューリスティックアルゴリズムに基づく進化的クラスタリングアルゴリズム(ECAStar)を提案する。
ecastarは、再共生進化演算子、レヴィ飛行の最適化、四量体やパーセンタイルなどの統計技術、およびk-meansアルゴリズムのユークリッド距離と統合されている。
k-means (km), k-meansplusplus (kmplusplus), expectation maximization (em), learning vector quantization (lvq), and the genetic algorithm for clusteringplusplus (genclustplus)の5つのアプローチに対してecastarを評価する実験を行った。
関連論文リスト
- Estimating the Optimal Number of Clusters in Categorical Data Clustering by Silhouette Coefficient [0.5939858158928473]
本稿では,分類データクラスタリングにおける最適kを推定するアルゴリズムk-SCCを提案する。
k-SCCの性能を比較するために, 合成データセットと実データセットの比較実験を行った。
論文 参考訳(メタデータ) (2025-01-26T14:29:11Z) - AdaptiveMDL-GenClust: A Robust Clustering Framework Integrating Normalized Mutual Information and Evolutionary Algorithms [0.0]
我々は,最小記述長(MDL)原理と遺伝的最適化アルゴリズムを組み合わせたロバストクラスタリングフレームワークを提案する。
このフレームワークは、初期クラスタリングソリューションを生成するためのアンサンブルクラスタリングアプローチから始まり、MDL誘導評価関数を使用して洗練され、遺伝的アルゴリズムによって最適化される。
実験の結果,従来のクラスタリング手法を一貫して上回り,精度の向上,安定性の向上,バイアス低減を実現している。
論文 参考訳(メタデータ) (2024-11-26T20:26:14Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - Performance evaluation results of evolutionary clustering algorithm star
for clustering heterogeneous datasets [15.154538450706474]
本稿では,進化的クラスタリングアルゴリズムstar(eca*)の性能評価のためのデータを提案する。
従来の5つのクラスタリングアルゴリズムに対するeca*の性能を調べるために、2つの実験手法が用いられた。
論文 参考訳(メタデータ) (2021-04-30T08:17:19Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Too Much Information Kills Information: A Clustering Perspective [6.375668163098171]
分散に基づくk-クラスタリングタスクに対して,k-平均クラスタリング(k-means clustering)が広く知られていることを含む,単純かつ斬新なアプローチを提案する。
提案手法は、与えられたデータセットからサンプリングサブセットを選択し、サブセット内のデータ情報のみに基づいて決定する。
ある仮定では、結果のクラスタリングは、高い確率で分散に基づく目的の最適度を推定するのに十分である。
論文 参考訳(メタデータ) (2020-09-16T01:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。