論文の概要: SPINEX-Clustering: Similarity-based Predictions with Explainable Neighbors Exploration for Clustering Problems
- arxiv url: http://arxiv.org/abs/2407.07222v1
- Date: Tue, 9 Jul 2024 20:38:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 18:31:06.478512
- Title: SPINEX-Clustering: Similarity-based Predictions with Explainable Neighbors Exploration for Clustering Problems
- Title(参考訳): SPINEXクラスタリング:クラスタリング問題に対する説明可能な近傍探索と類似性に基づく予測
- Authors: MZ Naser, Ahmed Naser,
- Abstract要約: 本稿ではSPINEXアルゴリズムファミリからの新しいクラスタリングアルゴリズムを提案する。
新たに提案されたクラスタリング変種は、複数のサブスペースにまたがる類似性と高次相互作用の概念を活用して、データをクラスタにグループ化する。
以上の結果から,SPINEXのクラスタリングアルゴリズムは,上位5位以内のクラスタリングアルゴリズムより優れ,難易度が高いことが示唆された。
- 参考スコア(独自算出の注目度): 3.2432648012273346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel clustering algorithm from the SPINEX (Similarity-based Predictions with Explainable Neighbors Exploration) algorithmic family. The newly proposed clustering variant leverages the concept of similarity and higher-order interactions across multiple subspaces to group data into clusters. To showcase the merit of SPINEX, a thorough set of benchmarking experiments was carried out against 13 algorithms, namely, Affinity Propagation, Agglomerative, Birch, DBSCAN, Gaussian Mixture, HDBSCAN, K-Means, KMedoids, Mean Shift, MiniBatch K-Means, OPTICS, Spectral Clustering, and Ward Hierarchical. Then, the performance of all algorithms was examined across 51 synthetic and real datasets from various domains, dimensions, and complexities. Furthermore, we present a companion complexity analysis to compare the complexity of SPINEX to that of the aforementioned algorithms. Our results demonstrate that SPINEX can outperform commonly adopted clustering algorithms by ranking within the top-5 best performing algorithms and has moderate complexity. Finally, a demonstration of the explainability capabilities of SPINEX, along with future research needs, is presented.
- Abstract(参考訳): 本稿では,SPINEX(Similarity-based Predictions with Explainable Neighbors Exploration)アルゴリズムの新たなクラスタリングアルゴリズムを提案する。
新たに提案されたクラスタリング変種は、複数のサブスペースにまたがる類似性と高次相互作用の概念を活用して、データをクラスタにグループ化する。
SPINEXの利点を示すために、Affinity Propagation, Agglomerative, Birch, DBSCAN, Gaussian Mixture, HDBSCAN, K-Means, KMedoids, Mean Shift, MiniBatch K-Means, OPTICS, Spectral Clustering, Ward Hierarchicalという13のアルゴリズムに対して、徹底的なベンチマーク実験を行った。
そして, 各種領域, 次元, 複雑度から合成された51個のデータセットに対して, 全アルゴリズムの性能について検討した。
さらに,SPINEXの複雑性と上記のアルゴリズムの複雑さを比較するために,相補的な複雑性解析を提案する。
以上の結果から,SPINEXのクラスタリングアルゴリズムは,上位5位以内のクラスタリングアルゴリズムより優れ,難易度が高いことが示唆された。
最後に,SPINEXにおける説明可能性の実証と今後の研究ニーズについて述べる。
関連論文リスト
- A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T13:37:03Z) - SPINEX: Similarity-based Predictions with Explainable Neighbors Exploration for Anomaly and Outlier Detection [3.2432648012273346]
本稿ではSPINEXファミリーの異常・異常検出アルゴリズムを提案する。
複数の部分空間にまたがる類似性や高次相互作用の概念を活用して、外接点を同定する。
SPINEXの性能を評価するための総合的な実験を行った。
論文 参考訳(メタデータ) (2024-07-05T17:42:09Z) - Fuzzy K-Means Clustering without Cluster Centroids [79.19713746387337]
ファジィK平均クラスタリングは教師なしデータ解析において重要な計算手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィK平均クラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - SPINEX: Similarity-based Predictions and Explainable Neighbors
Exploration for Regression and Classification Tasks in Machine Learning [1.5469452301122175]
本稿では,新しい類似性に基づく解釈可能な近傍探索アルゴリズムであるSPINEXを提案する。
アンサンブル学習と機能相互作用分析を組み合わせて、正確な予測と意味のある洞察を達成する。
その結果、SPINEXは比較性能を達成でき、いくつかのシナリオでは、一般的に採用されているMLアルゴリズムよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-01T14:40:56Z) - POCS-based Clustering Algorithm [0.0]
本稿では,POCSに基づくクラスタリングアルゴリズムと呼ばれる,POCS法に基づく新しいクラスタリング手法を提案する。
提案するクラスタリングアルゴリズムは,POCSの並列プロジェクション手法を利用して,特徴空間に適切なクラスタプロトタイプを求める。
提案するPOCSクラスタリングアルゴリズムの性能は, 各種合成データセットを用いた実験により検証した。
論文 参考訳(メタデータ) (2022-08-15T12:33:09Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Fast and explainable clustering based on sorting [0.0]
我々はCLASSIXと呼ばれる高速で説明可能なクラスタリング手法を提案する。
このアルゴリズムは2つのスカラーパラメータ、すなわちアグリゲーションのための距離パラメータと、最小クラスタサイズを制御する別のパラメータによって制御される。
実験により, CLASSIXは最先端クラスタリングアルゴリズムと競合することを示した。
論文 参考訳(メタデータ) (2022-02-03T08:24:21Z) - HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。
厳格なベンチマークのベストプラクティスに関する合意はありません。
このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文 参考訳(メタデータ) (2021-02-13T15:01:34Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。