論文の概要: A Rapid Review of Clustering Algorithms
- arxiv url: http://arxiv.org/abs/2401.07389v1
- Date: Sun, 14 Jan 2024 23:19:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 18:33:46.644722
- Title: A Rapid Review of Clustering Algorithms
- Title(参考訳): クラスタリングアルゴリズムの迅速なレビュー
- Authors: Hui Yin, Amir Aryani, Stephen Petrie, Aishwarya Nambissan, Aland
Astudillo, Shengyuan Cao
- Abstract要約: クラスタリングアルゴリズムは、データ内の固有のパターンと類似性に基づいて、データをグループまたはクラスタにまとめることを目的としている。
それらは、マーケティングやeコマース、ヘルスケア、データ組織と分析、ソーシャルメディアなど、今日の生活において重要な役割を担っている。
既存のクラスタリングアルゴリズムを分析し、5つの異なる次元で主要なアルゴリズムを分類した。
- 参考スコア(独自算出の注目度): 5.46715422237599
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering algorithms aim to organize data into groups or clusters based on
the inherent patterns and similarities within the data. They play an important
role in today's life, such as in marketing and e-commerce, healthcare, data
organization and analysis, and social media. Numerous clustering algorithms
exist, with ongoing developments introducing new ones. Each algorithm possesses
its own set of strengths and weaknesses, and as of now, there is no universally
applicable algorithm for all tasks. In this work, we analyzed existing
clustering algorithms and classify mainstream algorithms across five different
dimensions: underlying principles and characteristics, data point assignment to
clusters, dataset capacity, predefined cluster numbers and application area.
This classification facilitates researchers in understanding clustering
algorithms from various perspectives and helps them identify algorithms
suitable for solving specific tasks. Finally, we discussed the current trends
and potential future directions in clustering algorithms. We also identified
and discussed open challenges and unresolved issues in the field.
- Abstract(参考訳): クラスタリングアルゴリズムは、データ内の固有のパターンと類似性に基づいて、データをグループまたはクラスタにまとめることを目的としている。
それらは、マーケティングやeコマース、ヘルスケア、データ組織と分析、ソーシャルメディアなど、今日の生活において重要な役割を担っている。
クラスタリングアルゴリズムは数多く存在し、新しいものを導入する開発が進行中である。
各アルゴリズムには独自の強みと弱みがあり、現在、すべてのタスクに普遍的に適用可能なアルゴリズムは存在しない。
本研究では,既存のクラスタリングアルゴリズムを分析し,基本原理と特徴,クラスタへのデータポイント割り当て,データセットのキャパシティ,クラスタ番号とアプリケーション領域という,5つの異なる次元にわたるメインストリームアルゴリズムを分類する。
この分類は、様々な観点からクラスタリングアルゴリズムを理解し、特定のタスクを解くのに適したアルゴリズムを特定するのに役立つ。
最後に,クラスタリングアルゴリズムの現状と今後の方向性について考察した。
また、オープンな課題と未解決の問題を特定し議論した。
関連論文リスト
- Fuzzy K-Means Clustering without Cluster Centroids [79.19713746387337]
ファジィK平均クラスタリングは教師なしデータ解析において重要な計算手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィK平均クラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Fairness Degrading Adversarial Attacks Against Clustering Algorithms [35.40427659749882]
そこで本研究では,k-medianクラスタリングのためのフェアネス劣化攻撃アルゴリズムを提案する。
生成した対数サンプルの追加により、フェアネス値が大幅に低下することが判明した。
論文 参考訳(メタデータ) (2021-10-22T19:10:27Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - Fair Clustering Using Antidote Data [35.40427659749882]
クラスタリングにおける公正性に対する代替的アプローチとして,アンチドテデータと呼ばれる少数のデータポイントで元のデータセットを拡大する手法を提案する。
我々のアルゴリズムは、他の最先端のフェアクラスタリングアルゴリズムと比較して、フェアネスコストと競合クラスタリング性能を低くする。
論文 参考訳(メタデータ) (2021-06-01T16:07:52Z) - DAC: Deep Autoencoder-based Clustering, a General Deep Learning
Framework of Representation Learning [0.0]
dac,deep autoencoder-based clustering,深層ニューロンネットワークを用いてクラスタリング表現を学ぶためのデータ駆動フレームワークを提案する。
実験結果から,KMeansクラスタリングアルゴリズムの性能をさまざまなデータセット上で効果的に向上させることができた。
論文 参考訳(メタデータ) (2021-02-15T11:31:00Z) - A black-box adversarial attack for poisoning clustering [78.19784577498031]
本稿では,クラスタリングアルゴリズムのロバスト性をテストするために,ブラックボックス対逆攻撃法を提案する。
我々の攻撃は、SVM、ランダムフォレスト、ニューラルネットワークなどの教師付きアルゴリズムに対しても転送可能であることを示す。
論文 参考訳(メタデータ) (2020-09-09T18:19:31Z) - A semi-supervised sparse K-Means algorithm [3.04585143845864]
クラスタリングに必要な機能のサブグループを検出するために、教師なしスパースクラスタリング手法を用いることができる。
半教師付き手法では、ラベル付きデータを使用して制約を作成し、クラスタリングソリューションを強化することができる。
提案アルゴリズムは,他の半教師付きアルゴリズムの高性能性を保ち,また,情報的特徴から情報的特徴を識別する能力も保持していることを示す。
論文 参考訳(メタデータ) (2020-03-16T02:05:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。