論文の概要: The Three Ensemble Clustering (3EC) Algorithm for Pattern Discovery in
Unsupervised Learning
- arxiv url: http://arxiv.org/abs/2107.03729v1
- Date: Thu, 8 Jul 2021 10:15:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-09 18:43:45.511682
- Title: The Three Ensemble Clustering (3EC) Algorithm for Pattern Discovery in
Unsupervised Learning
- Title(参考訳): 教師なし学習におけるパターン発見のための3組クラスタリング(EC)アルゴリズム
- Authors: Kundu, Debasish
- Abstract要約: 3つのアンサンブルクラスタリング3EC」アルゴリズムは、教師なし学習の一部として、ラベルなしデータを品質クラスタに分類する。
各分割クラスタは、新しいデータセットと見なされ、最も最適なアルゴリズムを探索する候補である。
ユーザは、さまざまな停止基準を試すことができ、最も意味のあるグループの品質クラスタを選択することができる。
- 参考スコア(独自算出の注目度): 1.0465883970481493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a multiple learner algorithm called the 'Three Ensemble
Clustering 3EC' algorithm that classifies unlabeled data into quality clusters
as a part of unsupervised learning. It offers the flexibility to explore the
context of new clusters formed by an ensemble of algorithms based on internal
validation indices.
It is worth mentioning that the input data set is considered to be a cluster
of clusters. An anomaly can possibly manifest as a cluster as well. Each
partitioned cluster is considered to be a new data set and is a candidate to
explore the most optimal algorithm and its number of partition splits until a
predefined stopping criteria is met. The algorithms independently partition the
data set into clusters and the quality of the partitioning is assessed by an
ensemble of internal cluster validation indices. The 3EC algorithm presents the
validation index scores from a choice of algorithms and its configuration of
partitions and it is called the Tau Grid. 3EC chooses the most optimal score.
The 3EC algorithm owes its name to the two input ensembles of algorithms and
internal validation indices and an output ensemble of final clusters.
Quality plays an important role in this clustering approach and it also acts
as a stopping criteria from further partitioning. Quality is determined based
on the quality of the clusters provided by an algorithm and its optimal number
of splits. The 3EC algorithm determines this from the score of the ensemble of
validation indices. The user can configure the stopping criteria by providing
quality thresholds for the score range of each of the validation indices and
the optimal size of the output cluster. The users can experiment with different
sets of stopping criteria and choose the most 'sensible group' of quality
clusters
- Abstract(参考訳): 本稿では,教師なし学習の一環として,ラベルなしデータを品質クラスタに分類する"three ensemble clustering 3ec"アルゴリズムを提案する。
内部検証指標に基づいたアルゴリズムの集合によって形成された新しいクラスタのコンテキストを探索する柔軟性を提供する。
入力データセットはクラスタのクラスタと考えられている点に注意が必要だ。
異常もクラスタとして現れる可能性がある。
各分割されたクラスタは、新しいデータセットと見なされ、事前定義された停止基準が満たされるまで最も最適なアルゴリズムとその分割数を探索する候補である。
アルゴリズムはデータセットを個別にクラスタに分割し、パーティショニングの品質は内部クラスタ検証指標のアンサンブルによって評価される。
3ecアルゴリズムはアルゴリズムの選択による検証指標スコアとパーティションの構成を示し、これをtauグリッドと呼ぶ。
3ECは最適なスコアを選択する。
3ECアルゴリズムは、アルゴリズムと内部検証指標の2つの入力アンサンブルと最終クラスタの出力アンサンブルに由来する。
このクラスタリングアプローチでは品質が重要な役割を担い、さらにパーティショニングの停止基準としても機能します。
品質はアルゴリズムによって提供されるクラスタの品質と最適な分割数に基づいて決定される。
3ECアルゴリズムは、検証指標のアンサンブルのスコアからこれを決定する。
ユーザは、各検証指標のスコア範囲と出力クラスタの最適サイズとに対して品質閾値を設けることにより、停止基準を設定することができる。
ユーザはさまざまな停止基準を試すことができ、品質クラスタの最も‘センシブルグループ’を選択することができる。
関連論文リスト
- A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T13:37:03Z) - Fuzzy K-Means Clustering without Cluster Centroids [79.19713746387337]
ファジィK平均クラスタリングは教師なしデータ解析において重要な計算手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィK平均クラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - From Large to Small Datasets: Size Generalization for Clustering
Algorithm Selection [12.993073967843292]
我々は,未知の地下構造クラスタリングを用いて,半教師付き環境で問題を研究する。
本稿では,クラスタリングアルゴリズムの精度向上のためのサイズ一般化の概念を提案する。
データセット全体においてどのアルゴリズムが最適かを特定するために、データの5%をサブサンプルとして使用しています。
論文 参考訳(メタデータ) (2024-02-22T06:53:35Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - SSDBCODI: Semi-Supervised Density-Based Clustering with Outliers
Detection Integrated [1.8444322599555096]
クラスタリング分析は、機械学習における重要なタスクの1つだ。
クラスタリングクラスタリングのパフォーマンスが、異常値によって著しく損なわれる可能性があるため、アルゴリズムは、異常値検出のプロセスを組み込もうとする。
我々は,半教師付き検出素子であるSSDBCODIを提案する。
論文 参考訳(メタデータ) (2022-08-10T21:06:38Z) - Fair Labeled Clustering [28.297893914525517]
クラスタリングのダウンストリーム適用と,そのような設定に対してグループフェアネスをどのように確保するかを検討する。
このような問題に対するアルゴリズムを提供し、グループフェアクラスタリングにおけるNPハードのアルゴリズムとは対照的に、効率的な解が可能であることを示す。
また、距離空間における中心位置に関係なく、意思決定者が自由にクラスタにラベルを割り当てることができるような、モチベーションのよい代替設定についても検討する。
論文 参考訳(メタデータ) (2022-05-28T07:07:12Z) - Ensemble Method for Cluster Number Determination and Algorithm Selection
in Unsupervised Learning [0.0]
教師なしの学習は、現場で使われる専門知識の必要性に悩まされる。
最小限の入力で活用できるアンサンブルクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-23T04:59:10Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - A semi-supervised sparse K-Means algorithm [3.04585143845864]
クラスタリングに必要な機能のサブグループを検出するために、教師なしスパースクラスタリング手法を用いることができる。
半教師付き手法では、ラベル付きデータを使用して制約を作成し、クラスタリングソリューションを強化することができる。
提案アルゴリズムは,他の半教師付きアルゴリズムの高性能性を保ち,また,情報的特徴から情報的特徴を識別する能力も保持していることを示す。
論文 参考訳(メタデータ) (2020-03-16T02:05:23Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。