論文の概要: Semi-Supervised Constrained Clustering: An In-Depth Overview, Ranked
Taxonomy and Future Research Directions
- arxiv url: http://arxiv.org/abs/2303.00522v1
- Date: Tue, 28 Feb 2023 17:46:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-02 14:29:03.465221
- Title: Semi-Supervised Constrained Clustering: An In-Depth Overview, Ranked
Taxonomy and Future Research Directions
- Title(参考訳): 半教師付き制約付きクラスタリング:詳細な概要と分類と今後の研究方向
- Authors: Germ\'an Gonz\'alez-Almagro, Daniel Peralta, Eli De Poorter,
Jos\'e-Ram\'on Cano, Salvador Garc\'ia
- Abstract要約: 制約クラスタリングの研究領域は、長年にわたって大きく成長してきた。
利用可能なさまざまなメソッド、制約、ベンチマークを簡単に理解するために、統一された概要は提供されていない。
本研究では,制約クラスタリングの背景を詳細に分析し,制約クラスタリングに使用できる制約の種類を分類する。
- 参考スコア(独自算出の注目度): 2.5957372084704238
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering is a well-known unsupervised machine learning approach capable of
automatically grouping discrete sets of instances with similar characteristics.
Constrained clustering is a semi-supervised extension to this process that can
be used when expert knowledge is available to indicate constraints that can be
exploited. Well-known examples of such constraints are must-link (indicating
that two instances belong to the same group) and cannot-link (two instances
definitely do not belong together). The research area of constrained clustering
has grown significantly over the years with a large variety of new algorithms
and more advanced types of constraints being proposed. However, no unifying
overview is available to easily understand the wide variety of available
methods, constraints and benchmarks. To remedy this, this study presents
in-detail the background of constrained clustering and provides a novel ranked
taxonomy of the types of constraints that can be used in constrained
clustering. In addition, it focuses on the instance-level pairwise constraints,
and gives an overview of its applications and its historical context. Finally,
it presents a statistical analysis covering 307 constrained clustering methods,
categorizes them according to their features, and provides a ranking score
indicating which methods have the most potential based on their popularity and
validation quality. Finally, based upon this analysis, potential pitfalls and
future research directions are provided.
- Abstract(参考訳): クラスタリングはよく知られた教師なし機械学習アプローチであり、同様の特徴を持つ個別のインスタンスセットを自動的にグループ化することができる。
制約クラスタリング(Constrained clustering)は、専門家の知識が利用可能で、活用可能な制約を示すときに使用できる、このプロセスの半教師付き拡張である。
このような制約のよく知られた例は、 must-link (2つのインスタンスが同じグループに属していることを示す) と cannot-link (2つのインスタンスは間違いなく一緒に属さない) である。
制約クラスタリングの研究領域は、様々な新しいアルゴリズムとより高度な制約が提案されているため、長年にわたって大きく成長してきた。
しかし、広く利用可能なメソッド、制約、ベンチマークを簡単に理解するための統一的な概要は提供されていない。
そこで本研究では,制約クラスタリングの背景を詳細に把握し,制約クラスタリングに使用できる制約の種類を分類する新たな分類法を提案する。
さらに、インスタンスレベルのペアワイズ制約に焦点を当て、そのアプリケーションとその歴史的なコンテキストの概要を示す。
最後に,307の制約付きクラスタリング手法を網羅した統計分析を行い,それらの特徴に応じて分類し,その人気度と検証品質に基づいて,どの手法が最も有意かを示す。
最後に、この分析に基づいて、潜在的な落とし穴と今後の研究指針を提供する。
関連論文リスト
- Towards Explainable Clustering: A Constrained Declarative based Approach [0.294944680995069]
古典的クラスタリング基準の観点から,高品質なクラスタリングを実現することを目指しており,その説明が可能である。
クラスタリングに関する優れたグローバルな説明は、各クラスタの特徴を、そのオブジェクトを記述する能力を考慮して与えるべきである。
そこで我々は,ECS と呼ばれる新しい解釈可能な制約付き手法を提案する。
論文 参考訳(メタデータ) (2024-03-26T21:00:06Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Expert-driven Trace Clustering with Instance-level Constraints [3.075612718858591]
本稿では,2つの制約付きトレースクラスタリング手法を提案する。
2つの実生活データセットを用いた広範囲な実験的評価では、我々の新しい手法は、その品質に重大な悪影響を及ぼすことなく、より正当化できるクラスタリングソリューションを実際に生成できることが示されている。
論文 参考訳(メタデータ) (2021-10-13T13:18:58Z) - Clustering to the Fewest Clusters Under Intra-Cluster Dissimilarity
Constraints [0.0]
均等なクラスタリングは、密度も期待されるクラスの数にも依存せず、相似性の閾値にも依存します。
このクラスタリング問題に対する様々な実践的ソリューション間のトレードオフを特定するために,適切なクラスタリングアルゴリズムをレビューし,評価する。
論文 参考訳(メタデータ) (2021-09-28T12:02:18Z) - Deep Clustering by Semantic Contrastive Learning [67.28140787010447]
Semantic Contrastive Learning (SCL) と呼ばれる新しい変種を紹介します。
従来のコントラスト学習とディープクラスタリングの両方の特徴を探求する。
コントラスト学習と深層クラスタリングの強みを統一的なアプローチで増幅することができる。
論文 参考訳(メタデータ) (2021-03-03T20:20:48Z) - A Framework for Deep Constrained Clustering [19.07636653413663]
制約付きクラスタリングは、k平均、混合モデル、スペクトルクラスタリングなどの一般的なアルゴリズムには存在するが、いくつかの制限がある。
ここでは、制約クラスタリングのためのディープラーニングフレームワークを探索し、特に制約クラスタリングの分野を拡張する方法について検討します。
我々のフレームワークは、ラベル付き側情報から生成された標準的制約や部分的制約(先に報告した十分な文書化された負の影響を伴わない)を扱えないことを示す。
これら4種類の制約に一般的に適用できる効率的なトレーニングパラダイムを提案します。
論文 参考訳(メタデータ) (2021-01-07T22:49:06Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。