論文の概要: Semi-Supervised Clustering via Structural Entropy with Different
Constraints
- arxiv url: http://arxiv.org/abs/2312.10917v1
- Date: Mon, 18 Dec 2023 04:00:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 21:29:54.574066
- Title: Semi-Supervised Clustering via Structural Entropy with Different
Constraints
- Title(参考訳): 制約の異なる構造エントロピーによる半監督クラスタリング
- Authors: Guangjie Zeng, Hao Peng, Angsheng Li, Zhiwei Liu, Runze Yang, Chunyang
Liu, Lifang He
- Abstract要約: 本稿では,多種多様な制約を組み込んで,分割と階層クラスタリングを両立させる手法であるStructure Entropy (SSE) による半教師付きクラスタリングを提案する。
9つのクラスタリングデータセット上でSSEを評価し,それを11の半教師付きパーティショニングおよび階層クラスタリング手法と比較した。
- 参考スコア(独自算出の注目度): 30.215985625884922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised clustering techniques have emerged as valuable tools for
leveraging prior information in the form of constraints to improve the quality
of clustering outcomes. Despite the proliferation of such methods, the ability
to seamlessly integrate various types of constraints remains limited. While
structural entropy has proven to be a powerful clustering approach with
wide-ranging applications, it has lacked a variant capable of accommodating
these constraints. In this work, we present Semi-supervised clustering via
Structural Entropy (SSE), a novel method that can incorporate different types
of constraints from diverse sources to perform both partitioning and
hierarchical clustering. Specifically, we formulate a uniform view for the
commonly used pairwise and label constraints for both types of clustering.
Then, we design objectives that incorporate these constraints into structural
entropy and develop tailored algorithms for their optimization. We evaluate SSE
on nine clustering datasets and compare it with eleven semi-supervised
partitioning and hierarchical clustering methods. Experimental results
demonstrate the superiority of SSE on clustering accuracy with different types
of constraints. Additionally, the functionality of SSE for biological data
analysis is demonstrated by cell clustering experiments conducted on four
single-cell RNAseq datasets.
- Abstract(参考訳): 半教師付きクラスタリング技術は、クラスタリング結果の品質を改善するために制約の形で事前情報を活用するための貴重なツールとして登場した。
このような手法の普及にもかかわらず、様々な種類の制約をシームレスに統合する能力は限られている。
構造的エントロピーは広い範囲のアプリケーションで強力なクラスタリングアプローチであることが証明されているが、これらの制約を適応できる派生型が欠如している。
本研究では,多様なソースから異なるタイプの制約を組み込んで,パーティショニングと階層クラスタリングを両立させる新しい手法であるStructure Entropy (SSE) による半教師付きクラスタリングを提案する。
具体的には、一般的に使用されるペアワイドの統一ビューと、クラスタリングの両タイプのラベル制約を定式化する。
そして,これらの制約を構造エントロピーに組み込んだ目的を設計し,最適化のためのアルゴリズムを開発する。
9つのクラスタリングデータセットのsseを評価し,11の半教師あり分割法と階層クラスタリング法と比較した。
実験の結果,SSEのクラスタリング精度は制約の種類によって異なることがわかった。
さらに,4つの単細胞rnaseqデータセットを用いた細胞クラスタリング実験により,生物データ解析におけるsseの機能を示した。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T13:37:03Z) - Towards Explainable Clustering: A Constrained Declarative based Approach [0.294944680995069]
古典的クラスタリング基準の観点から,高品質なクラスタリングを実現することを目指しており,その説明が可能である。
クラスタリングに関する優れたグローバルな説明は、各クラスタの特徴を、そのオブジェクトを記述する能力を考慮して与えるべきである。
そこで我々は,ECS と呼ばれる新しい解釈可能な制約付き手法を提案する。
論文 参考訳(メタデータ) (2024-03-26T21:00:06Z) - Memetic Differential Evolution Methods for Semi-Supervised Clustering [0.8681835475119588]
MDEClustの半教師付き最小二乗クラスタリング(MSSC)問題に対する拡張を提案する。
我々の新しいフレームワークであるS-MDEClustは、最適な実現可能なソリューションを生成するために設計された最初のメメカティックな方法論である。
論文 参考訳(メタデータ) (2024-03-07T08:37:36Z) - Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.31109141089598]
シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文 参考訳(メタデータ) (2023-11-28T08:34:58Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - Interpretable Clustering via Multi-Polytope Machines [12.69310440882225]
本稿では,クラスタデータポイントと,検出したクラスタの周辺にポリトープを構築して説明する,解釈可能なクラスタリングのための新しい手法を提案する。
我々は,我々の手法を,人工クラスタリングと実世界のクラスタリングの一連の問題にベンチマークし,我々のアルゴリズムは,アート解釈可能で非解釈可能なクラスタリングアルゴリズムの状態を上回ります。
論文 参考訳(メタデータ) (2021-12-10T16:36:32Z) - Deep Conditional Gaussian Mixture Model for Constrained Clustering [7.070883800886882]
制約付きクラスタリングは、部分的にラベル付けされたデータの増加量に関する事前情報を利用することができる。
本稿では、直感的で解釈可能で、勾配変動推論の枠組みで効率的に訓練できる制約付きクラスタリングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T13:38:09Z) - A Multi-disciplinary Ensemble Algorithm for Clustering Heterogeneous
Datasets [0.76146285961466]
本稿では,社会階級ランキングとメタヒューリスティックアルゴリズムに基づく進化的クラスタリングアルゴリズム(ECAStar)を提案する。
ECAStarは、再共生進化演算子、レヴィ飛行最適化、いくつかの統計技術と統合されている。
従来の5つのアプローチに対してECAStarを評価する実験を行った。
論文 参考訳(メタデータ) (2021-01-01T07:20:50Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。