論文の概要: Interpretable Clustering Ensemble
- arxiv url: http://arxiv.org/abs/2506.05877v1
- Date: Fri, 06 Jun 2025 08:42:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.387428
- Title: Interpretable Clustering Ensemble
- Title(参考訳): 解釈可能なクラスタリングアンサンブル
- Authors: Hang Lv, Lianyu Hu, Mudi Jiang, Xinying Liu, Zengyou He,
- Abstract要約: 文献における最初の解釈可能なクラスタリングアンサンブルアルゴリズムを提案する。
基本分割を分類変数として扱うことにより,本手法は特徴空間における決定木を構成する。
実験結果から,本アルゴリズムは最先端クラスタリング手法に匹敵する性能を示した。
- 参考スコア(独自算出の注目度): 3.9825005801313673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering ensemble has emerged as an important research topic in the field of machine learning. Although numerous methods have been proposed to improve clustering quality, most existing approaches overlook the need for interpretability in high-stakes applications. In domains such as medical diagnosis and financial risk assessment, algorithms must not only be accurate but also interpretable to ensure transparent and trustworthy decision-making. Therefore, to fill the gap of lack of interpretable algorithms in the field of clustering ensemble, we propose the first interpretable clustering ensemble algorithm in the literature. By treating base partitions as categorical variables, our method constructs a decision tree in the original feature space and use the statistical association test to guide the tree building process. Experimental results demonstrate that our algorithm achieves comparable performance to state-of-the-art (SOTA) clustering ensemble methods while maintaining an additional feature of interpretability. To the best of our knowledge, this is the first interpretable algorithm specifically designed for clustering ensemble, offering a new perspective for future research in interpretable clustering.
- Abstract(参考訳): クラスタリングアンサンブルは、機械学習の分野で重要な研究トピックとして浮上している。
クラスタリングの品質を改善するために多くの方法が提案されているが、既存のほとんどのアプローチは、ハイテイクなアプリケーションにおける解釈可能性の必要性を軽視している。
医療診断や金融リスク評価のような領域では、アルゴリズムは正確であるだけでなく、透明性と信頼性の高い意思決定を保証するために解釈可能でなければならない。
そこで本研究では,クラスタリングアンサンブルの分野における解釈可能なアルゴリズムの欠如を補うために,文献における最初の解釈可能なクラスタリングアンサンブルアルゴリズムを提案する。
基本分割を分類変数として扱うことにより,本手法は,原特徴空間における決定木を構築し,統計的関連性テストを用いて木構築過程を導出する。
実験により,本アルゴリズムは,解釈可能性の付加的な特徴を維持しつつ,最先端(SOTA)クラスタリング手法に匹敵する性能を実現することを示す。
我々の知る限りでは、このアルゴリズムはクラスタリングアンサンブル用に特別に設計された最初の解釈可能なアルゴリズムであり、解釈可能なクラスタリングの研究における新たな視点を提供する。
関連論文リスト
- Revisiting Self-Supervised Heterogeneous Graph Learning from Spectral Clustering Perspective [52.662463893268225]
自己教師付きヘテロジニアスグラフ学習(SHGL)は様々なシナリオにおいて有望な可能性を示している。
既存のSHGLメソッドには2つの大きな制限がある。
ランクと二重整合性制約によって強化された新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-01T09:33:20Z) - Interpretable Clustering: A Survey [1.5641228378135836]
クラスタリングアルゴリズムは、医療、金融、自律システムといった高度な領域にますます適用されています。
透過的で解釈可能なクラスタリング結果の必要性は、重要な関心事になっている。
本稿では,説明可能なクラスタリングアルゴリズムの現状を包括的かつ構造化したレビューを行う。
論文 参考訳(メタデータ) (2024-09-01T15:09:51Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - Adaptive Resonance Theory-based Topological Clustering with a Divisive
Hierarchical Structure Capable of Continual Learning [8.581682204722894]
本稿では、データポイントの分布から類似度閾値を自動的に推定する機構を備えたARTベースのトポロジカルクラスタリングアルゴリズムを提案する。
情報抽出性能を向上させるために,連続学習が可能な分割階層クラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-26T02:34:52Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - Learning the Precise Feature for Cluster Assignment [39.320210567860485]
表現学習とクラスタリングを1つのパイプラインに初めて統合するフレームワークを提案する。
提案フレームワークは,近年開発された生成モデルを用いて,本質的な特徴を学習する能力を活用している。
実験の結果,提案手法の性能は,最先端の手法よりも優れているか,少なくとも同等であることがわかった。
論文 参考訳(メタデータ) (2021-06-11T04:08:54Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。
厳格なベンチマークのベストプラクティスに関する合意はありません。
このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文 参考訳(メタデータ) (2021-02-13T15:01:34Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。