論文の概要: Explainable cluster analysis: a bagging approach
- arxiv url: http://arxiv.org/abs/2603.19840v1
- Date: Fri, 20 Mar 2026 10:34:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.108136
- Title: Explainable cluster analysis: a bagging approach
- Title(参考訳): 説明可能なクラスタ分析--バッグングアプローチ
- Authors: Federico Maria Quetti, Elena Ballante, Silvia Figini, Paolo Giudici,
- Abstract要約: 同様の観察をどの特徴がグループ化するかについての洞察を与える方法はめったにない。
本稿では,バギングと機能ドロップアウトを統合したアンサンブルベースのクラスタリングフレームワークを提案する。
その効果は、複数のシミュレートされた実世界のデータセットで実証されている。
- 参考スコア(独自算出の注目度): 3.5173697454104844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A major limitation of clustering approaches is their lack of explainability: methods rarely provide insight into which features drive the grouping of similar observations. To address this limitation, we propose an ensemble-based clustering framework that integrates bagging and feature dropout to generate feature importance scores, in analogy with feature importance mechanisms in supervised random forests. By leveraging multiple bootstrap resampling schemes and aggregating the resulting partitions, the method improves stability and robustness of the cluster definition, particularly in small-sample or noisy settings. Feature importance is assessed through an information-theoretic approach: at each step, the mutual information between each feature and the estimated cluster labels is computed and weighted by a measure of clustering validity to emphasize well-formed partitions, before being aggregated into a final score. The method outputs both a consensus partition and a corresponding measure of feature importance, enabling a unified interpretation of clustering structure and variable relevance. Its effectiveness is demonstrated on multiple simulated and real-world datasets.
- Abstract(参考訳): クラスタリングアプローチの大きな制限は、その説明可能性の欠如である。
この制限に対処するため、教師付きランダム林における特徴重要度と類似して、バッグングと特徴ドロップアウトを統合した特徴重要度スコアを生成するアンサンブルベースのクラスタリングフレームワークを提案する。
複数のブートストラップ再サンプリングスキームを活用し、その結果のパーティションを集約することにより、特に小さなサンプルやノイズの多い設定において、クラスタ定義の安定性と堅牢性を改善する。
各ステップにおいて、各特徴と推定クラスタラベルの相互情報をクラスタ化妥当性の尺度で算出し重み付けし、良好な分割を強調し、最終スコアに集約する。
この方法は、コンセンサス分割とそれに対応する特徴重要度尺度の両方を出力し、クラスタリング構造と変数関連性の統一的な解釈を可能にする。
その効果は、複数のシミュレートされた実世界のデータセットで実証されている。
関連論文リスト
- Parameter-Free Clustering via Self-Supervised Consensus Maximization (Extended Version) [50.41628860536753]
本稿では,SCMax と呼ばれる自己教師型コンセンサス最大化による,新しい完全パラメータフリークラスタリングフレームワークを提案する。
本フレームワークは,階層的なクラスタリングとクラスタ評価を単一の統合プロセスで行う。
論文 参考訳(メタデータ) (2025-11-12T11:17:17Z) - evclust: Python library for evidential clustering [0.6215404942415159]
証拠クラスタリングは、不確実性を表すためにデンプスター・シェーファー理論(英語版)を用いる。
Pythonフレームワークのevclustは、効率的なエビデンスクラスタリングアルゴリズムと、クレダルパーティションを視覚化、評価、分析するためのツールを提供する。
論文 参考訳(メタデータ) (2025-02-10T15:53:26Z) - Revisiting Self-Supervised Heterogeneous Graph Learning from Spectral Clustering Perspective [52.662463893268225]
自己教師付きヘテロジニアスグラフ学習(SHGL)は様々なシナリオにおいて有望な可能性を示している。
既存のSHGLメソッドには2つの大きな制限がある。
ランクと二重整合性制約によって強化された新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-01T09:33:20Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - From A-to-Z Review of Clustering Validation Indices [4.08908337437878]
我々は、最も一般的なクラスタリングアルゴリズムを用いて、内部および外部クラスタリング検証指標の性能をレビューし、評価する。
内部クラスタリング検証と外部クラスタリング検証の両方の機能を調べるための分類フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-18T13:52:02Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Algorithm-Agnostic Interpretations for Clustering [0.0]
縮小次元におけるクラスタリング結果を説明するために,アルゴリズムに依存しない解釈法を提案する。
クラスタリングにおける置換機能の重要性は、特徴値のシャッフルに基づく一般的なフレームワークを表している。
すべてのメソッドは、任意のクラスタリングアルゴリズムを使って、ソフトラベルやハードラベルを通じてインスタンスを再割り当てすることができる。
論文 参考訳(メタデータ) (2022-09-21T18:08:40Z) - Fast and Interpretable Consensus Clustering via Minipatch Learning [0.0]
IMPACC: Interpretable MiniPatch Adaptive Consensus Clustering を開発した。
我々は、信頼性と計算コストの両面で改善された観測のための適応型サンプリング手法を開発した。
その結果,より正確で解釈可能なクラスタソリューションが得られた。
論文 参考訳(メタデータ) (2021-10-05T22:39:28Z) - Robust Hierarchical Clustering for Directed Networks: An Axiomatic
Approach [13.406858660972551]
有向ネットワークに対するロバストな階層的クラスタリング手法の完全な分類学的特徴を提供する。
本稿では,階層クラスタリングにおけるロバスト性に関連する3つの実用的特性について紹介する。
また,本手法の実装に対処し,実データへのアプリケーション記述を行う。
論文 参考訳(メタデータ) (2021-08-16T17:28:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。