論文の概要: Algorithm-Agnostic Explainability for Unsupervised Clustering
- arxiv url: http://arxiv.org/abs/2105.08053v1
- Date: Mon, 17 May 2021 17:58:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 14:37:42.635141
- Title: Algorithm-Agnostic Explainability for Unsupervised Clustering
- Title(参考訳): 教師なしクラスタリングのためのアルゴリズム非依存な説明可能性
- Authors: Charles A. Ellis, Mohammad S.E. Sendi, Sergey M. Plis, Robyn L.
Miller, and Vince D. Calhoun
- Abstract要約: 提案手法は,グローバル置換率変化 (g2pc) 特徴量と局所摂動率変化 (l2pc) 特徴量である。
低次元の地層合成データセット上で, 5つの一般的なクラスタリングアルゴリズムを説明する手法の有用性を示す。
- 参考スコア(独自算出の注目度): 19.375627480270627
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Supervised machine learning explainability has greatly expanded in recent
years. However, the field of unsupervised clustering explainability has lagged
behind. Here, we, to the best of our knowledge, demonstrate for the first time
how model-agnostic methods for supervised machine learning explainability can
be adapted to provide algorithm-agnostic unsupervised clustering
explainability. We present two novel algorithm-agnostic explainability methods,
global permutation percent change (G2PC) feature importance and local
perturbation percent change (L2PC) feature importance, that can provide insight
into many clustering methods on a global level by identifying the relative
importance of features to a clustering algorithm and on a local level by
identifying the relative importance of features to the clustering of individual
samples. We demonstrate the utility of the methods for explaining five popular
clustering algorithms on low-dimensional, ground-truth synthetic datasets and
on high-dimensional functional network connectivity (FNC) data extracted from a
resting state functional magnetic resonance imaging (rs-fMRI) dataset of 151
subjects with schizophrenia (SZ) and 160 healthy controls (HC). Our proposed
explainability methods robustly identify the relative importance of features
across multiple clustering methods and could facilitate new insights into many
applications. We hope that this study will greatly accelerate the development
of the field of clustering explainability.
- Abstract(参考訳): 近年、機械学習の説明可能性が大幅に拡大している。
しかしながら、教師なしクラスタリングの説明可能性の分野は遅れている。
ここでは、我々の知識を最大限に活用するために、機械学習の説明可能性を管理するモデル非依存の方法が、アルゴリズム非依存なクラスタリング説明可能性にどのように適応するかを初めて示す。
本稿では,クラスタリングアルゴリズムにおける特徴の相対的重要性を同定することにより,クラスタリングアルゴリズムにおける特徴の相対的重要性と局所的重要性を同定することにより,グローバルレベルでの多くのクラスタリング手法の洞察を得られる,G2PCの特徴的重要性と局所的摂動率変化(L2PC)の特徴的重要性を示す。
統合失調症患者151名(sz)と健常者160名(hc)からなる安静時機能的磁気共鳴画像(rs-fmri)データセットから抽出した低次元・地中合成データセットと高次元機能ネットワーク接続(fnc)データに対して,5つの一般的なクラスタリングアルゴリズムを説明する手法の有用性を示す。
提案手法は,複数のクラスタリング手法にまたがる特徴の相対的重要性をロバストに同定し,多くのアプリケーションに新たな洞察を与える。
本研究はクラスタリングの説明可能性の分野の発展を大いに加速させることを期待する。
関連論文リスト
- Counterfactual Explanations for Clustering Models [11.40145394568897]
クラスタリングアルゴリズムは、理解が難しい複雑な最適化プロセスに依存している。
本稿では,クラスタリングアルゴリズムを非現実的文で説明するための,モデルに依存しない新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-19T10:05:58Z) - NeurCAM: Interpretable Neural Clustering via Additive Models [3.4437947384641037]
解釈可能なクラスタリングアルゴリズムは、取得したグループを説明しながら、類似したデータポイントをグループ化する。
本稿では、解釈可能なクラスタリング問題に対する新しいアプローチであるNeurCAM(Neur Clustering Additive Model)を紹介する。
本手法は,テキストデータのクラスタリングにおいて,他の解釈可能なクラスタリング手法よりも優れている。
論文 参考訳(メタデータ) (2024-08-23T20:32:57Z) - Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - A Modular Framework for Centrality and Clustering in Complex Networks [0.6423239719448168]
本稿では,集中度とクラスタリングという2つの重要なネットワーク解析手法について検討する。
クラスタリングには情報フローベースのモデルが採用されている。
我々のクラスタリングは、エッジウェイトとノードの度合いの異なる解釈と相互作用と同様に、エッジ指向性に対応する柔軟性を自然に継承する。
論文 参考訳(メタデータ) (2021-11-23T03:01:29Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - Fast and Interpretable Consensus Clustering via Minipatch Learning [0.0]
IMPACC: Interpretable MiniPatch Adaptive Consensus Clustering を開発した。
我々は、信頼性と計算コストの両面で改善された観測のための適応型サンプリング手法を開発した。
その結果,より正確で解釈可能なクラスタソリューションが得られた。
論文 参考訳(メタデータ) (2021-10-05T22:39:28Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - A semi-supervised sparse K-Means algorithm [3.04585143845864]
クラスタリングに必要な機能のサブグループを検出するために、教師なしスパースクラスタリング手法を用いることができる。
半教師付き手法では、ラベル付きデータを使用して制約を作成し、クラスタリングソリューションを強化することができる。
提案アルゴリズムは,他の半教師付きアルゴリズムの高性能性を保ち,また,情報的特徴から情報的特徴を識別する能力も保持していることを示す。
論文 参考訳(メタデータ) (2020-03-16T02:05:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。