論文の概要: Towards Explainable Clustering: A Constrained Declarative based Approach
- arxiv url: http://arxiv.org/abs/2403.18101v1
- Date: Tue, 26 Mar 2024 21:00:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 21:05:06.561850
- Title: Towards Explainable Clustering: A Constrained Declarative based Approach
- Title(参考訳): 説明可能なクラスタ化に向けて - 制約付き宣言に基づくアプローチ
- Authors: Mathieu Guilbert, Christel Vrain, Thi-Bich-Hanh Dao,
- Abstract要約: 古典的クラスタリング基準の観点から,高品質なクラスタリングを実現することを目指しており,その説明が可能である。
クラスタリングに関する優れたグローバルな説明は、各クラスタの特徴を、そのオブジェクトを記述する能力を考慮して与えるべきである。
そこで我々は,ECS と呼ばれる新しい解釈可能な制約付き手法を提案する。
- 参考スコア(独自算出の注目度): 0.294944680995069
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The domain of explainable AI is of interest in all Machine Learning fields, and it is all the more important in clustering, an unsupervised task whose result must be validated by a domain expert. We aim at finding a clustering that has high quality in terms of classic clustering criteria and that is explainable, and we argue that these two dimensions must be considered when building the clustering. We consider that a good global explanation of a clustering should give the characteristics of each cluster taking into account their abilities to describe its objects (coverage) while distinguishing it from the other clusters (discrimination). Furthermore, we aim at leveraging expert knowledge, at different levels, on the structure of the expected clustering or on its explanations. In our framework an explanation of a cluster is a set of patterns, and we propose a novel interpretable constrained clustering method called ECS for declarative clustering with Explainabilty-driven Cluster Selection that integrates structural or domain expert knowledge expressed by means of constraints. It is based on the notion of coverage and discrimination that are formalized at different levels (cluster / clustering), each allowing for exceptions through parameterized thresholds. Our method relies on four steps: generation of a set of partitions, computation of frequent patterns for each cluster, pruning clusters that violates some constraints, and selection of clusters and associated patterns to build an interpretable clustering. This last step is combinatorial and we have developed a Constraint-Programming (CP) model to solve it. The method can integrate prior knowledge in the form of user constraints, both before or in the CP model.
- Abstract(参考訳): 説明可能なAIのドメインは、すべての機械学習分野に関心を持ち、ドメインの専門家が結果を検証しなければならない教師なしのタスクであるクラスタリングにおいて、より重要である。
従来のクラスタリング基準では高品質で説明可能なクラスタリングの実現を目指しており,これらの2つの次元はクラスタリングを構築する際に考慮する必要がある,と論じている。
クラスタリングに関する優れたグローバルな説明は、オブジェクト(カバレッジ)を記述しつつ、他のクラスタ(識別)と区別する能力を考慮して、各クラスタの特徴を与えるべきだと考えています。
さらに,様々なレベルで,期待されるクラスタリングの構造や説明に基づいて,専門家の知識を活用することを目指す。
本フレームワークでは,クラスタの説明はパターンの集合であり,制約によって表現される構造的知識やドメイン的知識を統合するExplainabilty-driven Cluster Selectionを用いた宣言的クラスタリングのための,ECSと呼ばれる新しい解釈可能な制約付きクラスタリング手法を提案する。
これは、異なるレベル(クラスタ/クラスタリング)で形式化されたカバレッジと差別の概念に基づいており、それぞれがパラメータ化されたしきい値を通じて例外を許容している。
提案手法では,分割の集合の生成,クラスタ毎の頻繁なパターンの計算,制約に違反するクラスタのプルーニング,解釈可能なクラスタ構築のためのクラスタと関連するパターンの選択という4つのステップに依存している。
この最後のステップは組合せであり、我々はそれを解くために制約プログラミング(CP)モデルを開発した。
この手法は,CPモデルの前と後の両方において,ユーザの制約という形で事前知識を統合することができる。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Semi-Supervised Clustering via Structural Entropy with Different
Constraints [30.215985625884922]
本稿では,多種多様な制約を組み込んで,分割と階層クラスタリングを両立させる手法であるStructure Entropy (SSE) による半教師付きクラスタリングを提案する。
9つのクラスタリングデータセット上でSSEを評価し,それを11の半教師付きパーティショニングおよび階層クラスタリング手法と比較した。
論文 参考訳(メタデータ) (2023-12-18T04:00:40Z) - Stable Cluster Discrimination for Deep Clustering [7.175082696240088]
ディープクラスタリングは、インスタンスの表現(つまり、表現学習)を最適化し、固有のデータ分散を探索することができる。
結合された目的は、すべてのインスタンスが一様機能に崩壊する、自明な解決策を意味する。
本研究では,1段階クラスタリングにおいて,教師あり学習における一般的な識別タスクが不安定であることを示す。
新規な安定クラスタ識別(SeCu)タスクを提案し、それに応じて新しいハードネス対応クラスタリング基準を得ることができる。
論文 参考訳(メタデータ) (2023-11-24T06:43:26Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Oracle-guided Contrastive Clustering [28.066047266687058]
Oracle-Guided Contrastive Clustering(OCC)は,ユニークな要求を持ったオーラクルに対して,ペアワイズで同クラスタ"クエリを対話的に作成することで,クラスタリングを実現する。
私たちの知る限りでは、パーソナライズされたクラスタリングを実行する最初のディープフレームワークです。
論文 参考訳(メタデータ) (2022-11-01T12:05:12Z) - Clustering to the Fewest Clusters Under Intra-Cluster Dissimilarity
Constraints [0.0]
均等なクラスタリングは、密度も期待されるクラスの数にも依存せず、相似性の閾値にも依存します。
このクラスタリング問題に対する様々な実践的ソリューション間のトレードオフを特定するために,適切なクラスタリングアルゴリズムをレビューし,評価する。
論文 参考訳(メタデータ) (2021-09-28T12:02:18Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Graph Contrastive Clustering [131.67881457114316]
本稿では,クラスタリングタスクに適用可能な新しいグラフコントラスト学習フレームワークを提案し,gcc(graph constrastive clustering)法を考案した。
特に、グラフラプラシアンに基づくコントラスト損失は、より識別的かつクラスタリングフレンドリーな特徴を学ぶために提案されている。
一方で、よりコンパクトなクラスタリング割り当てを学ぶために、グラフベースのコントラスト学習戦略が提案されている。
論文 参考訳(メタデータ) (2021-04-03T15:32:49Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。