論文の概要: Enhancing Clustering: An Explainable Approach via Filtered Patterns
- arxiv url: http://arxiv.org/abs/2604.12460v1
- Date: Tue, 14 Apr 2026 08:45:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.349026
- Title: Enhancing Clustering: An Explainable Approach via Filtered Patterns
- Title(参考訳): クラスタリングの強化: フィルタパターンによる説明可能なアプローチ
- Authors: Motaz Ben Hassine, Saïd Jabbour,
- Abstract要約: 説明可能なクラスタリングは、データを$$disjointクラスタに分割する、知識駆動型の教師なし学習パラダイムである。
同一頻出パターン(k緩和パターン)の導入によるクラスタリング品質の向上に関する最近の研究
複数の異なる k-被覆が同一の k-被覆を誘導し、冗長な記号表現をもたらす。
そこで本研究では,個々のk被覆に対して1つの代表パターンを保持することで,冗長パターンを除去する最適化手法を提案する。
- 参考スコア(独自算出の注目度): 4.576379639081977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning has become a central research area, with increasing attention devoted to explainable clustering, also known as conceptual clustering, which is a knowledge-driven unsupervised learning paradigm that partitions data into $θ$ disjoint clusters, where each cluster is described by an explicit symbolic representation, typically expressed as a closed pattern or itemset. By providing human-interpretable cluster descriptions, explainable clustering plays an important role in explainable artificial intelligence and knowledge discovery. Recent work improved clustering quality by introducing k-relaxed frequent patterns (k-RFPs), a pattern model that relaxes strict coverage constraints through a generalized kcover definition. This framework integrates constraint-based reasoning, using SAT solvers for pattern generation, with combinatorial optimization, using Integer Linear Programming (ILP) for cluster selection. Despite its effectiveness, this approach suffers from a critical limitation: multiple distinct k-RFPs may induce identical k-covers, leading to redundant symbolic representations that unnecessarily enlarge the search space and increase computational complexity during cluster construction. In this paper, we address this redundancy through a pattern reduction framework. Our contributions are threefold. First, we formally characterize the conditions under which distinct k-RFPs induce identical kcovers, providing theoretical foundations for redundancy detection. Second, we propose an optimization strategy that removes redundant patterns by retaining a single representative pattern for each distinct k-cover. Third, we investigate the interpretability and representativeness of the patterns selected by the ILP model by analyzing their robustness with respect to their induced clusters. Extensive experiments conducted on several real-world datasets demonstrate that the proposed approach significantly reduces the pattern search space, improves computational efficiency, preserves and enhances in some cases the quality of the resulting clusters.
- Abstract(参考訳): 機械学習が中心的な研究領域となり、説明可能なクラスタリング(概念クラスタリングとも呼ばれる)に注目が集まっている。これは知識駆動型非教師なし学習パラダイムで、データを$θ$非結合クラスタに分割し、各クラスタは明示的な象徴的表現によって記述され、通常、閉じたパターンやアイテムセットとして表現される。
人間の解釈可能なクラスタ記述を提供することによって、説明可能なクラスタリングは、説明可能な人工知能と知識発見において重要な役割を果たす。
近年、k-relaxed frequent pattern (k-RFPs)を導入してクラスタリングの品質を改善している。
このフレームワークは制約ベースの推論を統合し、SATソルバを用いてパターン生成を行い、組合せ最適化を行い、Integer Linear Programming (ILP) を用いてクラスタ選択を行う。
複数の異なる k-RFP が同一の k-被覆を誘導し、余分な記号表現を発生させ、探索空間を不必要に拡大し、クラスタ構築中に計算複雑性を増大させる。
本稿では,パターン還元フレームワークを用いて,この冗長性に対処する。
私たちの貢献は3倍です。
まず,異なるk-RFPが同一の検体を誘導する条件を正式に特徴付け,冗長性検出の理論的基礎を提供する。
第2に、異なるk被覆毎に1つの代表パターンを保持することで、冗長パターンを除去する最適化手法を提案する。
第3に、ICPモデルにより選択されたパターンの解釈可能性と代表性について、それらのクラスタに対するロバスト性を分析することによって検討する。
いくつかの実世界のデータセットで実施された大規模な実験により、提案手法はパターン探索空間を著しく削減し、計算効率を向上し、いくつかの場合において、結果のクラスタの品質を保ち、強化することを示した。
関連論文リスト
- Weight-Informed Self-Explaining Clustering for Mixed-Type Tabular Data [63.62853416081748]
WISEは表現、特徴重み付け、クラスタリング、解釈を統一するフレームワークである。
クラスタリングを駆動する同じプリミティブに根ざした、忠実で人間解釈可能な説明を生成する。
論文 参考訳(メタデータ) (2026-04-07T13:18:31Z) - Universal NP-Hardness of Clustering under General Utilities [11.62669179647184]
有限距離空間上の多変数時間計算可能分割ユーティリティを動機付ける共通最適化コアを定式化する。
k-means、GMMs、DBSCAN、スペクトルクラスタリング、親和性伝播を含む10の主要なパラダイムをUPPフレームワークにマッピングすることで、それぞれのパラダイムがこの基本的障害を継承することを示した。
論文 参考訳(メタデータ) (2026-02-27T13:08:15Z) - Parameter-Free Clustering via Self-Supervised Consensus Maximization (Extended Version) [50.41628860536753]
本稿では,SCMax と呼ばれる自己教師型コンセンサス最大化による,新しい完全パラメータフリークラスタリングフレームワークを提案する。
本フレームワークは,階層的なクラスタリングとクラスタ評価を単一の統合プロセスで行う。
論文 参考訳(メタデータ) (2025-11-12T11:17:17Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Unfolding ADMM for Enhanced Subspace Clustering of Hyperspectral Images [43.152314090830174]
本稿では,スパースサブスペースクラスタリングのためのマルチプライヤの交互方向法(ADMM)に基づく反復解法を展開させることにより,ハイパースペクトル画像(HSI)のための革新的なクラスタリングアーキテクチャを提案する。
提案手法は, 構造保存モジュールの一部として, K近傍近傍のアルゴリズムを用いて, HSIデータの構造特性をよく把握する。
論文 参考訳(メタデータ) (2024-04-10T15:51:46Z) - Towards Explainable Clustering: A Constrained Declarative based Approach [0.294944680995069]
古典的クラスタリング基準の観点から,高品質なクラスタリングを実現することを目指しており,その説明が可能である。
クラスタリングに関する優れたグローバルな説明は、各クラスタの特徴を、そのオブジェクトを記述する能力を考慮して与えるべきである。
そこで我々は,ECS と呼ばれる新しい解釈可能な制約付き手法を提案する。
論文 参考訳(メタデータ) (2024-03-26T21:00:06Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [85.51611950757643]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。