論文の概要: Weight-Informed Self-Explaining Clustering for Mixed-Type Tabular Data
- arxiv url: http://arxiv.org/abs/2604.05857v1
- Date: Tue, 07 Apr 2026 13:18:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.849925
- Title: Weight-Informed Self-Explaining Clustering for Mixed-Type Tabular Data
- Title(参考訳): 混合型語彙データに対する重み付き自己説明クラスタリング
- Authors: Lehao Li, Qiang Huang, Yihao Ang, Bryan Kian Hsiang Low, Anthony K. H. Tung, Xiaokui Xiao,
- Abstract要約: WISEは表現、特徴重み付け、クラスタリング、解釈を統一するフレームワークである。
クラスタリングを駆動する同じプリミティブに根ざした、忠実で人間解釈可能な説明を生成する。
- 参考スコア(独自算出の注目度): 63.62853416081748
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clustering mixed-type tabular data is fundamental for exploratory analysis, yet remains challenging due to misaligned numerical-categorical representations, uneven and context-dependent feature relevance, and disconnected and post-hoc explanation from the clustering process. We propose WISE, a Weight-Informed Self-Explaining framework that unifies representation, feature weighting, clustering, and interpretation in a fully unsupervised and transparent pipeline. WISE introduces Binary Encoding with Padding (BEP) to align heterogeneous features in a unified sparse space, a Leave-One-Feature-Out (LOFO) strategy to sense multiple high-quality and diverse feature-weighting views, and a two-stage weight-aware clustering procedure to aggregate alternative semantic partitions. To ensure intrinsic interpretability, we further develop Discriminative FreqItems (DFI), which yields feature-level explanations that are consistent from instances to clusters with an additive decomposition guarantee. Extensive experiments on six real-world datasets demonstrate that WISE consistently outperforms classical and neural baselines in clustering quality while remaining efficient, and produces faithful, human-interpretable explanations grounded in the same primitives that drive clustering.
- Abstract(参考訳): 混合型表型データのクラスタリングは探索解析には基本的だが、数値カテゴリー表現の不整合、不均一でコンテキスト依存的な特徴関連性、クラスタリングプロセスからの非連結およびポストホックな説明などにより、依然として困難である。
我々は、表現、特徴重み付け、クラスタリング、解釈を、完全に教師なしかつ透明なパイプラインで統一する、重み付き自己説明フレームワークWISEを提案する。
WISEではBinary Encoding with Padding (BEP)を導入し、統一されたスパース空間における異種機能の整合、複数の高品質で多様な特徴重み付けビューを検出するLeave-One-Feature-Out (LOFO)戦略、代替セマンティックパーティションを集約する2段階の重み対応クラスタリング手順を導入している。
そこで本研究では,インスタンスからクラスタに一貫した特徴レベルの説明を付加分解保証付きで生成するDFIをさらに発展させる。
6つの実世界のデータセットに対する大規模な実験では、WISEはクラスタリングの品質において古典的および神経的ベースラインを一貫して上回りながら効率的であり、クラスタリングを駆動する同じプリミティブに根ざした忠実で人間解釈可能な説明を生成する。
関連論文リスト
- Explainable cluster analysis: a bagging approach [3.5173697454104844]
同様の観察をどの特徴がグループ化するかについての洞察を与える方法はめったにない。
本稿では,バギングと機能ドロップアウトを統合したアンサンブルベースのクラスタリングフレームワークを提案する。
その効果は、複数のシミュレートされた実世界のデータセットで実証されている。
論文 参考訳(メタデータ) (2026-03-20T10:34:04Z) - Universal NP-Hardness of Clustering under General Utilities [11.62669179647184]
有限距離空間上の多変数時間計算可能分割ユーティリティを動機付ける共通最適化コアを定式化する。
k-means、GMMs、DBSCAN、スペクトルクラスタリング、親和性伝播を含む10の主要なパラダイムをUPPフレームワークにマッピングすることで、それぞれのパラダイムがこの基本的障害を継承することを示した。
論文 参考訳(メタデータ) (2026-02-27T13:08:15Z) - Deep Incomplete Multi-View Clustering via Hierarchical Imputation and Alignment [15.396375506151102]
本稿では,階層的な命令処理と4つのキーコンポーネントのアライメントを統合する,新しいディープIMVCフレームワークを提案する。
ベンチマーク実験により、我々のフレームワークは、様々なレベルの欠落下で優れたパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2026-01-14T00:46:00Z) - Imputation-free and Alignment-free: Incomplete Multi-view Clustering Driven by Consensus Semantic Learning [65.75756724642932]
不完全なマルチビュークラスタリングでは、欠落したデータがビュー内のプロトタイプシフトとビュー間のセマンティック不整合を誘導する。
コンセンサスセマンティクス学習(FreeCSL)のためのIMVCフレームワークを提案する。
FreeCSLは、最先端の競合他社と比較して、IMVCタスクの信頼性と堅牢な割り当てを実現している。
論文 参考訳(メタデータ) (2025-05-16T12:37:10Z) - Revisiting Self-Supervised Heterogeneous Graph Learning from Spectral Clustering Perspective [52.662463893268225]
自己教師付きヘテロジニアスグラフ学習(SHGL)は様々なシナリオにおいて有望な可能性を示している。
既存のSHGLメソッドには2つの大きな制限がある。
ランクと二重整合性制約によって強化された新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-01T09:33:20Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Sanitized Clustering against Confounding Bias [38.928080236294775]
本稿では,共起バイアスに対する衛生クラスタリング(SCAB)という新しいクラスタリングフレームワークを提案する。
SCABは、非線型依存尺度を通じて、複素データのセマンティック潜在空間における境界要素を除去する。
複雑なデータセットの実験は、SCABがクラスタリングのパフォーマンスにおいて大きな向上を達成していることを示している。
論文 参考訳(メタデータ) (2023-11-02T14:10:14Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。