論文の概要: PretopoMD: Pretopology-based Mixed Data Hierarchical Clustering
- arxiv url: http://arxiv.org/abs/2512.03071v1
- Date: Thu, 27 Nov 2025 08:20:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-04 20:02:54.934716
- Title: PretopoMD: Pretopology-based Mixed Data Hierarchical Clustering
- Title(参考訳): PretopoMD: プリトポロジーに基づく混合データ階層クラスタリング
- Authors: Loup-Noe Levy, Guillaume Guerard, Sonia Djebali, Soufian Ben Amor,
- Abstract要約: 本稿では,次元削減を必要とせずに混合データをクラスタリングすることの課題に対処する,新しいプリトポロジーに基づくアルゴリズムを提案する。
提案手法は,ユーザ定義の階層クラスタ構築を可能にする,カスタマイズ可能な論理ルールと調整可能なハイパーパラメータを定式化する。
経験的発見は、有意義なクラスタ構築におけるアルゴリズムの堅牢性を強調し、クラスタ化されたデータ説明可能性に関連する問題を克服する可能性を明らかにする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article presents a novel pretopology-based algorithm designed to address the challenges of clustering mixed data without the need for dimensionality reduction. Leveraging Disjunctive Normal Form, our approach formulates customizable logical rules and adjustable hyperparameters that allow for user-defined hierarchical cluster construction and facilitate tailored solutions for heterogeneous datasets. Through hierarchical dendrogram analysis and comparative clustering metrics, our method demonstrates superior performance by accurately and interpretably delineating clusters directly from raw data, thus preserving data integrity. Empirical findings highlight the algorithm's robustness in constructing meaningful clusters and reveal its potential in overcoming issues related to clustered data explainability. The novelty of this work lies in its departure from traditional dimensionality reduction techniques and its innovative use of logical rules that enhance both cluster formation and clarity, thereby contributing a significant advancement to the discourse on clustering mixed data.
- Abstract(参考訳): 本稿では,次元削減を必要とせずに混合データをクラスタリングすることの課題に対処する,新しいプリトポロジーに基づくアルゴリズムを提案する。
分割正規形式を活用することで、ユーザ定義の階層クラスタ構築を可能にし、異種データセットの調整ソリューションを容易にする、カスタマイズ可能な論理ルールと調整可能なハイパーパラメータを定式化する。
本手法は階層的デンドログラム解析とクラスタリングの比較によって,クラスタを生データから直接正確に,解釈し,データの整合性を保ち,優れた性能を示す。
経験的発見は、有意義なクラスタ構築におけるアルゴリズムの堅牢性を強調し、クラスタ化されたデータ説明可能性に関連する問題を克服する可能性を明らかにする。
この研究の斬新さは、従来の次元減少技術からの脱却と、クラスタの形成と明確性の両方を強化する論理規則の革新的利用によって、クラスタリング混合データに関する談話に顕著な進歩をもたらしたことである。
関連論文リスト
- Mixed Data Clustering Survey and Challenges [0.0]
本稿では,前位相空間におけるクラスタリング手法を提案する。
古典的数値クラスタリングアルゴリズムに対するベンチマークは,提案手法の性能と有効性に関する洞察を与える。
論文 参考訳(メタデータ) (2025-11-27T08:20:05Z) - AdaptiveMDL-GenClust: A Robust Clustering Framework Integrating Normalized Mutual Information and Evolutionary Algorithms [0.0]
我々は,最小記述長(MDL)原理と遺伝的最適化アルゴリズムを組み合わせたロバストクラスタリングフレームワークを提案する。
このフレームワークは、初期クラスタリングソリューションを生成するためのアンサンブルクラスタリングアプローチから始まり、MDL誘導評価関数を使用して洗練され、遺伝的アルゴリズムによって最適化される。
実験の結果,従来のクラスタリング手法を一貫して上回り,精度の向上,安定性の向上,バイアス低減を実現している。
論文 参考訳(メタデータ) (2024-11-26T20:26:14Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。
提案手法は、一般化された製品カーネルを通して、インフォメーション・ボトルネックの原理を異種データに拡張する。
提案手法はDIBmixと呼ばれ,従来の4つの手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-03T09:06:19Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0]
我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文 参考訳(メタデータ) (2023-02-06T23:34:51Z) - Deep Conditional Gaussian Mixture Model for Constrained Clustering [7.070883800886882]
制約付きクラスタリングは、部分的にラベル付けされたデータの増加量に関する事前情報を利用することができる。
本稿では、直感的で解釈可能で、勾配変動推論の枠組みで効率的に訓練できる制約付きクラスタリングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T13:38:09Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。