論文の概要: ClustRecNet: A Novel End-to-End Deep Learning Framework for Clustering Algorithm Recommendation
- arxiv url: http://arxiv.org/abs/2509.25289v1
- Date: Mon, 29 Sep 2025 13:48:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.237495
- Title: ClustRecNet: A Novel End-to-End Deep Learning Framework for Clustering Algorithm Recommendation
- Title(参考訳): ClustRecNet: クラスタリングアルゴリズムレコメンデーションのための新しいエンドツーエンドディープラーニングフレームワーク
- Authors: Mohammadreza Bakhtyari, Bogdan Mazoure, Renato Cordeiro de Amorim, Guillaume Rabusseau, Vladimir Makarenkov,
- Abstract要約: ClustRecNetは、特定のデータセットに最適なクラスタリングアルゴリズムを決定するための、新しいディープラーニング(DL)ベースのレコメンデーションフレームワークである。
多様な構造を持つ34,000の合成データセットからなる包括的データリポジトリを構築した。
提案するネットワークアーキテクチャは,局所構造パターンとグローバル構造パターンの両方を捉えるために,畳み込み,残差,注意機構を統合している。
- 参考スコア(独自算出の注目度): 9.419239935565376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ClustRecNet - a novel deep learning (DL)-based recommendation framework for determining the most suitable clustering algorithms for a given dataset, addressing the long-standing challenge of clustering algorithm selection in unsupervised learning. To enable supervised learning in this context, we construct a comprehensive data repository comprising 34,000 synthetic datasets with diverse structural properties. Each of them was processed using 10 popular clustering algorithms. The resulting clusterings were assessed via the Adjusted Rand Index (ARI) to establish ground truth labels, used for training and evaluation of our DL model. The proposed network architecture integrates convolutional, residual, and attention mechanisms to capture both local and global structural patterns from the input data. This design supports end-to-end training to learn compact representations of datasets and enables direct recommendation of the most suitable clustering algorithm, reducing reliance on handcrafted meta-features and traditional Cluster Validity Indices (CVIs). Comprehensive experiments across synthetic and real-world benchmarks demonstrate that our DL model consistently outperforms conventional CVIs (e.g. Silhouette, Calinski-Harabasz, Davies-Bouldin, and Dunn) as well as state-of-the-art AutoML clustering recommendation approaches (e.g. ML2DAC, AutoCluster, and AutoML4Clust). Notably, the proposed model achieves a 0.497 ARI improvement over the Calinski-Harabasz index on synthetic data and a 15.3% ARI gain over the best-performing AutoML approach on real-world data.
- Abstract(参考訳): ClustRecNetは、与えられたデータセットに対して最適なクラスタリングアルゴリズムを決定するための、新しいディープラーニング(DL)ベースのレコメンデーションフレームワークであり、教師なし学習におけるクラスタリングアルゴリズムの選択という長年の課題に対処する。
この文脈で教師付き学習を可能にするために,多種多様な構造を持つ34,000の合成データセットからなる包括的データリポジトリを構築した。
それぞれが10の一般的なクラスタリングアルゴリズムを使用して処理された。
その結果,アダクテッド・ランド・インデックス (ARI) を用いてクラスタリングを行い,基礎的真理ラベルを確立し,DLモデルのトレーニングと評価に利用した。
提案したネットワークアーキテクチャは、畳み込み、残差、注意機構を統合し、入力データから局所的および大域的構造パターンをキャプチャする。
この設計は、データセットのコンパクトな表現を学ぶためのエンドツーエンドのトレーニングをサポートし、最も適切なクラスタリングアルゴリズムの直接的な推奨を可能にし、手作りのメタ機能や従来のクラスタ検証インデックス(CVI)への依存を減らす。
総合的な実験により、我々のDLモデルは従来のCVI(例:Silhouette、Calinski-Harabasz、Davies-Bouldin、Dunn)と、最先端のAutoMLクラスタリング推奨アプローチ(例:ML2DAC、AutoCluster、AutoML4Clust)を一貫して上回ります。
特に,提案モデルでは,合成データに対するCalinski-Harabasz指数よりも0.497ARI,実世界のデータに対する最良のAutoMLアプローチよりも15.3%ARIが向上している。
関連論文リスト
- Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Autoencoded UMAP-Enhanced Clustering for Unsupervised Learning [49.1574468325115]
本稿では,低次元空間にデータを非線形に埋め込み,次に従来のクラスタリングアルゴリズムを用いて非教師なし学習を行う手法を提案する。
この埋め込みはデータのクラスタビリティを促進し、オートエンコーダニューラルネットワークのエンコーダとUMAPアルゴリズムの出力の2つのマッピングで構成されている。
MNISTデータに適用した場合、AUECはクラスタリング精度において最先端技術よりも大幅に優れている。
論文 参考訳(メタデータ) (2025-01-13T22:30:38Z) - AdaptiveMDL-GenClust: A Robust Clustering Framework Integrating Normalized Mutual Information and Evolutionary Algorithms [0.0]
我々は,最小記述長(MDL)原理と遺伝的最適化アルゴリズムを組み合わせたロバストクラスタリングフレームワークを提案する。
このフレームワークは、初期クラスタリングソリューションを生成するためのアンサンブルクラスタリングアプローチから始まり、MDL誘導評価関数を使用して洗練され、遺伝的アルゴリズムによって最適化される。
実験の結果,従来のクラスタリング手法を一貫して上回り,精度の向上,安定性の向上,バイアス低減を実現している。
論文 参考訳(メタデータ) (2024-11-26T20:26:14Z) - Adaptive Self-supervised Robust Clustering for Unstructured Data with Unknown Cluster Number [12.926206811876174]
適応型自己教師型ロバストクラスタリング(Adaptive Self-supervised Robust Clustering, ASRC)と呼ばれる非構造化データに適した,新たな自己教師型ディープクラスタリング手法を提案する。
ASRCはグラフ構造とエッジ重みを適応的に学習し、局所構造情報と大域構造情報の両方をキャプチャする。
ASRCは、クラスタ数の事前知識に依存するメソッドよりも優れており、非構造化データのクラスタリングの課題に対処する上での有効性を強調している。
論文 参考訳(メタデータ) (2024-07-29T15:51:09Z) - End-to-end Learnable Clustering for Intent Learning in Recommendation [54.157784572994316]
我々は、アンダーラインELCRecと呼ばれる新しい意図学習手法を提案する。
振る舞い表現学習をUnderlineEnd-to-end UnderlineLearnable UnderlineClusteringフレームワークに統合する。
1億3000万ページビューの産業レコメンデーションシステムに本手法をデプロイし,有望な結果を得る。
論文 参考訳(メタデータ) (2024-01-11T15:22:55Z) - Improving k-Means Clustering Performance with Disentangled Internal
Representations [0.0]
本稿では,オートエンコーダの学習遅延符号表現の絡み合いを最適化する,シンプルなアプローチを提案する。
提案手法を用いて,MNISTデータセットでは96.2%,Fashion-MNISTデータセットでは85.6%,EMNIST Balancedデータセットでは79.2%,ベースラインモデルでは79.2%であった。
論文 参考訳(メタデータ) (2020-06-05T11:32:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。