Fugu-MT 論文翻訳(概要): Dying Clusters Is All You Need -- Deep Clustering With an Unknown Number of Clusters

論文の概要: Dying Clusters Is All You Need -- Deep Clustering With an Unknown Number of Clusters

arxiv url: http://arxiv.org/abs/2410.09491v1
Date: Sat, 12 Oct 2024 11:04:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-30 14:04:51.749418
Title: Dying Clusters Is All You Need -- Deep Clustering With an Unknown Number of Clusters
Title（参考訳）: Dying Clustersは必要なものすべて - 未知の数のクラスタによるディープクラスタリング
Authors: Collin Leiber, Niklas Strauß, Matthias Schubert, Thomas Seidl,
Abstract要約: 高次元データで有意義なグループを見つけることは、データマイニングにおいて重要な課題である。深層クラスタリング手法はこれらの課題において顕著な成果を上げている。これらのメソッドの多くは、事前にクラスタの数を指定する必要がある。これは、ラベル付きデータが利用できない場合、クラスタの数は通常不明であるため、大きな制限となる。これらのアプローチのほとんどは、クラスタリングプロセスから分離されたクラスタの数を見積もっています。
参考スコア（独自算出の注目度）: 5.507296054825372
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Finding meaningful groups, i.e., clusters, in high-dimensional data such as images or texts without labeled data at hand is an important challenge in data mining. In recent years, deep clustering methods have achieved remarkable results in these tasks. However, most of these methods require the user to specify the number of clusters in advance. This is a major limitation since the number of clusters is typically unknown if labeled data is unavailable. Thus, an area of research has emerged that addresses this problem. Most of these approaches estimate the number of clusters separated from the clustering process. This results in a strong dependency of the clustering result on the quality of the initial embedding. Other approaches are tailored to specific clustering processes, making them hard to adapt to other scenarios. In this paper, we propose UNSEEN, a general framework that, starting from a given upper bound, is able to estimate the number of clusters. To the best of our knowledge, it is the first method that can be easily combined with various deep clustering algorithms. We demonstrate the applicability of our approach by combining UNSEEN with the popular deep clustering algorithms DCN, DEC, and DKM and verify its effectiveness through an extensive experimental evaluation on several image and tabular datasets. Moreover, we perform numerous ablations to analyze our approach and show the importance of its components. The code is available at: https://github.com/collinleiber/UNSEEN
Abstract（参考訳）: 画像やテキストなどの高次元データに有意義なグループ、すなわちクラスタを見つけることは、データマイニングにおいて重要な課題である。近年,深層クラスタリング手法はこれらの課題において顕著な成果を上げている。しかし,これらの手法の多くは,事前にクラスタ数を指定する必要がある。これは、ラベル付きデータが利用できない場合、クラスタの数は通常不明であるため、大きな制限となる。そのため、この問題に対処する研究領域が出現した。これらのアプローチのほとんどは、クラスタリングプロセスから分離されたクラスタの数を見積もっています。これにより、クラスタリングの結果が初期埋め込みの品質に強く依存する。他のアプローチは特定のクラスタリングプロセスに合わせており、他のシナリオへの適応が難しい。本稿では、与えられた上限から始まる一般的なフレームワークであるUNSEENを提案し、クラスタ数を推定できる。我々の知る限りでは、これは様々な深層クラスタリングアルゴリズムと簡単に組み合わせられる最初の方法である。我々は、UNSEENと一般的なディープクラスタリングアルゴリズムDCN、DEC、DKMを組み合わせることで、我々のアプローチの適用性を実証し、その有効性を検証する。さらに、我々のアプローチを分析し、そのコンポーネントの重要性を示すために、多数のアブリケーションを実行します。コードは、https://github.com/collinleiber/UNSEENで入手できる。

関連論文リスト

Depth-Based Local Center Clustering: A Framework for Handling Different Clustering Scenarios [46.164361878412656]
クラスター分析は多くの科学・工学分野において重要な役割を担っている。過去数十年にわたって提案されてきたクラスタリングメソッドにもかかわらず、それぞれのメソッドは通常、特定のシナリオのために設計されている。本稿では,深度に基づくクラスタリング(DLCC)を提案する。 DLCCはデータのサブセットに基づくデータ深度のローカルバージョンを利用する
論文参考訳（メタデータ） (2025-05-14T16:08:11Z)
Guaranteed Recovery of Unambiguous Clusters [7.011239860967789]
クラスタリングは、しばしば難しい問題である。なぜなら、それは、"正しい"クラスタリングがどうあるべきかに固有の曖昧さのためである。本稿では,不明瞭な場合のクラスタリングを復元するアルゴリズムについて,情報理論による特徴付けと設計を提案する。
論文参考訳（メタデータ） (2025-01-22T18:51:25Z)
ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文参考訳（メタデータ） (2024-07-31T08:29:35Z)
UniForCE: The Unimodality Forest Method for Clustering and Estimation of the Number of Clusters [2.4953699842881605]
我々は,一様性の概念に着目し,局所的一様性クラスタと呼ばれる柔軟なクラスタ定義を提案する。局所的ユニモーダルクラスタは、データのサブクラスタのペア間で一様性が局所的に保存される限り、拡張される。局所的な単調クラスタリングのためのUniForCE法を提案する。
論文参考訳（メタデータ） (2023-12-18T16:19:02Z)
Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文参考訳（メタデータ） (2023-08-13T18:12:28Z)
Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文参考訳（メタデータ） (2023-06-18T08:46:06Z)
Hard Regularization to Prevent Deep Online Clustering Collapse without Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。本稿では,データ拡張を必要としない手法を提案する。
論文参考訳（メタデータ） (2023-03-29T08:23:26Z)
Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文参考訳（メタデータ） (2022-10-09T02:31:32Z)
DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。 6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文参考訳（メタデータ） (2022-06-01T09:51:38Z)
Analysis of Sparse Subspace Clustering: Experiments and Random Projection [0.0]
クラスタリングは、顔クラスタリング、植物分類、イメージセグメンテーション、文書分類など、多くの領域で使われているテクニックである。 Sparse Subspace Clustering(スパース・サブスペース・クラスタリング)と呼ばれる強力なクラスタリングアルゴリズムを解析する。本稿では,本手法を用いて実験を行い,スパース部分空間クラスタリングを行うために必要な計算時間を削減できる新しい手法を提案する。
論文参考訳（メタデータ） (2022-04-01T23:55:53Z)
Clustering Plotted Data by Image Segmentation [12.443102864446223]
クラスタリングアルゴリズムは、ラベルなしデータのパターンを検出する主要な分析手法の1つである。本稿では,人間のクラスタリングデータに着想を得た,2次元空間におけるクラスタリングポイントの全く異なる方法を提案する。私たちのアプローチであるVisual Clusteringは、従来のクラスタリングアルゴリズムよりもいくつかのアドバンテージを持っています。
論文参考訳（メタデータ） (2021-10-06T06:19:30Z)
Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文参考訳（メタデータ） (2020-10-22T15:58:35Z)
Spectral Clustering with Smooth Tiny Clusters [14.483043753721256]
本稿では,データのスムーズさを初めて考慮した新しいクラスタリングアルゴリズムを提案する。私たちのキーとなるアイデアは、スムーズなグラフを構成する小さなクラスタをクラスタ化することです。本稿では,マルチスケールな状況に着目するが,データのスムーズさの考え方はどのクラスタリングアルゴリズムにも確実に拡張できる。
論文参考訳（メタデータ） (2020-09-10T05:21:20Z)
Probabilistic Partitive Partitioning (PPP) [0.0]
クラスタリングアルゴリズムは一般に2つの一般的な問題に直面している。彼らは異なる初期条件で異なる設定に収束する。クラスタの数は、事前に任意に決めなければならない。
論文参考訳（メタデータ） (2020-03-09T19:18:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。