論文の概要: Hyperoctant Search Clustering: A Method for Clustering Data in High-Dimensional Hyperspheres
- arxiv url: http://arxiv.org/abs/2503.07917v1
- Date: Mon, 10 Mar 2025 23:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:42:04.052430
- Title: Hyperoctant Search Clustering: A Method for Clustering Data in High-Dimensional Hyperspheres
- Title(参考訳): ハイパーオクタント探索クラスタリング:高次元超球面におけるデータのクラスタリング方法
- Authors: Mauricio Toledo-Acosta, Luis Ángel Ramos-García, Jorge Hermosillo-Valadez,
- Abstract要約: 座標の符号(ハイパーロクタント)によって定義される空間の領域に適用される位相的アプローチに基づく新しいクラスタリング法を提案する。
密度基準によれば、この方法はグラフの分割に基づいてデータポイントのクラスタを構築する。
テキストマイニングにおいて重要な課題である話題検出の応用を選択する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Clustering of high-dimensional data sets is a growing need in artificial intelligence, machine learning and pattern recognition. In this paper, we propose a new clustering method based on a combinatorial-topological approach applied to regions of space defined by signs of coordinates (hyperoctants). In high-dimensional spaces, this approach often reduces the size of the dataset while preserving sufficient topological features. According to a density criterion, the method builds clusters of data points based on the partitioning of a graph, whose vertices represent hyperoctants, and whose edges connect neighboring hyperoctants under the Levenshtein distance. We call this method HyperOctant Search Clustering. We prove some mathematical properties of the method. In order to as assess its performance, we choose the application of topic detection, which is an important task in text mining. Our results suggest that our method is more stable under variations of the main hyperparameter, and remarkably, it is not only a clustering method, but also a tool to explore the dataset from a topological perspective, as it directly provides information about the number of hyperoctants where there are data points. We also discuss the possible connections between our clustering method and other research fields.
- Abstract(参考訳): 高次元データセットのクラスタ化は、人工知能、機械学習、パターン認識においてますます必要となってきている。
本稿では,座標の符号(ハイパーロクタント)によって定義される空間の領域に対して,組合せトポロジカルアプローチを応用した新しいクラスタリング手法を提案する。
高次元空間では、この手法は十分な位相的特徴を保ちながらデータセットのサイズを小さくする。
密度基準によれば、この手法はグラフの分割に基づいてデータポイントのクラスタを構築し、頂点は超八分体を表し、辺はレヴェンシュテイン距離の下で隣接する超八分体を接続する。
この手法をHyperOctant Search Clusteringと呼ぶ。
我々はこの方法の数学的性質を証明した。
その性能を評価するため,テキストマイニングにおいて重要な課題である話題検出の応用を選択する。
以上の結果から,本手法は主パラメータの変動の下でより安定であることが示唆され,また,クラスタリング法のみならず,データポイントが存在する場合のハイパーオクタント数の直接的情報を提供するため,トポロジカルな視点からデータセットを探索するためのツールでもある。
また,クラスタリング法と他の研究分野の関連性についても論じる。
関連論文リスト
- DECWA : Density-Based Clustering using Wasserstein Distance [1.4132765964347058]
空間密度と確率的アプローチに基づく新しいクラスタリングアルゴリズムを提案する。
提案手法は, 様々なデータセットにおいて, 最先端の密度に基づくクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-25T11:10:08Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - An adaptive granularity clustering method based on hyper-ball [11.35322380857363]
本手法は, 類似した分布を持つデータがハイパーボールとなり, 隣接するハイパーボールがクラスタとなるという考え方に基づいている。
この手法は「大規模ファースト」の認知法則に基づき、単純で非パラメトリックな方法で形状を考慮せずにクラスターを識別することができる。
論文 参考訳(メタデータ) (2022-05-29T07:44:09Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Clustering Plotted Data by Image Segmentation [12.443102864446223]
クラスタリングアルゴリズムは、ラベルなしデータのパターンを検出する主要な分析手法の1つである。
本稿では,人間のクラスタリングデータに着想を得た,2次元空間におけるクラスタリングポイントの全く異なる方法を提案する。
私たちのアプローチであるVisual Clusteringは、従来のクラスタリングアルゴリズムよりもいくつかのアドバンテージを持っています。
論文 参考訳(メタデータ) (2021-10-06T06:19:30Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。