論文の概要: SMLSOM: The shrinking maximum likelihood self-organizing map
- arxiv url: http://arxiv.org/abs/2104.13971v1
- Date: Wed, 28 Apr 2021 18:50:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 12:47:41.697776
- Title: SMLSOM: The shrinking maximum likelihood self-organizing map
- Title(参考訳): smlsom: 最大可能性の自己組織化マップ
- Authors: Ryosuke Motegi and Yoichi Seki
- Abstract要約: 本稿では,確率分布モデルフレームワークに基づいて,適切な数のクラスタを自動的に選択するグリージーアルゴリズムを提案する。
既存の手法と比較して,提案手法は計算効率が高く,クラスタ数を正確に選択できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Determining the number of clusters in a dataset is a fundamental issue in
data clustering. Many methods have been proposed to solve the problem of
selecting the number of clusters, considering it to be a problem with regard to
model selection. This paper proposes a greedy algorithm that automatically
selects a suitable number of clusters based on a probability distribution model
framework. The algorithm includes two components. First, a generalization of
Kohonen's self-organizing map (SOM), which has nodes linked to a probability
distribution model, and which enables the algorithm to search for the winner
based on the likelihood of each node, is introduced. Second, the proposed
method uses a graph structure and a neighbor defined by the length of the
shortest path between nodes, in contrast to Kohonen's SOM in which the nodes
are fixed in the Euclidean space. This implementation makes it possible to
update its graph structure by cutting links to weakly connected nodes to avoid
unnecessary node deletion. The weakness of a node connection is measured using
the Kullback--Leibler divergence and the redundancy of a node is measured by
the minimum description length (MDL). This updating step makes it easy to
determine the suitable number of clusters. Compared with existing methods, our
proposed method is computationally efficient and can accurately select the
number of clusters and perform clustering.
- Abstract(参考訳): データセット内のクラスタ数を決定することは、データクラスタリングにおける根本的な問題である。
モデル選択に関する問題として,クラスタ数の選択という課題を解決するために,多くの手法が提案されている。
本稿では,確率分布モデルフレームワークに基づいて,適切な数のクラスタを自動的に選択するグリージーアルゴリズムを提案する。
アルゴリズムは2つのコンポーネントを含む。
まず,確率分布モデルにリンクしたノードを持つ,各ノードの確率に基づいて,アルゴリズムが勝者を探索することのできる,コホーネンの自己組織化マップ(SOM)の一般化を紹介する。
第2に,提案手法は,ノードがユークリッド空間に固定されたコホーネンのSOMとは対照的に,ノード間の最短経路の長さで定義されるグラフ構造と近傍を用いる。
この実装により、不要なノード削除を避けるために弱連結ノードへのリンクを切断することで、グラフ構造を更新することができる。
Kullback-Leibler分散を用いてノード接続の弱点を測定し、最小記述長(MDL)によりノードの冗長性を測定する。
この更新ステップにより、適切な数のクラスタを簡単に決定できる。
既存の手法と比較して,提案手法は計算効率が高く,クラスタ数を正確に選択し,クラスタリングを行うことができる。
関連論文リスト
- Clustering Based on Density Propagation and Subcluster Merging [92.15924057172195]
本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文 参考訳(メタデータ) (2024-11-04T04:09:36Z) - MeanCut: A Greedy-Optimized Graph Clustering via Path-based Similarity
and Degree Descent Criterion [0.6906005491572401]
スペクトルクラスタリングは、優れたパフォーマンス、簡単な実装、強力な適応性のために人気があり、魅力的です。
我々は,MeanCutを目的関数として提案し,非破壊グラフ分割の次数降下順で厳密に最適化する。
本アルゴリズムの有効性は,実世界のベンチマークによる検証と顔認識の適用によって実証される。
論文 参考訳(メタデータ) (2023-12-07T06:19:39Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Dink-Net: Neural Clustering on Large Graphs [59.10189693120368]
ディープグラフクラスタリング法 (Dink-Net) は, 拡張と縮小という概念を用いて提案される。
ノードを識別することにより、拡張によって劣化しても、表現は自己教師された方法で学習される。
クラスタリング分布は、提案したクラスタ拡張損失とクラスタ縮小損失を最小化することにより最適化される。
ランナアップと比較して、Dink-Net 9.62%は1100万ノードと16億エッジを持つogbn-papers100MデータセットでNMIの改善を実現している。
論文 参考訳(メタデータ) (2023-05-28T15:33:24Z) - Hybridization of K-means with improved firefly algorithm for automatic
clustering in high dimension [0.0]
最適なクラスタ数を求めるため,PCAを用いてSilhouette法とElbow法を実装した。
Fireflyアルゴリズムでは、全個体群は自動的にサブ集団に分割され、収束速度を減少させ、局所的なミニマにトラップされる。
本研究は,自動クラスタリングのためのK-meansとODFAモデルを組み合わせた改良型ホタルを提案する。
論文 参考訳(メタデータ) (2023-02-09T18:43:10Z) - ck-means, a novel unsupervised learning method that combines fuzzy and
crispy clustering methods to extract intersecting data [1.827510863075184]
本稿では,2つの特徴以上の共通点を共有するデータをクラスタリングする手法を提案する。
この手法の主な考え方は、ファジィ C-Means (FCM) アルゴリズムを用いてファジィクラスタを生成することである。
このアルゴリズムはまた、シルエット指数(SI)によって与えられるクラスタの一貫性に従って、FCMとk平均アルゴリズムのための最適なクラスタ数を見つけることができる。
論文 参考訳(メタデータ) (2022-06-17T19:29:50Z) - Recovering Unbalanced Communities in the Stochastic Block Model With
Application to Clustering with a Faulty Oracle [9.578056676899203]
オラクルブロックモデル(英: Oracle block model、SBM)は、ネットワークにおけるグラフクラスタリングやコミュニティ検出を研究するための基礎モデルである。
我々は,SBMのコミュニティを様々な大きさのコミュニティで復元する,シンプルなSVDベースのアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-17T08:51:19Z) - Local Graph Clustering with Network Lasso [90.66817876491052]
局所グラフクラスタリングのためのネットワークLasso法の統計的および計算的性質について検討する。
nLassoによって提供されるクラスタは、クラスタ境界とシードノードの間のネットワークフローを通じて、エレガントに特徴付けられる。
論文 参考訳(メタデータ) (2020-04-25T17:52:05Z) - Probabilistic Partitive Partitioning (PPP) [0.0]
クラスタリングアルゴリズムは一般に2つの一般的な問題に直面している。
彼らは異なる初期条件で異なる設定に収束する。
クラスタの数は、事前に任意に決めなければならない。
論文 参考訳(メタデータ) (2020-03-09T19:18:35Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。