論文の概要: Dendrogram of mixing measures: Hierarchical clustering and model
selection for finite mixture models
- arxiv url: http://arxiv.org/abs/2403.01684v2
- Date: Fri, 8 Mar 2024 16:39:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 10:48:56.024345
- Title: Dendrogram of mixing measures: Hierarchical clustering and model
selection for finite mixture models
- Title(参考訳): 混合測度のデンドログラム:有限混合モデルの階層的クラスタリングとモデル選択
- Authors: Dat Do, Linh Do, Scott A. McKinley, Jonathan Terhorst, XuanLong Nguyen
- Abstract要約: 本稿では,過度に適合した潜在混合指標から構築した階層的クラスタリング木(デンドログラム)を用いて,混合モデルを要約し,選択する新しい方法を提案する。
提案手法は,集合的階層的クラスタリングと混合モデリングを橋渡しする。
- 参考スコア(独自算出の注目度): 5.044813181406083
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new way to summarize and select mixture models via the
hierarchical clustering tree (dendrogram) constructed from an overfitted latent
mixing measure. Our proposed method bridges agglomerative hierarchical
clustering and mixture modeling. The dendrogram's construction is derived from
the theory of convergence of the mixing measures, and as a result, we can both
consistently select the true number of mixing components and obtain the
pointwise optimal convergence rate for parameter estimation from the tree, even
when the model parameters are only weakly identifiable. In theory, it
explicates the choice of the optimal number of clusters in hierarchical
clustering. In practice, the dendrogram reveals more information on the
hierarchy of subpopulations compared to traditional ways of summarizing mixture
models. Several simulation studies are carried out to support our theory. We
also illustrate the methodology with an application to single-cell RNA sequence
analysis.
- Abstract(参考訳): 本稿では,過剰な潜在混合尺度から構築した階層的クラスタリング木 (dendrogram) を用いて混合モデルを要約・選択する新しい手法を提案する。
提案手法は階層的クラスタリングと混合モデリングを橋渡しする。
デンドログラムの構成は混合測度の収束の理論から導出され、その結果、モデルパラメータが弱識別可能であっても、真の混合成分数を一貫して選択し、木からパラメータ推定のためのポイントワイズ最適収束率を得ることができる。
理論的には、階層的クラスタリングにおいて最適な数のクラスタを選択する。
実際には、デンドログラムは、混合モデルを要約する伝統的な方法と比較して、サブポピュレーションの階層に関するより多くの情報を明らかにする。
我々の理論を支持するためにいくつかのシミュレーション研究が行われた。
また,この手法を単細胞RNA配列解析に適用する方法について述べる。
関連論文リスト
- Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures [3.0478550046333965]
データ駆動モデルを改善するための新しいジェネリックアプローチを導入する。
化学のクラスに同じように振る舞うコンポーネントを持ち込み、それらを共同でモデル化します。
クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
論文 参考訳(メタデータ) (2024-10-08T14:04:30Z) - Adaptive Fuzzy C-Means with Graph Embedding [84.47075244116782]
ファジィクラスタリングアルゴリズムは、大まかに2つの主要なグループに分類できる: ファジィC平均法(FCM)と混合モデルに基づく方法。
本稿では,FCMを用いたクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2024-05-22T08:15:50Z) - Mixture of multilayer stochastic block models for multiview clustering [0.0]
本稿では,異なる情報源から得られた複数のクラスタリングを集約する独自の手法を提案する。
モデルパラメータの同定可能性を確立し,これらのパラメータを推定するために変分ベイズEMアルゴリズムを提案する。
この手法は、グローバルな食品取引網の分析に利用され、興味のある構造に繋がる。
論文 参考訳(メタデータ) (2024-01-09T17:15:47Z) - Time Series Clustering with an EM algorithm for Mixtures of Linear
Gaussian State Space Models [0.0]
線形ガウス状態空間モデルを混合したモデルに基づく時系列クラスタリング手法を提案する。
提案手法では,混合モデルの予測最大化アルゴリズムを用いてモデルパラメータを推定する。
シミュレーションデータセットの実験は、クラスタリング、パラメータ推定、モデル選択における手法の有効性を示す。
論文 参考訳(メタデータ) (2022-08-25T07:41:23Z) - Fitting large mixture models using stochastic component selection [0.0]
本稿では,少数のコンポーネントのみを評価するために,計算とメトロポリス・ハスティングスアルゴリズムの期待値の組み合わせを提案する。
コンポーネント割り当てのマルコフ連鎖は、アルゴリズムのイテレーション間で順次生成される。
提案手法の一般性を重視し,浅い混合モデルと深い混合モデルの両方を訓練する能力を備える。
論文 参考訳(メタデータ) (2021-10-10T12:39:53Z) - Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。
新規な構造化融合正規化に基づく一般グラフ推定器を提案する。
提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文 参考訳(メタデータ) (2021-03-05T04:42:32Z) - Vine copula mixture models and clustering for non-Gaussian data [0.0]
連続データのための新しいブドウパウラ混合モデルを提案する。
本研究では, モデルベースクラスタリングアルゴリズムにおいて, ベインコプラ混合モデルが他のモデルベースクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-05T16:04:26Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。