Fugu-MT 論文翻訳(概要): Dendrogram of mixing measures: Hierarchical clustering and model selection for finite mixture models

論文の概要: Dendrogram of mixing measures: Hierarchical clustering and model selection for finite mixture models

arxiv url: http://arxiv.org/abs/2403.01684v2
Date: Fri, 8 Mar 2024 16:39:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-11 10:48:56.024345
Title: Dendrogram of mixing measures: Hierarchical clustering and model selection for finite mixture models
Title（参考訳）: 混合測度のデンドログラム:有限混合モデルの階層的クラスタリングとモデル選択
Authors: Dat Do, Linh Do, Scott A. McKinley, Jonathan Terhorst, XuanLong Nguyen
Abstract要約: 本稿では,過度に適合した潜在混合指標から構築した階層的クラスタリング木(デンドログラム)を用いて,混合モデルを要約し,選択する新しい方法を提案する。提案手法は,集合的階層的クラスタリングと混合モデリングを橋渡しする。
参考スコア（独自算出の注目度）: 5.044813181406083
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a new way to summarize and select mixture models via the hierarchical clustering tree (dendrogram) constructed from an overfitted latent mixing measure. Our proposed method bridges agglomerative hierarchical clustering and mixture modeling. The dendrogram's construction is derived from the theory of convergence of the mixing measures, and as a result, we can both consistently select the true number of mixing components and obtain the pointwise optimal convergence rate for parameter estimation from the tree, even when the model parameters are only weakly identifiable. In theory, it explicates the choice of the optimal number of clusters in hierarchical clustering. In practice, the dendrogram reveals more information on the hierarchy of subpopulations compared to traditional ways of summarizing mixture models. Several simulation studies are carried out to support our theory. We also illustrate the methodology with an application to single-cell RNA sequence analysis.
Abstract（参考訳）: 本稿では,過剰な潜在混合尺度から構築した階層的クラスタリング木 (dendrogram) を用いて混合モデルを要約・選択する新しい手法を提案する。提案手法は階層的クラスタリングと混合モデリングを橋渡しする。デンドログラムの構成は混合測度の収束の理論から導出され、その結果、モデルパラメータが弱識別可能であっても、真の混合成分数を一貫して選択し、木からパラメータ推定のためのポイントワイズ最適収束率を得ることができる。理論的には、階層的クラスタリングにおいて最適な数のクラスタを選択する。実際には、デンドログラムは、混合モデルを要約する伝統的な方法と比較して、サブポピュレーションの階層に関するより多くの情報を明らかにする。我々の理論を支持するためにいくつかのシミュレーション研究が行われた。また,この手法を単細胞RNA配列解析に適用する方法について述べる。

関連論文リスト

A Bayesian approach to learning mixtures of nonparametric components [12.42953971157138]
多くの応用において、潜在サブポピュレーション分布に対するパラメトリックな仮定は非現実的である。ベイズ的非パラメトリックモデリング手法を用いて,非パラメトリック混合成分の有限混合について検討した。
論文参考訳（メタデータ） (2025-12-15T05:27:01Z)
Copula-based mixture model identification for subgroup clustering with imaging applications [2.285847431713438]
クラスタリングのためのより柔軟な Copula-Based Mixture Model (CBMM) について検討する。 CBMMは、辺形とコプラ形の柔軟な選択によって構成される異種成分分布を許容する。
論文参考訳（メタデータ） (2025-02-12T16:30:39Z)
Amortized Bayesian Mixture Models [1.3976439685325095]
本稿では,混合モデルに適したABI(Amortized Bayesian Inference)の拡張について紹介する。我々は、後部をパラメータの分布と(カテゴリー的な)混合指標の分布に分解し、生成ニューラルネットワークの組み合わせを利用できるようにする。提案フレームワークは、独立混合モデルと依存混合モデルの両方に対応し、フィルタリングと平滑化を可能にする。
論文参考訳（メタデータ） (2025-01-17T14:51:03Z)
Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures [3.0478550046333965]
データ駆動モデルを改善するための新しいジェネリックアプローチを導入する。化学のクラスに同じように振る舞うコンポーネントを持ち込み、それらを共同でモデル化します。クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
論文参考訳（メタデータ） (2024-10-08T14:04:30Z)
Adaptive Fuzzy C-Means with Graph Embedding [84.47075244116782]
ファジィクラスタリングアルゴリズムは、大まかに2つの主要なグループに分類できる: ファジィC平均法(FCM)と混合モデルに基づく方法。本稿では,FCMを用いたクラスタリングモデルを提案する。
論文参考訳（メタデータ） (2024-05-22T08:15:50Z)
Mixture of multilayer stochastic block models for multiview clustering [0.0]
本稿では,異なる情報源から得られた複数のクラスタリングを集約する独自の手法を提案する。モデルパラメータの同定可能性を確立し,これらのパラメータを推定するために変分ベイズEMアルゴリズムを提案する。この手法は、グローバルな食品取引網の分析に利用され、興味のある構造に繋がる。
論文参考訳（メタデータ） (2024-01-09T17:15:47Z)
Time Series Clustering with an EM algorithm for Mixtures of Linear Gaussian State Space Models [0.0]
線形ガウス状態空間モデルを混合したモデルに基づく時系列クラスタリング手法を提案する。提案手法では,混合モデルの予測最大化アルゴリズムを用いてモデルパラメータを推定する。シミュレーションデータセットの実験は、クラスタリング、パラメータ推定、モデル選択における手法の有効性を示す。
論文参考訳（メタデータ） (2022-08-25T07:41:23Z)
Fitting large mixture models using stochastic component selection [0.0]
本稿では,少数のコンポーネントのみを評価するために,計算とメトロポリス・ハスティングスアルゴリズムの期待値の組み合わせを提案する。コンポーネント割り当てのマルコフ連鎖は、アルゴリズムのイテレーション間で順次生成される。提案手法の一般性を重視し,浅い混合モデルと深い混合モデルの両方を訓練する能力を備える。
論文参考訳（メタデータ） (2021-10-10T12:39:53Z)
Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。新規な構造化融合正規化に基づく一般グラフ推定器を提案する。提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文参考訳（メタデータ） (2021-03-05T04:42:32Z)
Vine copula mixture models and clustering for non-Gaussian data [0.0]
連続データのための新しいブドウパウラ混合モデルを提案する。本研究では, モデルベースクラスタリングアルゴリズムにおいて, ベインコプラ混合モデルが他のモデルベースクラスタリング手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-02-05T16:04:26Z)
Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。 7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文参考訳（メタデータ） (2020-12-16T13:01:37Z)
Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文参考訳（メタデータ） (2020-10-22T15:58:35Z)
Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文参考訳（メタデータ） (2020-10-12T03:27:07Z)
Clustering Binary Data by Application of Combinatorial Optimization Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文参考訳（メタデータ） (2020-01-06T23:33:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。