論文の概要: clusterBMA: Bayesian model averaging for clustering
- arxiv url: http://arxiv.org/abs/2209.04117v2
- Date: Sun, 26 Mar 2023 03:10:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 02:35:10.885121
- Title: clusterBMA: Bayesian model averaging for clustering
- Title(参考訳): clusterBMA: クラスタリングのためのベイジアンモデル平均化
- Authors: Owen Forbes, Edgar Santos-Fernandez, Paul Pao-Yen Wu, Hong-Bo Xie,
Paul E. Schwenn, Jim Lagopoulos, Lia Mills, Dashiell D. Sacks, Daniel F.
Hermens, Kerrie Mengersen
- Abstract要約: 本稿では、教師なしクラスタリングアルゴリズムの結果の重み付きモデル平均化を可能にするクラスタBMAを提案する。
クラスタリング内部検証基準を用いて、各モデルの結果の重み付けに使用される後続モデル確率の近似を開発する。
シミュレーションデータ上での他のアンサンブルクラスタリングメソッドのパフォーマンスに加えて、クラスタBMAは平均クラスタへの確率的アロケーションを含むユニークな機能を提供する。
- 参考スコア(独自算出の注目度): 1.2021605201770345
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Various methods have been developed to combine inference across multiple sets
of results for unsupervised clustering, within the ensemble clustering
literature. The approach of reporting results from one `best' model out of
several candidate clustering models generally ignores the uncertainty that
arises from model selection, and results in inferences that are sensitive to
the particular model and parameters chosen. Bayesian model averaging (BMA) is a
popular approach for combining results across multiple models that offers some
attractive benefits in this setting, including probabilistic interpretation of
the combined cluster structure and quantification of model-based uncertainty.
In this work we introduce clusterBMA, a method that enables weighted model
averaging across results from multiple unsupervised clustering algorithms. We
use clustering internal validation criteria to develop an approximation of the
posterior model probability, used for weighting the results from each model.
From a consensus matrix representing a weighted average of the clustering
solutions across models, we apply symmetric simplex matrix factorisation to
calculate final probabilistic cluster allocations. In addition to outperforming
other ensemble clustering methods on simulated data, clusterBMA offers unique
features including probabilistic allocation to averaged clusters, combining
allocation probabilities from 'hard' and 'soft' clustering algorithms, and
measuring model-based uncertainty in averaged cluster allocation. This method
is implemented in an accompanying R package of the same name.
- Abstract(参考訳): アンサンブルクラスタリングの文献において、教師なしクラスタリングのための複数の結果集合間の推論を組み合わせるための様々な手法が開発されている。
複数の候補クラスタリングモデルから1つの"ベスト"モデルからの結果を報告するアプローチは、一般的にモデル選択から生じる不確実性を無視し、特定のモデルやパラメータに敏感な推論結果を生成する。
ベイズモデル平均化(ベイズモデル平均化、英: Bayesian model averaging、BMA)は、クラスタ構造の確率論的解釈やモデルに基づく不確実性の定量化など、複数のモデルにまたがる結果を組み合わせる一般的な手法である。
本研究では,複数の教師なしクラスタリングアルゴリズムの結果を平均化する重み付きモデルを実現する方法であるclusterbmaを提案する。
各モデルからの結果を重み付けするために用いられる後モデル確率の近似を開発するために、クラスタリング内部検証基準を用いる。
モデル間のクラスタリングソリューションの重み付け平均を表すコンセンサス行列から、最終的な確率的クラスタ割り当てを計算するために対称なsimplex行列分解を適用する。
シミュレーションデータ上で他のアンサンブルクラスタリング手法よりも優れており、平均クラスタへの確率的割り当て、'ハード'と'ソフト'クラスタリングアルゴリズムからのアロケーション確率の組み合わせ、平均クラスタアロケーションにおけるモデルベースの不確実性の測定など、ユニークな機能を提供している。
この方法は同名のrパッケージに実装されている。
関連論文リスト
- Mixture of multilayer stochastic block models for multiview clustering [0.0]
本稿では,異なる情報源から得られた複数のクラスタリングを集約する独自の手法を提案する。
モデルパラメータの同定可能性を確立し,これらのパラメータを推定するために変分ベイズEMアルゴリズムを提案する。
この手法は、グローバルな食品取引網の分析に利用され、興味のある構造に繋がる。
論文 参考訳(メタデータ) (2024-01-09T17:15:47Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Time series clustering based on prediction accuracy of global
forecasting models [0.0]
本稿では,時系列のモデルに基づくクラスタリング手法を提案する。
文献で提案されているほとんどの手法とは異なり、この手法はクラスタリング分割を構成する主要な要素として予測精度を考慮している。
シミュレーション実験により,クラスタリングの有効性と予測精度の両面で,本手法はいくつかの代替手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-30T13:12:19Z) - A parallelizable model-based approach for marginal and multivariate
clustering [0.0]
本稿では,モデルに基づくクラスタリングの頑健さを生かしたクラスタリング手法を提案する。
我々は、各マージンごとに異なる数のクラスタを持つことができる有限混合モデルを指定することで、この問題に対処する。
提案手法は、完全な(結合した)モデルベースのクラスタリング手法よりも、中程度から高次元の処理に適するだけでなく、計算的にも魅力的である。
論文 参考訳(メタデータ) (2022-12-07T23:54:41Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。