論文の概要: clusterBMA: Bayesian model averaging for clustering
- arxiv url: http://arxiv.org/abs/2209.04117v1
- Date: Fri, 9 Sep 2022 04:55:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-12 13:11:51.404426
- Title: clusterBMA: Bayesian model averaging for clustering
- Title(参考訳): clusterBMA: クラスタリングのためのベイジアンモデル平均化
- Authors: Owen Forbes, Edgar Santos-Fernandez, Paul Pao-Yen Wu, Hong-Bo Xie,
Paul E. Schwenn, Jim Lagopoulos, Lia Mills, Dashiell D. Sacks, Daniel F.
Hermens, Kerrie Mengersen
- Abstract要約: clusterBMAは、教師なしクラスタリングアルゴリズムの結果を平均化する重み付けモデルを可能にする方法である。
我々は,クラスタリング内部検証基準の組み合わせを,各モデルの結果を重み付けするための後部モデル確率の新たな近似として用いた。
本稿では,脳波(EEG)データに基づく個体の確率的クラスタの同定を目的としたケーススタディを通じて,本手法の性能について検討する。
- 参考スコア(独自算出の注目度): 1.2021605201770345
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Various methods have been developed to combine inference across multiple sets
of results for unsupervised clustering, within the ensemble and consensus
clustering literature. The approach of reporting results from one `best' model
out of several candidate clustering models generally ignores the uncertainty
that arises from model selection, and results in inferences that are sensitive
to the particular model and parameters chosen, and assumptions made, especially
with small sample size or small cluster sizes. Bayesian model averaging (BMA)
is a popular approach for combining results across multiple models that offers
some attractive benefits in this setting, including probabilistic
interpretation of the combine cluster structure and quantification of
model-based uncertainty.
In this work we introduce clusterBMA, a method that enables weighted model
averaging across results from multiple unsupervised clustering algorithms. We
use a combination of clustering internal validation criteria as a novel
approximation of the posterior model probability for weighting the results from
each model. From a combined posterior similarity matrix representing a weighted
average of the clustering solutions across models, we apply symmetric simplex
matrix factorisation to calculate final probabilistic cluster allocations. This
method is implemented in an accompanying R package.
We explore the performance of this approach through a case study that aims to
to identify probabilistic clusters of individuals based on
electroencephalography (EEG) data. We also use simulated datasets to explore
the ability of the proposed technique to identify robust integrated clusters
with varying levels of separations between subgroups, and with varying numbers
of clusters between models.
- Abstract(参考訳): アンサンブルとコンセンサスクラスタリングの文献の中で、教師なしクラスタリングのための複数の結果集合に対する推論を組み合わせるために、様々な手法が開発されている。
複数のクラスタリングモデルのうちの1つの'best'モデルからの報告のアプローチは、一般的にモデル選択から生じる不確実性を無視し、選択した特定のモデルやパラメータに敏感な推測と、特に小さなサンプルサイズや小さなクラスタサイズでの仮定をもたらす。
ベイズモデル平均化(bayesian model averaging, bma)は、クラスタ構造の確率論的解釈やモデルに基づく不確かさの定量化など、複数のモデルにまたがる結果を組み合わせるための一般的なアプローチである。
本研究では,複数の教師なしクラスタリングアルゴリズムの結果を平均化する重み付きモデルを実現する方法であるclusterbmaを提案する。
我々は,クラスタリング内部検証基準の組み合わせを,各モデルの結果を重み付けするための後部モデル確率の新しい近似として利用する。
モデル間のクラスタリング解の重み付け平均を表す結合後類似性行列から、対称的単純行列分解を適用し、最終的な確率的クラスタ割り当てを計算する。
この方法は付随するRパッケージに実装される。
本稿では,脳波(EEG)データに基づく個体の確率的クラスタの同定を目的としたケーススタディを通じて,本手法の性能を検討する。
また、シミュレーションデータセットを用いて、サブグループ間の分離レベルやモデル間でのクラスタ数が異なるロバストな統合クラスタを識別する手法について検討した。
関連論文リスト
- Mixture of multilayer stochastic block models for multiview clustering [0.0]
本稿では,異なる情報源から得られた複数のクラスタリングを集約する独自の手法を提案する。
モデルパラメータの同定可能性を確立し,これらのパラメータを推定するために変分ベイズEMアルゴリズムを提案する。
この手法は、グローバルな食品取引網の分析に利用され、興味のある構造に繋がる。
論文 参考訳(メタデータ) (2024-01-09T17:15:47Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Time series clustering based on prediction accuracy of global
forecasting models [0.0]
本稿では,時系列のモデルに基づくクラスタリング手法を提案する。
文献で提案されているほとんどの手法とは異なり、この手法はクラスタリング分割を構成する主要な要素として予測精度を考慮している。
シミュレーション実験により,クラスタリングの有効性と予測精度の両面で,本手法はいくつかの代替手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-30T13:12:19Z) - A parallelizable model-based approach for marginal and multivariate
clustering [0.0]
本稿では,モデルに基づくクラスタリングの頑健さを生かしたクラスタリング手法を提案する。
我々は、各マージンごとに異なる数のクラスタを持つことができる有限混合モデルを指定することで、この問題に対処する。
提案手法は、完全な(結合した)モデルベースのクラスタリング手法よりも、中程度から高次元の処理に適するだけでなく、計算的にも魅力的である。
論文 参考訳(メタデータ) (2022-12-07T23:54:41Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。