論文の概要: Kernel learning approaches for summarising and combining posterior
similarity matrices
- arxiv url: http://arxiv.org/abs/2009.12852v1
- Date: Sun, 27 Sep 2020 14:16:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 03:43:35.356411
- Title: Kernel learning approaches for summarising and combining posterior
similarity matrices
- Title(参考訳): 後続類似度行列の要約と組み合わせのためのカーネル学習手法
- Authors: Alessandra Cabassi, Sylvia Richardson, Paul D. W. Kirk
- Abstract要約: 我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
- 参考スコア(独自算出の注目度): 68.8204255655161
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When using Markov chain Monte Carlo (MCMC) algorithms to perform inference
for Bayesian clustering models, such as mixture models, the output is typically
a sample of clusterings (partitions) drawn from the posterior distribution. In
practice, a key challenge is how to summarise this output. Here we build upon
the notion of the posterior similarity matrix (PSM) in order to suggest new
approaches for summarising the output of MCMC algorithms for Bayesian
clustering models. A key contribution of our work is the observation that PSMs
are positive semi-definite, and hence can be used to define
probabilistically-motivated kernel matrices that capture the clustering
structure present in the data. This observation enables us to employ a range of
kernel methods to obtain summary clusterings, and otherwise exploit the
information summarised by PSMs. For example, if we have multiple PSMs, each
corresponding to a different dataset on a common set of statistical units, we
may use standard methods for combining kernels in order to perform integrative
clustering. We may moreover embed PSMs within predictive kernel models in order
to perform outcome-guided data integration. We demonstrate the performances of
the proposed methods through a range of simulation studies as well as two real
data applications. R code is available at
https://github.com/acabassi/combine-psms.
- Abstract(参考訳): マルコフ連鎖モンテカルロ(MCMC)アルゴリズムを用いて混合モデルのようなベイズ的クラスタリングモデルの推論を行う場合、出力は通常、後部分布から引き出されたクラスタリング(分割)のサンプルである。
実際に重要な課題は、このアウトプットを要約する方法だ。
ここでは、ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために、後部類似性行列(PSM)の概念を構築する。
我々の研究の重要な貢献は、PSMは正の半定値であり、従ってデータに存在するクラスタリング構造を捉える確率的に動機づけられたカーネル行列を定義するのに使うことができることである。
この観察により,サマリクラスタリングの取得にカーネル手法を多用し,psmで要約された情報を活用できる。
例えば、複数のPSMがあり、それぞれが共通の統計単位上の異なるデータセットに対応する場合、積分クラスタリングを実行するためにカーネルを組み合わせる標準的な方法を用いることができる。
さらに、結果誘導データ統合を実行するために予測カーネルモデルにpsmを組み込むこともできる。
本研究では,提案手法の性能をシミュレーション実験と2つの実データ応用を用いて実証する。
Rコードはhttps://github.com/acabassi/combine-psmsで入手できる。
関連論文リスト
- Mixture of multilayer stochastic block models for multiview clustering [0.0]
本稿では,異なる情報源から得られた複数のクラスタリングを集約する独自の手法を提案する。
モデルパラメータの同定可能性を確立し,これらのパラメータを推定するために変分ベイズEMアルゴリズムを提案する。
この手法は、グローバルな食品取引網の分析に利用され、興味のある構造に繋がる。
論文 参考訳(メタデータ) (2024-01-09T17:15:47Z) - Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for
Clustering Count Data [0.8499685241219366]
因子分析モデルの混合に基づく8種類の擬似混合モデルについて紹介する。
提案モデルはRNAシークエンシング研究から得られた離散的なデータをクラスタリングする文脈において探索される。
論文 参考訳(メタデータ) (2023-11-13T21:23:15Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z) - clusterBMA: Bayesian model averaging for clustering [1.2021605201770345]
本稿では、教師なしクラスタリングアルゴリズムの結果の重み付きモデル平均化を可能にするクラスタBMAを提案する。
クラスタリング内部検証基準を用いて、各モデルの結果の重み付けに使用される後続モデル確率の近似を開発する。
シミュレーションデータ上での他のアンサンブルクラスタリングメソッドのパフォーマンスに加えて、クラスタBMAは平均クラスタへの確率的アロケーションを含むユニークな機能を提供する。
論文 参考訳(メタデータ) (2022-09-09T04:55:20Z) - K-ARMA Models for Clustering Time Series Data [4.345882429229813]
K-Meansアルゴリズムのモデルベース一般化を用いた時系列データのクラスタリング手法を提案する。
クラスタリングアルゴリズムは,不確実な偏差基準を用いて,アウトレーヤに対して頑健にすることができることを示す。
我々は,時系列クラスタリングタスクにおいて,本手法が既存の手法と競合することを示す実データ実験を行った。
論文 参考訳(メタデータ) (2022-06-30T18:16:11Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。