論文の概要: Variational Consensus Monte Carlo for Bayesian Mixture
- arxiv url: http://arxiv.org/abs/2606.19643v1
- Date: Wed, 17 Jun 2026 22:48:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.572564
- Title: Variational Consensus Monte Carlo for Bayesian Mixture
- Title(参考訳): ベイズ混合のための変分コンセンサスモンテカルロ
- Authors: Julie Fendler, Francesca L. Crowe, Tom Marshall, Sylvia Richardson, Paul D. W. Kirk,
- Abstract要約: 健康データのプライバシー、感度、共有の制限により、ベイズ混合モデルの推定のための包括的なパイプラインを提示する。
我々は、MCMCアルゴリズムを各データサイロ内で独立に実行し、局所的な後部分布を推定するConsensus Monte Carloアプローチを採用する。
総合的なシミュレーション研究は、このフレームワークを検証し、最先端のフェデレーション学習代替品と比較することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by the privacy, sensitivity and sharing limitations of health data, we present a comprehensive pipeline for inference of Bayesian mixture models within a federated learning setting, i.e. when data cannot be fully shared or pooled across compute nodes. We adopt a Consensus Monte Carlo (CMC) approach, in which an MCMC algorithm is run independently within each data silo to estimate local posterior distributions, which are then aggregated to approximate the posterior over the full data. The variational CMC approach of Rabinovich, Angelino and Jordan (2015) [1] frames the aggregation step as a variational inference problem, but their application to mixtures assumes the number of clusters and key mixture parameters to be known. Our main methodological contributions are: (i) an extension of variational CMC to over-fitted Bayesian mixture models that infer the number of clusters and all model parameters, without requiring conjugacy; (ii) novel cluster-matching algorithms suitable for cross-silo settings in which not every cluster appears in each local dataset; (iii) a number of inference strategies for the aggregation step, matched to different federated learning constraints; and (iv) guidelines for choosing among these in practice. A comprehensive simulation study validates the framework and allows us to compare to state-of-the-art federated learning alternatives. Notably, we show that when the composition of local datasets reflects the underlying clustering structure in the data, our approach can recover small clusters with greater accuracy than standard MCMC applied to the pooled data. We illustrate the framework on large-scale electronic health record data, identifying multi-morbidity patterns in a British geriatric population.
- Abstract(参考訳): 健康データのプライバシ、感度、共有の制限によって動機づけられた我々は、連邦学習環境内でベイズ混合モデルを推論するための包括的なパイプライン、すなわち、データが計算ノード間で完全に共有できない場合、あるいはプーリングされない場合を提示する。
我々はコンセンサス・モンテカルロ(CMC)アプローチを採用し、MCMCアルゴリズムを各データサイロ内で独立に実行し、局所的な後部分布を推定し、それを集約して全データ上の後部分布を近似する。
Rabinovich, Angelino and Jordan (2015) [1] の変分 CMC アプローチは、アグリゲーションステップを変分推論問題として表しているが、それらの混合への応用は、クラスターの数と鍵混合パラメータが知られていることを前提としている。
私たちの主な方法論的貢献は次のとおりです。
一 共役を必要とせず、クラスターの数及び全てのモデルパラメータを推測する過適合ベイズ混合モデルに対する変分CMCの拡張。
(II)各ローカルデータセットにすべてのクラスタが出現しないクロスサイロ設定に適した新しいクラスタマッチングアルゴリズム
三 異なる連合的学習制約に適合する集約段階の推論戦略
(4)実際はこれらを選択するためのガイドライン。
総合的なシミュレーション研究は、このフレームワークを検証し、最先端のフェデレーション学習代替品と比較することができる。
特に,局所的なデータセットの構成がデータ内の基盤となるクラスタ構造を反映している場合,本手法は,プールデータに適用される標準MCMCよりも精度の高い小さなクラスタを復元可能であることを示す。
本研究は、イギリスの老年者集団における多病原性パターンを同定し、大規模電子健康記録データに基づく枠組みについて述べる。
関連論文リスト
- Turtle shell clustering: A mixture approach to discriminative clustering with applications to flow cytometry and other data [0.254890465057467]
クラスタリングに対する生成的アプローチは、クラスタの幾何学的性質に関する情報を提供する。
識別的アプローチはクラスタ間のバウンダリを提供する。
完全教師なし,確率的,差別的なクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2026-04-25T00:33:30Z) - Clustering Approaches for Mixed-Type Data: A Comparative Study [0.0]
混在型データのクラスタリングは、このタスクに適合するアプローチがほとんどないため、課題である。
本研究は,これらの手法の現状を考察し,様々なシミュレーションモデルを用いて比較する。
KAMILA, LCM, k-prototypes は, 調整型ランドインデックス (ARI) に関して, 最高の性能を示した。
論文 参考訳(メタデータ) (2025-11-24T22:18:23Z) - Learning Discrete Bayesian Networks with Hierarchical Dirichlet Shrinkage [52.914168158222765]
我々はDBNを学習するための包括的なベイズ的フレームワークについて詳述する。
我々は、並列ランゲヴィン提案を用いてマルコフ連鎖モンテカルロ(MCMC)アルゴリズムを新たに提案し、正確な後続サンプルを生成する。
原発性乳癌検体から予後ネットワーク構造を明らかにするために本手法を適用した。
論文 参考訳(メタデータ) (2025-09-16T17:24:35Z) - Interaction-Aware Gaussian Weighting for Clustered Federated Learning [58.92159838586751]
フェデレートラーニング(FL)は、プライバシを維持しながらモデルをトレーニングするための分散パラダイムとして登場した。
本稿では,新たなクラスタリングFL法であるFedGWC(Federated Gaussian Weighting Clustering)を提案する。
ベンチマークデータセットを用いた実験により,FedGWCはクラスタの品質と分類精度において,既存のFLアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-02-05T16:33:36Z) - A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。
提案手法は、一般化された製品カーネルを通して、インフォメーション・ボトルネックの原理を異種データに拡張する。
提案手法はDIBmixと呼ばれ,従来の4つの手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-03T09:06:19Z) - Mixture of multilayer stochastic block models for multiview clustering [0.0]
本稿では,異なる情報源から得られた複数のクラスタリングを集約する独自の手法を提案する。
モデルパラメータの同定可能性を確立し,これらのパラメータを推定するために変分ベイズEMアルゴリズムを提案する。
この手法は、グローバルな食品取引網の分析に利用され、興味のある構造に繋がる。
論文 参考訳(メタデータ) (2024-01-09T17:15:47Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。