論文の概要: PAM: Plaid Atoms Model for Bayesian Nonparametric Analysis of Grouped
Data
- arxiv url: http://arxiv.org/abs/2304.14954v1
- Date: Fri, 28 Apr 2023 16:18:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-01 13:33:28.501214
- Title: PAM: Plaid Atoms Model for Bayesian Nonparametric Analysis of Grouped
Data
- Title(参考訳): PAM:ベイズ非パラメトリックデータ解析のための格子原子モデル
- Authors: Dehua Bi and Yuan Ji
- Abstract要約: 格子原子モデル(PAM)は、各グループのクラスターの集合を推定する。
いくつかのクラスタは、他のグループと共有することも、グループによって一意に所有することもできる。
- 参考スコア(独自算出の注目度): 2.508597087508297
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider dependent clustering of observations in groups. The proposed
model, called the plaid atoms model (PAM), estimates a set of clusters for each
group and allows some clusters to be either shared with other groups or
uniquely possessed by the group. PAM is based on an extension to the well-known
stick-breaking process by adding zero as a possible value for the cluster
weights, resulting in a zero-augmented beta (ZAB) distribution in the model. As
a result, ZAB allows some cluster weights to be exactly zero in multiple
groups, thereby enabling shared and unique atoms across groups. We explore
theoretical properties of PAM and show its connection to known Bayesian
nonparametric models. We propose an efficient slice sampler for posterior
inference. Minor extensions of the proposed model for multivariate or count
data are presented. Simulation studies and applications using real-world
datasets illustrate the model's desirable performance.
- Abstract(参考訳): グループ内の観察のクラスタリングについて考察する。
提案されたモデルは格子状原子モデル (pam) と呼ばれ、各グループのクラスターの集合を推定し、いくつかのクラスターを他のグループと共有するか、グループによって一意に所有することができる。
PAMは、クラスタ重み付けの可能な値としてゼロを追加することで、よく知られたスティックブレーキングプロセスの拡張に基づいており、結果としてモデルにゼロ拡張ベータ(ZAB)の分布をもたらす。
その結果、ZABはいくつかのクラスター重みを複数の群で正確にゼロとし、グループ間で共有原子と一意原子を共有できる。
我々は、PAMの理論的性質を探求し、既知のベイズ非パラメトリックモデルとの関係を示す。
後方推論のための効率的なスライスサンプリング手法を提案する。
多変量またはカウントデータに対する提案モデルの拡張について述べる。
実世界のデータセットを用いたシミュレーション研究と応用は、モデルの望ましいパフォーマンスを示している。
関連論文リスト
- Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for
Clustering Count Data [0.8499685241219366]
因子分析モデルの混合に基づく8種類の擬似混合モデルについて紹介する。
提案モデルはRNAシークエンシング研究から得られた離散的なデータをクラスタリングする文脈において探索される。
論文 参考訳(メタデータ) (2023-11-13T21:23:15Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - clusterBMA: Bayesian model averaging for clustering [1.2021605201770345]
本稿では、教師なしクラスタリングアルゴリズムの結果の重み付きモデル平均化を可能にするクラスタBMAを提案する。
クラスタリング内部検証基準を用いて、各モデルの結果の重み付けに使用される後続モデル確率の近似を開発する。
シミュレーションデータ上での他のアンサンブルクラスタリングメソッドのパフォーマンスに加えて、クラスタBMAは平均クラスタへの確率的アロケーションを含むユニークな機能を提供する。
論文 参考訳(メタデータ) (2022-09-09T04:55:20Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - On the Generative Utility of Cyclic Conditionals [103.1624347008042]
2つの条件付きモデル$p(x|z)$を用いて、共同分布$p(x,z)$をモデル化できるかどうか、また、どのようにしてサイクルを形成するかを検討する。
本稿では,周期条件生成モデリングのためのCyGenフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-30T10:23:45Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z) - A new model for natural groupings in high-dimensional data [0.4604003661048266]
クラスタリングは、一連のポイントをグループに分割することを目的としています。
最近の実験では、異なるバイナリグルーピングを形成するいくつかの高次元データセットが発見されている。
本稿では,この現象を説明できる確率モデルについて述べる。
論文 参考訳(メタデータ) (2019-09-14T02:38:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。