論文の概要: Repulsive Mixture Models of Exponential Family PCA for Clustering
- arxiv url: http://arxiv.org/abs/2004.03112v1
- Date: Tue, 7 Apr 2020 04:07:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 23:05:22.481794
- Title: Repulsive Mixture Models of Exponential Family PCA for Clustering
- Title(参考訳): クラスタリングのための指数族PCAの反発混合モデル
- Authors: Maoying Qiao, Tongliang Liu, Jun Yu, Wei Bian, Dacheng Tao
- Abstract要約: 指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
- 参考スコア(独自算出の注目度): 127.90219303669006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The mixture extension of exponential family principal component analysis
(EPCA) was designed to encode much more structural information about data
distribution than the traditional EPCA does. For example, due to the linearity
of EPCA's essential form, nonlinear cluster structures cannot be easily
handled, but they are explicitly modeled by the mixing extensions. However, the
traditional mixture of local EPCAs has the problem of model redundancy, i.e.,
overlaps among mixing components, which may cause ambiguity for data
clustering. To alleviate this problem, in this paper, a
repulsiveness-encouraging prior is introduced among mixing components and a
diversified EPCA mixture (DEPCAM) model is developed in the Bayesian framework.
Specifically, a determinantal point process (DPP) is exploited as a
diversity-encouraging prior distribution over the joint local EPCAs. As
required, a matrix-valued measure for L-ensemble kernel is designed, within
which, $\ell_1$ constraints are imposed to facilitate selecting effective PCs
of local EPCAs, and angular based similarity measure are proposed. An efficient
variational EM algorithm is derived to perform parameter learning and hidden
variable inference. Experimental results on both synthetic and real-world
datasets confirm the effectiveness of the proposed method in terms of model
parsimony and generalization ability on unseen test data.
- Abstract(参考訳): 指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
例えば、EPCAの本質的な形式の線形性のため、非線形クラスタ構造は容易には扱えないが、これらは混合拡張によって明示的にモデル化されている。
しかし、従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
この問題を軽減するため, 混合成分間での反発性増感前処理を導入し, ベイズフレームワーク上でのEPCA混合(DEPCAM)モデルを構築した。
具体的には、DPP(Determinantal point process)を、共同局所EPCAの多様性向上前の分布として活用する。
必要に応じて,Lアンサンブルカーネルの行列値尺度を設計し,ローカルEPCAの有効なPCの選択を容易にするために$\ell_1$制約を課し,角ベースの類似度尺度を提案する。
パラメータ学習と隠れ変数推論を行うために、効率的な変分EMアルゴリズムを導出する。
合成と実世界の両方のデータセットの実験結果から, モデルパーシモニーと一般化能力の観点から, 提案手法の有効性が確認された。
関連論文リスト
- Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
我々の仮定リーン半推論手法は、仲介者、共同設立者、モデレーターを考慮に入れた予測された直接効果推定に頑健さと一般性を広げる。
提案した二重頑健な推定器は最小限の仮定の下で一貫性があり、機械学習アルゴリズムによるデータ適応推定を容易にする。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Geodesic Optimization for Predictive Shift Adaptation on EEG data [53.58711912565724]
ドメイン適応メソッドは、$X$と$y$で分散シフトが同時に発生したときに苦労する。
本稿では,GOPSA(Geodesic Optimization for Predictive Shift Adaptation)と呼ばれる新しい手法を提案する。
GOPSAは、脳波のバイオメディカル応用のための混合効果モデリングと機械学習を併用する可能性を持っている。
論文 参考訳(メタデータ) (2024-07-04T12:15:42Z) - Coupled generator decomposition for fusion of electro- and magnetoencephalography data [1.7102695043811291]
データ融合モデリングは、ソース固有の変数を考慮に入れながら、多様なデータソースにまたがる共通の特徴を識別することができる。
本稿では、テキスト結合型ジェネレータ分解の概念を導入し、データ融合のためのスパース主成分分析をいかに一般化するかを示す。
論文 参考訳(メタデータ) (2024-03-02T12:09:16Z) - Variable Importance in High-Dimensional Settings Requires Grouping [19.095605415846187]
Conditional Permutation Importance (CPI)は、そのような場合のPIの制限をバイパスする。
クラスタリングまたはいくつかの事前知識を介して統計的に変数をグループ化すると、ある程度のパワーバックが得られる。
重み付けにより拡張された手法は,高相関なグループであっても,型Iエラーを制御可能であることを示す。
論文 参考訳(メタデータ) (2023-12-18T00:21:47Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z) - Shared Independent Component Analysis for Multi-Subject Neuroimaging [107.29179765643042]
本稿では,ShICA (Shared Independent Component Analysis) を導入し,各ビューを加法ガウス雑音によって汚染された共有独立成分の線形変換としてモデル化する。
このモデルは、成分がガウス的でないか、あるいはノイズ分散に十分な多様性がある場合、同定可能であることを示す。
我々は,fMRIおよびMEGデータセットの実証的証拠として,ShICAが代替品よりも正確な成分推定を行うことを示す。
論文 参考訳(メタデータ) (2021-10-26T08:54:41Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z) - Principal Ellipsoid Analysis (PEA): Efficient non-linear dimension
reduction & clustering [9.042239247913642]
本稿では,データとより柔軟なクラスタ形状の非線形関係を実現することにより,PCAとk平均の改善に焦点を当てる。
鍵となる貢献は、PCAに代わる単純で効率的な代替品を定義する、PEA(Principal Analysis)の新しいフレームワークである。
さまざまな実際のデータクラスタリングアプリケーションにおいて、PEAは単純なデータセットのためのk-meansと同様に機能し、より複雑な設定でパフォーマンスを劇的に改善する。
論文 参考訳(メタデータ) (2020-08-17T06:25:50Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。