論文の概要: Real Elliptically Skewed Distributions and Their Application to Robust
Cluster Analysis
- arxiv url: http://arxiv.org/abs/2006.16671v2
- Date: Mon, 21 Jun 2021 08:40:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 06:06:23.910861
- Title: Real Elliptically Skewed Distributions and Their Application to Robust
Cluster Analysis
- Title(参考訳): 実楕円歪分布とそのロバストクラスター解析への応用
- Authors: Christian A. Schroth and Michael Muma
- Abstract要約: 本稿では,Really Skewed(RESK)分布と関連するクラスタリングアルゴリズムの新しいクラスを提案する。
非対称分散および重み付きデータクラスタは、様々な現実世界のアプリケーションで報告されている。
- 参考スコア(独自算出の注目度): 5.137336092866906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article proposes a new class of Real Elliptically Skewed (RESK)
distributions and associated clustering algorithms that allow for integrating
robustness and skewness into a single unified cluster analysis framework.
Non-symmetrically distributed and heavy-tailed data clusters have been reported
in a variety of real-world applications. Robustness is essential because a few
outlying observations can severely obscure the cluster structure. The RESK
distributions are a generalization of the Real Elliptically Symmetric (RES)
distributions. To estimate the cluster parameters and memberships, we derive an
expectation maximization (EM) algorithm for arbitrary RESK distributions.
Special attention is given to a new robust skew-Huber M-estimator, which is
also the maximum likelihood estimator (MLE) for the skew-Huber distribution
that belongs to the RESK class. Numerical experiments on simulated and
real-world data confirm the usefulness of the proposed methods for skewed and
heavy-tailed data sets.
- Abstract(参考訳): 本稿では、単一クラスタ分析フレームワークにロバスト性と歪性を統合することができるReal Elliptically Skewed(RESK)ディストリビューションと関連するクラスタリングアルゴリズムの新たなクラスを提案する。
非対称分散および重尾データクラスタは、様々な現実世界のアプリケーションで報告されている。
ロバスト性は、いくつかの外部観測がクラスター構造を著しく曖昧にするため、必須である。
RESK分布はReal Elliptically Symmetric (RES) 分布の一般化である。
クラスタパラメータとメンバシップを推定するために、任意のRESK分布に対する予測最大化(EM)アルゴリズムを導出する。
reskクラスに属するsquet-huber分布の最大度推定器(mle)でもある新しいロバストなschet-huber m-推定器には特に注意が払われている。
シミュレーションデータと実世界のデータを用いた数値実験により,提案手法の有効性を確認した。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Rethinking Clustered Federated Learning in NOMA Enhanced Wireless
Networks [60.09912912343705]
本研究では,新しいクラスタ化フェデレーション学習(CFL)アプローチと,非独立かつ同一に分散した(非IID)データセットを統合することのメリットについて検討する。
データ分布における非IIDの度合いを測定する一般化ギャップの詳細な理論的解析について述べる。
非IID条件によって引き起こされる課題に対処する解決策は、特性の分析によって提案される。
論文 参考訳(メタデータ) (2024-03-05T17:49:09Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Local Sample-weighted Multiple Kernel Clustering with Consensus
Discriminative Graph [73.68184322526338]
マルチカーネルクラスタリング(MKC)は、ベースカーネルの集合から最適な情報融合を実現するためにコミットされる。
本稿では,新しい局所サンプル重み付きマルチカーネルクラスタリングモデルを提案する。
実験により, LSWMKCはより優れた局所多様体表現を有し, 既存のカーネルやグラフベースのクラスタリングアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T05:00:38Z) - Supervised Multivariate Learning with Simultaneous Feature Auto-grouping
and Dimension Reduction [7.093830786026851]
本稿では,クラスタ化低ランク学習フレームワークを提案する。
2つの合同行列正則化を課し、予測因子を構成する特徴を自動的にグループ化する。
低ランクなモデリングよりも解釈可能であり、変数選択における厳密な空間性仮定を緩和する。
論文 参考訳(メタデータ) (2021-12-17T20:11:20Z) - Neural Mixture Models with Expectation-Maximization for End-to-end Deep
Clustering [0.8543753708890495]
本稿では,ニューラルネットワークを用いた混合モデルに基づくクラスタリングを実現する。
我々は,Eステップとして前方パス,Mステップとして後方パスを動作させるバッチワイズEMイテレーションにより,ネットワークのエンドツーエンドをトレーニングする。
トレーニングされたネットワークは、k-meansに依存した単一ステージのディープクラスタリング手法よりも優れています。
論文 参考訳(メタデータ) (2021-07-06T08:00:58Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。