論文の概要: SMIXS: Novel efficient algorithm for non-parametric mixture
regression-based clustering
- arxiv url: http://arxiv.org/abs/2209.09030v1
- Date: Mon, 19 Sep 2022 14:03:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 19:12:17.855549
- Title: SMIXS: Novel efficient algorithm for non-parametric mixture
regression-based clustering
- Title(参考訳): SMIXS:非パラメトリック混合回帰に基づくクラスタリングのための新しい効率的なアルゴリズム
- Authors: Peter Mlakar, Tapio Nummi, Polona Oblak, and Jana Faganeli Pucer
- Abstract要約: 縦方向データ解析のための非パラメトリック回帰に基づくクラスタリングアルゴリズムを開発した。
クラスタリングおよび回帰性能の観点から,合成データセット上でのGMMよりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate a novel non-parametric regression-based clustering algorithm
for longitudinal data analysis. Combining natural cubic splines with Gaussian
mixture models (GMM), the algorithm can produce smooth cluster means that
describe the underlying data well. However, there are some shortcomings in the
algorithm: high computational complexity in the parameter estimation procedure
and a numerically unstable variance estimator. Therefore, to further increase
the usability of the method, we incorporated approaches to reduce its
computational complexity, we developed a new, more stable variance estimator,
and we developed a new smoothing parameter estimation procedure. We show that
the developed algorithm, SMIXS, performs better than GMM on a synthetic dataset
in terms of clustering and regression performance. We demonstrate the impact of
the computational speed-ups, which we formally prove in the new framework.
Finally, we perform a case study by using SMIXS to cluster vertical atmospheric
measurements to determine different weather regimes.
- Abstract(参考訳): 縦断データ解析のための新しい非パラメトリック回帰型クラスタリングアルゴリズムについて検討した。
自然立方体スプラインとガウス混合モデル(GMM)を組み合わせることで、基礎となるデータをうまく記述するスムーズなクラスタ平均を生成することができる。
しかし、アルゴリズムにはいくつかの欠点がある:パラメータ推定手順における高い計算複雑性と数値的に不安定な分散推定器。
そこで,本手法のユーザビリティをさらに高めるために,計算複雑性を減らすための手法を取り入れ,より安定な分散推定器を開発し,新しい平滑化パラメータ推定手法を開発した。
開発したアルゴリズムであるsmixsは, クラスタリングや回帰性能の観点から, 合成データセット上でgmmよりも優れた性能を示す。
新しいフレームワークで正式に証明した計算速度アップの影響を実証する。
最後に,smixsを用いて大気の垂直測定をクラスター化し,異なる気象条件を判定するケーススタディを行った。
関連論文リスト
- Fast Semisupervised Unmixing Using Nonconvex Optimization [80.11512905623417]
半/ライブラリベースのアンミックスのための新しい凸凸モデルを提案する。
スパース・アンミキシングの代替手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-01-23T10:07:41Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Clustering based on Mixtures of Sparse Gaussian Processes [6.939768185086753]
低次元の組込み空間を使ってデータをクラスタする方法は、マシンラーニングにおいて依然として難しい問題である。
本稿では,クラスタリングと次元還元の両立を目的とした共同定式化を提案する。
我々のアルゴリズムはスパースガウス過程の混合に基づいており、スパースガウス過程混合クラスタリング(SGP-MIC)と呼ばれる。
論文 参考訳(メタデータ) (2023-03-23T20:44:36Z) - Gaussian process regression and conditional Karhunen-Lo\'{e}ve models
for data assimilation in inverse problems [68.8204255655161]
偏微分方程式モデルにおけるデータ同化とパラメータ推定のためのモデル逆アルゴリズムCKLEMAPを提案する。
CKLEMAP法は標準的なMAP法に比べてスケーラビリティがよい。
論文 参考訳(メタデータ) (2023-01-26T18:14:12Z) - Optimal Algorithms for Stochastic Complementary Composite Minimization [55.26935605535377]
統計学と機械学習における正規化技術に触発され,補完的な複合化の最小化について検討した。
予測と高い確率で、新しい過剰なリスク境界を提供する。
我々のアルゴリズムはほぼ最適であり、このクラスの問題に対して、新しいより低い複雑性境界によって証明する。
論文 参考訳(メタデータ) (2022-11-03T12:40:24Z) - A Non-Parametric Bootstrap for Spectral Clustering [0.7673339435080445]
我々は,データ行列のスペクトル分解と非パラメトリックブートストラップサンプリング方式を組み合わせた2つの新しいアルゴリズムを開発した。
我々の手法は、有限混合モデルに適合する他のブートストラップアルゴリズムと比較して収束性においてより一貫性がある。
論文 参考訳(メタデータ) (2022-09-13T08:37:05Z) - Time Series Clustering with an EM algorithm for Mixtures of Linear
Gaussian State Space Models [0.0]
線形ガウス状態空間モデルを混合したモデルに基づく時系列クラスタリング手法を提案する。
提案手法では,混合モデルの予測最大化アルゴリズムを用いてモデルパラメータを推定する。
シミュレーションデータセットの実験は、クラスタリング、パラメータ推定、モデル選択における手法の有効性を示す。
論文 参考訳(メタデータ) (2022-08-25T07:41:23Z) - Adaptive LASSO estimation for functional hidden dynamic geostatistical
model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。
このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文 参考訳(メタデータ) (2022-08-10T19:17:45Z) - An Adaptive EM Accelerator for Unsupervised Learning of Gaussian Mixture
Models [0.7340845393655052]
教師なし学習のための適応予測最大化(EM)アルゴリズムのためのAnderson Accelerationスキームを提案する。
提案アルゴリズムは、最適混合成分数を自律的に決定することができ、非加速バージョンよりもはるかに高速に最適解に収束する。
論文 参考訳(メタデータ) (2020-09-26T22:55:44Z) - Spectral Clustering using Eigenspectrum Shape Based Nystrom Sampling [19.675277307158435]
本稿では,新しいサンプリング手法であるCentroid Minimum Sum of Squared similarities (CMS3)と,それをいつ使用するかを示す,スケーラブルなNystromベースのクラスタリングアルゴリズムを提案する。
我々のデータセットはデータセットの固有スペクトル形状に依存しており、他の最先端手法と比較して、テストにおいて競合する低ランク近似が得られる。
論文 参考訳(メタデータ) (2020-07-21T17:49:03Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。