論文の概要: K-ARMA Models for Clustering Time Series Data
- arxiv url: http://arxiv.org/abs/2207.00039v1
- Date: Thu, 30 Jun 2022 18:16:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 14:09:50.033584
- Title: K-ARMA Models for Clustering Time Series Data
- Title(参考訳): 時系列データのクラスタリングのためのK-ARMAモデル
- Authors: Derek O. Hoare, David S. Matteson, and Martin T. Wells
- Abstract要約: K-Meansアルゴリズムのモデルベース一般化を用いた時系列データのクラスタリング手法を提案する。
クラスタリングアルゴリズムは,不確実な偏差基準を用いて,アウトレーヤに対して頑健にすることができることを示す。
我々は,時系列クラスタリングタスクにおいて,本手法が既存の手法と競合することを示す実データ実験を行った。
- 参考スコア(独自算出の注目度): 4.345882429229813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an approach to clustering time series data using a model-based
generalization of the K-Means algorithm which we call K-Models. We prove the
convergence of this general algorithm and relate it to the hard-EM algorithm
for mixture modeling. We then apply our method first with an AR($p$) clustering
example and show how the clustering algorithm can be made robust to outliers
using a least-absolute deviations criteria. We then build our clustering
algorithm up for ARMA($p,q$) models and extend this to ARIMA($p,d,q$) models.
We develop a goodness of fit statistic for the models fitted to clusters based
on the Ljung-Box statistic. We perform experiments with simulated data to show
how the algorithm can be used for outlier detection, detecting distributional
drift, and discuss the impact of initialization method on empty clusters. We
also perform experiments on real data which show that our method is competitive
with other existing methods for similar time series clustering tasks.
- Abstract(参考訳): K-Meansアルゴリズムのモデルベース一般化を用いた時系列データのクラスタリング手法を提案する。
この一般アルゴリズムの収束性を証明し、混合モデリングのためのハードEMアルゴリズムに関連付ける。
次に,本手法をar($p$)クラスタリングの例に適用し,最小絶対偏差基準を用いて解法にロバストなクラスタリングアルゴリズムを適用できることを示す。
次に、ARMA($p,q$)モデルのためにクラスタリングアルゴリズムを構築し、これをARIMA($p,d,q$)モデルに拡張します。
我々はLjung-Box統計に基づくクラスタに適合するモデルに適合する確率の良さを開発する。
シミュレーションデータを用いて,そのアルゴリズムが異常検出や分布ドリフトの検出にどのように使われるのかを実験し,空クラスタにおける初期化手法の影響について考察した。
また,本手法が他の既存手法と競合していることを示す実データ実験を行い,類似した時系列クラスタリングタスクを行った。
関連論文リスト
- A simulation study of cluster search algorithms in data set generated by Gaussian mixture models [0.0]
本研究では,ガウス混合モデル (GMM) が生成できる様々なケースにおいて,セントロイドおよびモデルに基づくクラスタ探索アルゴリズムについて検討した。
その結果, ユークリッド距離に基づくクラスタ分割基準は, クラスタが重なり合うと不合理な決定を下すことがわかった。
論文 参考訳(メタデータ) (2024-07-27T07:47:25Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - clusterBMA: Bayesian model averaging for clustering [1.2021605201770345]
本稿では、教師なしクラスタリングアルゴリズムの結果の重み付きモデル平均化を可能にするクラスタBMAを提案する。
クラスタリング内部検証基準を用いて、各モデルの結果の重み付けに使用される後続モデル確率の近似を開発する。
シミュレーションデータ上での他のアンサンブルクラスタリングメソッドのパフォーマンスに加えて、クラスタBMAは平均クラスタへの確率的アロケーションを含むユニークな機能を提供する。
論文 参考訳(メタデータ) (2022-09-09T04:55:20Z) - Time Series Clustering with an EM algorithm for Mixtures of Linear
Gaussian State Space Models [0.0]
線形ガウス状態空間モデルを混合したモデルに基づく時系列クラスタリング手法を提案する。
提案手法では,混合モデルの予測最大化アルゴリズムを用いてモデルパラメータを推定する。
シミュレーションデータセットの実験は、クラスタリング、パラメータ推定、モデル選択における手法の有効性を示す。
論文 参考訳(メタデータ) (2022-08-25T07:41:23Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Autoencoder-based time series clustering with energy applications [0.0]
時系列クラスタリングは、データの特定の性質のため、難しい作業である。
本稿では,畳み込み型オートエンコーダとk-メノイドアルゴリズムの組み合わせによる時系列クラスタリングについて検討する。
論文 参考訳(メタデータ) (2020-02-10T10:04:29Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。