論文の概要: On time series clustering with k-means
- arxiv url: http://arxiv.org/abs/2410.14269v1
- Date: Fri, 18 Oct 2024 08:24:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:47.944212
- Title: On time series clustering with k-means
- Title(参考訳): k-平均による時系列クラスタリングについて
- Authors: Christopher Holder, Anthony Bagnall, Jason Lines,
- Abstract要約: 時系列クラスタリングアルゴリズムは、様々な方法で構成されたk平均で表されることが多い。
この変数は、k-平均はその構成に非常に敏感であることが知られているため、研究を比較するのが困難である。
本稿では,エンドツーエンドアプローチを採用したTSCLの標準ロイドモデルを提案する。
- 参考スコア(独自算出の注目度): 0.5530212768657544
- License:
- Abstract: There is a long history of research into time series clustering using distance-based partitional clustering. Many of the most popular algorithms adapt k-means (also known as Lloyd's algorithm) to exploit time dependencies in the data by specifying a time series distance function. However, these algorithms are often presented with k-means configured in various ways, altering key parameters such as the initialisation strategy. This variability makes it difficult to compare studies because k-means is known to be highly sensitive to its configuration. To address this, we propose a standard Lloyd's-based model for TSCL that adopts an end-to-end approach, incorporating a specialised distance function not only in the assignment step but also in the initialisation and stopping criteria. By doing so, we create a unified structure for comparing seven popular Lloyd's-based TSCL algorithms. This common framework enables us to more easily attribute differences in clustering performance to the distance function itself, rather than variations in the k-means configuration.
- Abstract(参考訳): 距離に基づく分割クラスタリングを用いた時系列クラスタリングの研究には、長い歴史がある。
最も一般的なアルゴリズムの多くは、時系列距離関数を指定してデータの時間依存性を利用するためにk平均(ロイズアルゴリズムとも呼ばれる)を適用する。
しかし、これらのアルゴリズムは様々な方法で構成されたk平均で表され、初期化戦略のような重要なパラメータが変化する。
この変数は、k-平均はその構成に非常に敏感であることが知られているため、研究を比較するのが困難である。
そこで本稿では,代入ステップだけでなく,初期化や停止基準にも特別な距離関数を組み込んで,エンドツーエンドアプローチを採用したTSCLの標準ロイドモデルを提案する。
これにより、有名なロイズ方式のTSCLアルゴリズムを7つ比較するための統一構造を構築する。
この共通フレームワークにより、k-means構成のバリエーションよりも、クラスタリング性能の違いを距離関数自体に容易に対応させることができる。
関連論文リスト
- Clustering of timed sequences -- Application to the analysis of care pathways [0.0]
典型的なケアパスの発見は、クラスタリングによって達成できる。
タイムスタンプされたイベントのシーケンスで表されるクラスタリングケアパスの難しさは、意味的に適切なメトリックとクラスタリングアルゴリズムを定義することである。
論文 参考訳(メタデータ) (2024-04-23T07:16:13Z) - Automated regime detection in multidimensional time series data using
sliced Wasserstein k-means clustering [0.0]
本稿では,時系列データに適用したWasserstein k-meansクラスタリングアルゴリズムの挙動について検討する。
我々は,多次元ワッサースタイン距離をスライスしたワッサーシュタイン距離として近似することにより,この手法を多次元時系列データに拡張する。
実数次元金融時系列において, sWk-means法は, 異なる市場状況を特定するのに有効であることを示す。
論文 参考訳(メタデータ) (2023-10-02T15:37:56Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Efficient Approximate Kernel Based Spike Sequence Classification [56.2938724367661]
SVMのような機械学習モデルは、シーケンスのペア間の距離/相似性の定義を必要とする。
厳密な手法により分類性能は向上するが、計算コストが高い。
本稿では,その予測性能を向上させるために,近似カーネルの性能を改善する一連の方法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:44:19Z) - k-MS: A novel clustering algorithm based on morphological reconstruction [0.0]
k-MSは最悪の場合、CPU並列k-Meansよりも高速である。
また、ミトーシスやTRICLUSTのような密度や形状に敏感な類似のクラスター化法よりも高速である。
論文 参考訳(メタデータ) (2022-08-30T16:55:21Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - ThetA -- fast and robust clustering via a distance parameter [3.0020405188885815]
クラスタリングは機械学習の根本的な問題であり、遠隔ベースのアプローチが数十年にわたってこの分野を支配してきた。
Theta-based Algorithms (ThetA) と呼ばれる新しい距離しきい値法を提案する。
論文 参考訳(メタデータ) (2021-02-13T23:16:33Z) - Hierarchical Clustering using Auto-encoded Compact Representation for
Time-series Analysis [8.660029077292346]
本稿では,学習した時系列のコンパクト表現,オートエンコードコンパクトシーケンス(AECS),階層クラスタリングアプローチを組み合わせたクラスタの識別機構を提案する。
Sequence to Sequence(seq2seq)オートエンコーダと集約型階層クラスタリングに基づくRecurrent Neural Network(RNN)を利用するアルゴリズムです。
論文 参考訳(メタデータ) (2021-01-11T08:03:57Z) - Differentially Private Clustering: Tight Approximation Ratios [57.89473217052714]
基本的なクラスタリング問題に対して,効率的な微分プライベートアルゴリズムを提案する。
この結果から,SampleとAggregateのプライバシーフレームワークのアルゴリズムの改善が示唆された。
1-Clusterアルゴリズムで使用されるツールの1つは、ClosestPairのより高速な量子アルゴリズムを適度な次元で得るために利用できる。
論文 参考訳(メタデータ) (2020-08-18T16:22:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。