論文の概要: Evaluation of k-means time series clustering based on z-normalization
and NP-Free
- arxiv url: http://arxiv.org/abs/2401.15773v1
- Date: Sun, 28 Jan 2024 21:23:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 16:38:19.535985
- Title: Evaluation of k-means time series clustering based on z-normalization
and NP-Free
- Title(参考訳): z正規化とnpフリーに基づくk-means時系列クラスタリングの評価
- Authors: Ming-Chang Lee, Jia-Chun Lin, and Volker Stolz
- Abstract要約: 本稿では,実世界のオープンソース時系列データセット上でのk平均時系列クラスタリングの性能評価を行う。
この評価は、z-正規化とNP-Freeの2つの異なる正規化技術に焦点を当てている。
本研究の目的は,これらの2つの正規化手法が,クラスタリング品質の観点から,k平均時系列クラスタリングに与える影響を評価することである。
- 参考スコア(独自算出の注目度): 0.5898893619901381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the widespread use of k-means time series clustering in various
domains, there exists a gap in the literature regarding its comprehensive
evaluation with different time series normalization approaches. This paper
seeks to fill this gap by conducting a thorough performance evaluation of
k-means time series clustering on real-world open-source time series datasets.
The evaluation focuses on two distinct normalization techniques:
z-normalization and NP-Free. The former is one of the most commonly used
normalization approach for time series. The latter is a real-time time series
representation approach, which can serve as a time series normalization
approach. The primary objective of this paper is to assess the impact of these
two normalization techniques on k-means time series clustering in terms of its
clustering quality. The experiments employ the silhouette score, a
well-established metric for evaluating the quality of clusters in a dataset. By
systematically investigating the performance of k-means time series clustering
with these two normalization techniques, this paper addresses the current gap
in k-means time series clustering evaluation and contributes valuable insights
to the development of time series clustering.
- Abstract(参考訳): 様々な領域でk平均時系列クラスタリングが広く使われているが、異なる時系列正規化アプローチによる包括的評価に関する文献にはギャップがある。
本稿では,k平均時系列クラスタリングの性能評価を実世界のオープンソース時系列データセット上で行った。
この評価は、z-正規化とNP-Freeの2つの異なる正規化技術に焦点を当てている。
前者は、時系列の最もよく使われる正規化手法の1つである。
後者はリアルタイム時系列表現アプローチであり、時系列正規化アプローチとして機能する。
本研究の目的は,これら2つの正規化手法がk-means時系列クラスタリングに与える影響を,クラスタリング品質の観点から評価することである。
実験では、データセット内のクラスタの品質を評価するための確立された指標であるsilhouette scoreを採用している。
これら2つの正規化手法を用いて,k平均時系列クラスタリングの性能を体系的に検討することにより,k平均時系列クラスタリング評価の現在のギャップを解消し,時系列クラスタリングの開発に有用な知見を提供する。
関連論文リスト
- Clustering of timed sequences -- Application to the analysis of care pathways [0.0]
ケアパスの均質なグループを探索することは、クラスタリングによって達成できる。
タイムスタンプされたイベントのシーケンスで表されるクラスタリングケアパスの難しさは、意味的に適切なメトリックとクラスタリングアルゴリズムを定義することである。
本稿では,Drop-DTW メトリックと DBA アプローチという,時系列から時系列へ展開する2つの手法を,平均時間列の構築に適用する。
論文 参考訳(メタデータ) (2024-04-23T07:16:13Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Robust Detection of Lead-Lag Relationships in Lagged Multi-Factor Models [61.10851158749843]
データ固有のリード-ラグ関係を発見することで、重要な洞察を得ることができる。
階層化多要素モデルにおけるリードラグ関係のロバスト検出のためのクラスタリング駆動手法を開発した。
論文 参考訳(メタデータ) (2023-05-11T10:30:35Z) - Fuzzy clustering of ordinal time series based on two novel distances
with economic applications [0.12891210250935145]
順序時間列間の2つの新しい距離を導入し、ファジィクラスタリング手順を構築するために使用した。
結果のクラスタリングアルゴリズムは計算効率が良く、類似のプロセスから生成されるシリーズをグループ化することができる。
経済時系列に関する2つの具体的な応用は、提案手法の有用性を示している。
論文 参考訳(メタデータ) (2023-04-24T16:39:22Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - Novel Features for Time Series Analysis: A Complex Networks Approach [62.997667081978825]
時系列データは、気候、経済、医療などいくつかの領域で広く使われている。
最近の概念的アプローチは、複雑なネットワークへの時系列マッピングに依存している。
ネットワーク分析は、異なるタイプの時系列を特徴付けるのに使うことができる。
論文 参考訳(メタデータ) (2021-10-11T13:46:28Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - From Time Series to Euclidean Spaces: On Spatial Transformations for
Temporal Clustering [5.220940151628734]
従来のクラスタリング手法,時系列特異性,あるいは深層学習に基づく代替手法は,入力データに様々なサンプリングレートと高次元性が存在する場合によく一般化しないことを示す。
本稿では,入力時系列を距離ベース投影表現に変換する時間クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T09:08:16Z) - Autoencoder-based time series clustering with energy applications [0.0]
時系列クラスタリングは、データの特定の性質のため、難しい作業である。
本稿では,畳み込み型オートエンコーダとk-メノイドアルゴリズムの組み合わせによる時系列クラスタリングについて検討する。
論文 参考訳(メタデータ) (2020-02-10T10:04:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。