論文の概要: Clustering Time Series Data through Autoencoder-based Deep Learning
Models
- arxiv url: http://arxiv.org/abs/2004.07296v1
- Date: Sat, 11 Apr 2020 18:51:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 10:17:50.367128
- Title: Clustering Time Series Data through Autoencoder-based Deep Learning
Models
- Title(参考訳): オートエンコーダに基づくディープラーニングモデルによる時系列データのクラスタリング
- Authors: Neda Tavakoli, Sima Siami-Namini, Mahdi Adl Khanghah, Fahimeh Mirza
Soltani, Akbar Siami Namin
- Abstract要約: 本稿では時系列データをクラスタリングするための2段階の手法を提案する。
まず、ラベルを作成するために、与えられた時系列データの特徴を利用する手法を紹介する。
次に、自動エンコーダに基づくディープラーニングモデルを構築し、時系列データの既知の特徴と隠れた特徴の両方を学習し、モデル化する。
- 参考スコア(独自算出の注目度): 1.0499611180329802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning and in particular deep learning algorithms are the emerging
approaches to data analysis. These techniques have transformed traditional data
mining-based analysis radically into a learning-based model in which existing
data sets along with their cluster labels (i.e., train set) are learned to
build a supervised learning model and predict the cluster labels of unseen data
(i.e., test set). In particular, deep learning techniques are capable of
capturing and learning hidden features in a given data sets and thus building a
more accurate prediction model for clustering and labeling problem. However,
the major problem is that time series data are often unlabeled and thus
supervised learning-based deep learning algorithms cannot be directly adapted
to solve the clustering problems for these special and complex types of data
sets. To address this problem, this paper introduces a two-stage method for
clustering time series data. First, a novel technique is introduced to utilize
the characteristics (e.g., volatility) of given time series data in order to
create labels and thus be able to transform the problem from unsupervised
learning into supervised learning. Second, an autoencoder-based deep learning
model is built to learn and model both known and hidden features of time series
data along with their created labels to predict the labels of unseen time
series data. The paper reports a case study in which financial and stock time
series data of selected 70 stock indices are clustered into distinct groups
using the introduced two-stage procedure. The results show that the proposed
procedure is capable of achieving 87.5\% accuracy in clustering and predicting
the labels for unseen time series data.
- Abstract(参考訳): 機械学習と特にディープラーニングアルゴリズムは、データ分析の新たなアプローチだ。
これらの技術は、従来のデータマイニングに基づく分析を、既存のデータセットとクラスタラベル(トレインセット)を学習し、教師付き学習モデルを構築し、未知のデータ(テストセット)のクラスタラベルを予測する学習ベースモデルへと根本的に変えてきた。
特に、ディープラーニング技術は、与えられたデータセットに隠された特徴をキャプチャして学習し、クラスタリングとラベル付けの問題に対するより正確な予測モデルを構築することができる。
しかし、主要な問題は、時系列データがラベルされていないことが多いため、教師付き学習に基づくディープラーニングアルゴリズムは、これらの特別で複雑な種類のデータセットのクラスタリング問題を解決するために直接適用できない。
そこで本稿では,時系列データをクラスタリングする2段階手法を提案する。
まず,与えられた時系列データの特性(ボラティリティなど)を利用してラベルを作成し,教師なし学習から教師なし学習へ変換する手法を提案する。
第二に、自動エンコーダベースのディープラーニングモデルは、時系列データの既知の特徴と隠れた特徴の両方を学習しモデル化し、生成したラベルと合わせて、目に見えない時系列データのラベルを予測する。
本研究は,70株の株価指数の財務・株価時系列データを,導入された2段階の手続きを用いて異なるグループに集約したケーススタディである。
その結果,提案手法はクラスタリングにおいて87.5\%の精度を達成でき,時系列データのラベルを予測できることがわかった。
関連論文リスト
- An End-to-End Model for Time Series Classification In the Presence of Missing Values [25.129396459385873]
時系列分析では,データ不足による時系列分類が問題となっている。
本研究では,データ計算と表現学習を単一のフレームワーク内で統一するエンドツーエンドニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-08-11T19:39:12Z) - Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach [36.47860223750303]
自己教師付き事前学習のための高品質データセットの自動キュレーションの問題点を考察する。
これらの基準をすべて満たしたクラスタリングに基づく手法を提案する。
我々の方法は、大規模で多様なデータリポジトリ上で、$k$-meansの連続的かつ階層的なアプリケーションを含む。
論文 参考訳(メタデータ) (2024-05-24T14:58:51Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Time Series Contrastive Learning with Information-Aware Augmentations [57.45139904366001]
コントラスト学習の鍵となる要素は、いくつかの先行を示唆する適切な拡張を選択して、実現可能な正のサンプルを構築することである。
対照的な学習タスクやデータセットに意味のある時系列データの増大をどうやって見つけるかは、未解決の問題である。
本稿では,時系列表現学習のための最適な拡張を適応的に選択する情報認識拡張を用いた新しいコントラスト学習手法であるInfoTSを提案する。
論文 参考訳(メタデータ) (2023-03-21T15:02:50Z) - Pseudo-Labeled Auto-Curriculum Learning for Semi-Supervised Keypoint
Localization [88.74813798138466]
オブジェクトのキーポイントのローカライズは、基本的な視覚的問題である。
キーポイントローカライゼーションネットワークの教師付き学習は、しばしば大量のデータを必要とする。
本稿では,一連の動的しきい値を持つ信頼度の高い擬似ラベルサンプルを自動的に選択する。
論文 参考訳(メタデータ) (2022-01-21T09:51:58Z) - Novel Features for Time Series Analysis: A Complex Networks Approach [62.997667081978825]
時系列データは、気候、経済、医療などいくつかの領域で広く使われている。
最近の概念的アプローチは、複雑なネットワークへの時系列マッピングに依存している。
ネットワーク分析は、異なるタイプの時系列を特徴付けるのに使うことができる。
論文 参考訳(メタデータ) (2021-10-11T13:46:28Z) - Deep Time Series Models for Scarce Data [8.673181404172963]
時系列データは多くの領域で爆発的な速度で成長し、時系列モデリング研究の急増を刺激している。
データ希少性は、膨大なデータ分析の問題で発生する普遍的な問題です。
論文 参考訳(メタデータ) (2021-03-16T22:16:54Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Deep learning for time series classification [2.0305676256390934]
時系列分析により、時間の経過とともにプロセスの進化を可視化し、理解することができます。
時系列分類は時系列データを自動的にラベル付けするアルゴリズムで構成されている。
ディープラーニングは、教師付き分類タスクに対処する最も効果的な方法の1つとして登場した。
論文 参考訳(メタデータ) (2020-10-01T17:38:40Z) - Autoencoder-based time series clustering with energy applications [0.0]
時系列クラスタリングは、データの特定の性質のため、難しい作業である。
本稿では,畳み込み型オートエンコーダとk-メノイドアルゴリズムの組み合わせによる時系列クラスタリングについて検討する。
論文 参考訳(メタデータ) (2020-02-10T10:04:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。