論文の概要: Data Curves Clustering Using Common Patterns Detection
- arxiv url: http://arxiv.org/abs/2001.02095v1
- Date: Sun, 5 Jan 2020 18:36:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 07:50:05.985353
- Title: Data Curves Clustering Using Common Patterns Detection
- Title(参考訳): 共通パターン検出を用いたデータ曲線クラスタリング
- Authors: Konstantinos F. Xylogiannopoulos
- Abstract要約: 分析とクラスタリングの時系列、あるいは一般にあらゆる種類の曲線は、いくつかの人間の活動にとって重要である。
共通パターン(CP)方法論を用いた新しい曲線クラスタリングについて紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For the past decades we have experienced an enormous expansion of the
accumulated data that humanity produces. Daily a numerous number of smart
devices, usually interconnected over internet, produce vast, real-values
datasets. Time series representing datasets from completely irrelevant domains
such as finance, weather, medical applications, traffic control etc. become
more and more crucial in human day life. Analyzing and clustering these time
series, or in general any kind of curves, could be critical for several human
activities. In the current paper, the new Curves Clustering Using Common
Patterns (3CP) methodology is introduced, which applies a repeated pattern
detection algorithm in order to cluster sequences according to their shape and
the similarities of common patterns between time series, data curves and
eventually any kind of discrete sequences. For this purpose, the Longest
Expected Repeated Pattern Reduced Suffix Array (LERP-RSA) data structure has
been used in combination with the All Repeated Patterns Detection (ARPaD)
algorithm in order to perform highly accurate and efficient detection of
similarities among data curves that can be used for clustering purposes and
which also provides additional flexibility and features.
- Abstract(参考訳): 過去数十年間、人類が生み出す累積データの膨大な拡大を経験してきた。
毎日、インターネット上で相互接続される多数のスマートデバイスが、膨大な実価値データセットを生成します。
金融、天気、医療応用、交通管理など全く関係のない分野のデータセットを表す時系列は、人間の日常生活においてますます重要になっている。
これらの時系列、あるいはあらゆる種類の曲線の分析とクラスタリングは、いくつかの人間の活動に不可欠である。
本稿では,コモンパターン(3cp)手法を用いた新しい曲線クラスタリングを導入し,その形状や,時系列,データ曲線,最終的には任意の離散シーケンス間の共通パターンの類似性に応じて,繰り返しパターン検出アルゴリズムを適用した。
この目的のために、最も長く期待される繰り返しパターン削減サフィックスアレイ(lerp-rsa)データ構造と全繰り返しパターン検出(arpad)アルゴリズムを組み合わせることで、クラスタリング目的に使用できるデータ曲線間の類似性を高精度かつ効率的に検出し、さらに柔軟性と機能を提供する。
関連論文リスト
- Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Robust Detection of Lead-Lag Relationships in Lagged Multi-Factor Models [61.10851158749843]
データ固有のリード-ラグ関係を発見することで、重要な洞察を得ることができる。
階層化多要素モデルにおけるリードラグ関係のロバスト検出のためのクラスタリング駆動手法を開発した。
論文 参考訳(メタデータ) (2023-05-11T10:30:35Z) - HyperTime: Implicit Neural Representation for Time Series [131.57172578210256]
暗黙の神経表現(INR)は、データの正確で解像度に依存しないエンコーディングを提供する強力なツールとして最近登場した。
本稿では、INRを用いて時系列の表現を分析し、再構成精度とトレーニング収束速度の点で異なるアクティベーション関数を比較した。
本稿では,INRを利用して時系列データセット全体の圧縮潜在表現を学習するハイパーネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:05:51Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - Novel Features for Time Series Analysis: A Complex Networks Approach [62.997667081978825]
時系列データは、気候、経済、医療などいくつかの領域で広く使われている。
最近の概念的アプローチは、複雑なネットワークへの時系列マッピングに依存している。
ネットワーク分析は、異なるタイプの時系列を特徴付けるのに使うことができる。
論文 参考訳(メタデータ) (2021-10-11T13:46:28Z) - PIETS: Parallelised Irregularity Encoders for Forecasting with
Heterogeneous Time-Series [5.911865723926626]
マルチソースデータセットの不均一性と不規則性は時系列解析において重要な課題となる。
本研究では、異種時系列をモデル化するための新しいアーキテクチャ、PIETSを設計する。
PIETSは異種時間データを効果的にモデル化し、予測タスクにおける他の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-09-30T20:01:19Z) - Time Series is a Special Sequence: Forecasting with Sample Convolution
and Interaction [9.449017120452675]
時系列データ(英: time series)とは、時系列データの一種で、時系列で記録された観測の集合である。
既存のディープラーニング技術では、時系列解析にジェネリックシーケンスモデルを使用しており、そのユニークな性質を無視している。
本稿では,新しいニューラルネットワークアーキテクチャを提案し,時系列予測問題に適用し,時間的モデリングのための複数の解像度でサンプル畳み込みと相互作用を行う。
論文 参考訳(メタデータ) (2021-06-17T08:15:04Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - RobustTAD: Robust Time Series Anomaly Detection via Decomposition and
Convolutional Neural Networks [37.16594704493679]
本稿では,ロバスト時系列異常検出フレームワークRobustTADを提案する。
時系列データのために、堅牢な季節差分解と畳み込みニューラルネットワークを統合する。
パブリックオンラインサービスとしてデプロイされ、Alibaba Groupのさまざまなビジネスシナリオで広く採用されている。
論文 参考訳(メタデータ) (2020-02-21T20:43:45Z) - Autoencoder-based time series clustering with energy applications [0.0]
時系列クラスタリングは、データの特定の性質のため、難しい作業である。
本稿では,畳み込み型オートエンコーダとk-メノイドアルゴリズムの組み合わせによる時系列クラスタリングについて検討する。
論文 参考訳(メタデータ) (2020-02-10T10:04:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。