論文の概要: Fast Classification of Large Time Series Datasets
- arxiv url: http://arxiv.org/abs/2312.06029v1
- Date: Sun, 10 Dec 2023 22:56:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 17:29:12.880543
- Title: Fast Classification of Large Time Series Datasets
- Title(参考訳): 大規模時系列データセットの高速分類
- Authors: Muhammad Marwan Muhammad Fuad
- Abstract要約: 時系列分類(TSC)は、時系列マイニングにおいて最もインポートされたタスクである。
時系列データセットのサイズが永遠に大きくなるにつれて、従来のTSCメソッドはもはや十分ではない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time series classification (TSC) is the most import task in time series
mining as it has several applications in medicine, meteorology, finance cyber
security, and many others. With the ever increasing size of time series
datasets, several traditional TSC methods are no longer efficient enough to
perform this task on such very large datasets. Yet, most recent papers on TSC
focus mainly on accuracy by using methods that apply deep learning, for
instance, which require extensive computational resources that cannot be
applied efficiently to very large datasets. The method we introduce in this
paper focuses on these very large time series datasets with the main objective
being efficiency. We achieve this through a simplified representation of the
time series. This in turn is enhanced by a distance measure that considers only
some of the values of the represented time series. The result of this
combination is a very efficient representation method for TSC. This has been
tested experimentally against another time series method that is particularly
popular for its efficiency. The experiments show that our method is not only 4
times faster, on average, but it is also superior in terms of classification
accuracy, as it gives better results on 24 out of the 29 tested time series
datasets. .
- Abstract(参考訳): 時系列分類(TSC)は、医学、気象学、ファイナンスサイバーセキュリティなど多くの分野で応用されているため、時系列マイニングにおいて最も輸入されたタスクである。
時系列データセットのサイズがますます大きくなる中、伝統的なtscメソッドのいくつかは、そのような非常に大きなデータセットでこのタスクを実行するのに十分な効率がなくなった。
しかし、tscに関する最近の論文では、深層学習(例えば、膨大なデータセットに効率的に適用できない膨大な計算リソースを必要とする)を適用する手法を用いて、精度に重点が置かれている。
本論文で紹介する手法は、効率性が主な目的である超大規模時系列データセットに焦点をあてる。
時系列の簡易表現によってこれを達成します。
これは、表される時系列の値のいくつかしか考慮しない距離測度によって拡張される。
この組み合わせの結果は、tscの非常に効率的な表現方法である。
これは、その効率で特に人気のある別の時系列法に対して実験的にテストされている。
実験の結果,本手法は平均4倍高速であるだけでなく,29件の時系列データセットのうち24件においてより優れた結果が得られるため,分類精度も優れていることがわかった。
.
関連論文リスト
- Chronos: Learning the Language of Time Series [79.38691251254173]
Chronosは事前訓練された確率的時系列モデルのためのフレームワークである。
クロノスモデルでは,様々な領域の時系列データを利用して,未知の予測タスクにおけるゼロショット精度を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-03-12T16:53:54Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Scalable Batch Acquisition for Deep Bayesian Active Learning [70.68403899432198]
ディープラーニングでは、各ステップでマークアップする複数の例を選択することが重要です。
BatchBALDのような既存のソリューションでは、多くの例を選択する際に大きな制限がある。
本稿では,より計算効率のよいLarge BatchBALDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-13T11:45:17Z) - Enhancing Transformer Efficiency for Multivariate Time Series
Classification [12.128991867050487]
本稿では,モデル効率と精度,複雑さの関係を考察する手法を提案する。
ベンチマークMSSデータセットの総合実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-28T03:25:19Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - The FreshPRINCE: A Simple Transformation Based Pipeline Time Series
Classifier [0.0]
我々は、最先端と見なされるアルゴリズムの複雑さが本当に必要かどうかを考察する。
最初に提案されたアプローチは、要約統計やその他の時系列特徴抽出アプローチの単純なパイプラインである。
我々はこれらの手法をUCC時系列データセットアーカイブ上でテストし、TSC文献がこれらの手法の有効性を見落としているかどうかを確認する。
論文 参考訳(メタデータ) (2022-01-28T11:23:58Z) - Robust Augmentation for Multivariate Time Series Classification [20.38907456958682]
カットアウト,カットミックス,ミックスアップ,ウィンドウワープの簡単な方法により,堅牢性と全体的な性能が向上することを示す。
InceptionTimeネットワークは18種類のデータセットで精度を1%から45%向上することを示す。
論文 参考訳(メタデータ) (2022-01-27T18:57:49Z) - Towards Similarity-Aware Time-Series Classification [51.2400839966489]
時系列データマイニングの基本課題である時系列分類(TSC)について検討する。
グラフニューラルネットワーク(GNN)を用いて類似情報をモデル化するフレームワークであるSimTSCを提案する。
論文 参考訳(メタデータ) (2022-01-05T02:14:57Z) - TSAX is Trending [0.0]
シンボリックアグリゲート近似(SAX)は時系列データの最も一般的な表現法の一つである。
我々は,SAXに最小限の複雑さを与えるだけで,時系列分類の性能を大幅に向上させるSAXの新たな改良を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:34:50Z) - Interpretable Time Series Classification using Linear Models and
Multi-resolution Multi-domain Symbolic Representations [6.6147550436077776]
我々は,現在のアプローチにおけるギャップに対処する新しい時系列分類アルゴリズムを提案する。
提案手法は,時系列の記号表現,効率的なシーケンスマイニングアルゴリズム,線形分類モデルに基づく。
我々のモデルは深層学習モデルと同じくらい正確だが、実行時間やメモリに関してより効率的であり、可変長の時系列を扱うことができ、元の時系列における識別的象徴的特徴を強調することで解釈できる。
論文 参考訳(メタデータ) (2020-05-31T15:32:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。