論文の概要: Back to Basics: A Sanity Check on Modern Time Series Classification
Algorithms
- arxiv url: http://arxiv.org/abs/2308.07886v1
- Date: Tue, 15 Aug 2023 17:23:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 12:03:48.026213
- Title: Back to Basics: A Sanity Check on Modern Time Series Classification
Algorithms
- Title(参考訳): back to basics:現代の時系列分類アルゴリズムの健全性チェック
- Authors: Bhaskar Dhariyal, Thach Le Nguyen, Georgiana Ifrim
- Abstract要約: 新たな分類器の急激な開発では、ステップバックして単純なベースラインチェックを実行することが不可欠である。
これらのチェックは、しばしば見過ごされる。研究者たちは、新しい最先端の結果を確立し、スケーラブルなアルゴリズムを開発し、モデルを説明可能にすることに注力している。
- 参考スコア(独自算出の注目度): 5.225544155289783
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The state-of-the-art in time series classification has come a long way, from
the 1NN-DTW algorithm to the ROCKET family of classifiers. However, in the
current fast-paced development of new classifiers, taking a step back and
performing simple baseline checks is essential. These checks are often
overlooked, as researchers are focused on establishing new state-of-the-art
results, developing scalable algorithms, and making models explainable.
Nevertheless, there are many datasets that look like time series at first
glance, but classic algorithms such as tabular methods with no time ordering
may perform better on such problems. For example, for spectroscopy datasets,
tabular methods tend to significantly outperform recent time series methods. In
this study, we compare the performance of tabular models using classic machine
learning approaches (e.g., Ridge, LDA, RandomForest) with the ROCKET family of
classifiers (e.g., Rocket, MiniRocket, MultiRocket). Tabular models are simple
and very efficient, while the ROCKET family of classifiers are more complex and
have state-of-the-art accuracy and efficiency among recent time series
classifiers. We find that tabular models outperform the ROCKET family of
classifiers on approximately 19% of univariate and 28% of multivariate datasets
in the UCR/UEA benchmark and achieve accuracy within 10 percentage points on
about 50% of datasets. Our results suggest that it is important to consider
simple tabular models as baselines when developing time series classifiers.
These models are very fast, can be as effective as more complex methods and may
be easier to understand and deploy.
- Abstract(参考訳): 時系列分類の最先端は、1NN-DTWアルゴリズムからROCKET分類器ファミリーまで、長い道のりを経てきた。
しかし、新しい分類器の急速な開発では、一歩後退して単純なベースラインチェックを実行することが不可欠である。
研究者たちは最先端の成果を確立し、スケーラブルなアルゴリズムを開発し、モデルを説明可能にすることに重点を置いている。
それにもかかわらず、一見すると時系列のように見えるデータセットはたくさんあるが、時間順序付けのない表型メソッドのような古典的なアルゴリズムは、そのような問題に対してよりうまく機能するかもしれない。
例えば、分光データセットでは、表法が最近の時系列法を大幅に上回る傾向がある。
本研究では,従来の機械学習手法(リッジ,lda,ランダムフォレストなど)と,分類器(ロケット,ミニロケット,マルチロケットなど)のロケット群との比較を行った。
タブラルモデルは単純で非常に効率的であるが、ROCKETファミリーの分類器はより複雑であり、最近の時系列分類器では最先端の精度と効率を有する。
UCR/UEAベンチマークでは,約19%の単変量データセットと28%の多変量データセットでROCKET分類器群を上回り,約50%のデータセットで10ポイント以内の精度で精度が得られた。
本研究は,時系列分類器の開発において,単純な表モデルがベースラインであると考えることが重要であることを示唆する。
これらのモデルは、非常に高速で、より複雑なメソッドと同じくらい効果的で、理解やデプロイが容易です。
関連論文リスト
- Chronos: Learning the Language of Time Series [79.38691251254173]
Chronosは事前訓練された確率的時系列モデルのためのフレームワークである。
クロノスモデルでは,様々な領域の時系列データを利用して,未知の予測タスクにおけるゼロショット精度を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-03-12T16:53:54Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Detach-ROCKET: Sequential feature selection for time series classification with random convolutional kernels [0.7499722271664144]
ROCKETに基づくモデルにおいて, 逐次的特徴分離(Sequential Feature Detachment, SFD)を導入する。
SFDは、オリジナルの機能の10%しか使用せずに、より良いテスト精度でモデルを作成することができる。
また,特徴量とモデル精度の最適バランスを決定するためのエンドツーエンドの手法を提案する。
論文 参考訳(メタデータ) (2023-09-25T20:24:36Z) - Composable Core-sets for Diversity Approximation on Multi-Dataset
Streams [4.765131728094872]
構成可能なコアセットはコアセットであり、コアセットのサブセットを結合して元のデータに対する近似を得るという性質を持つ。
本研究では,構成可能なコアセットを構築するためのコアセット構築アルゴリズムを導入し,アクティブな学習環境におけるストリームデータを要約する。
論文 参考訳(メタデータ) (2023-08-10T23:24:51Z) - Class-Incremental Learning with Strong Pre-trained Models [97.84755144148535]
CIL(Class-incremental Learning)は、少数のクラス(ベースクラス)から始まる設定で広く研究されている。
我々は、多数のベースクラスで事前訓練された強力なモデルから始まるCILの実証済み実世界の設定について検討する。
提案手法は、解析されたCIL設定すべてに頑健で一般化されている。
論文 参考訳(メタデータ) (2022-04-07T17:58:07Z) - The FreshPRINCE: A Simple Transformation Based Pipeline Time Series
Classifier [0.0]
我々は、最先端と見なされるアルゴリズムの複雑さが本当に必要かどうかを考察する。
最初に提案されたアプローチは、要約統計やその他の時系列特徴抽出アプローチの単純なパイプラインである。
我々はこれらの手法をUCC時系列データセットアーカイブ上でテストし、TSC文献がこれらの手法の有効性を見落としているかどうかを確認する。
論文 参考訳(メタデータ) (2022-01-28T11:23:58Z) - Robust Augmentation for Multivariate Time Series Classification [20.38907456958682]
カットアウト,カットミックス,ミックスアップ,ウィンドウワープの簡単な方法により,堅牢性と全体的な性能が向上することを示す。
InceptionTimeネットワークは18種類のデータセットで精度を1%から45%向上することを示す。
論文 参考訳(メタデータ) (2022-01-27T18:57:49Z) - Towards Similarity-Aware Time-Series Classification [51.2400839966489]
時系列データマイニングの基本課題である時系列分類(TSC)について検討する。
グラフニューラルネットワーク(GNN)を用いて類似情報をモデル化するフレームワークであるSimTSCを提案する。
論文 参考訳(メタデータ) (2022-01-05T02:14:57Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - Interpretable Time Series Classification using Linear Models and
Multi-resolution Multi-domain Symbolic Representations [6.6147550436077776]
我々は,現在のアプローチにおけるギャップに対処する新しい時系列分類アルゴリズムを提案する。
提案手法は,時系列の記号表現,効率的なシーケンスマイニングアルゴリズム,線形分類モデルに基づく。
我々のモデルは深層学習モデルと同じくらい正確だが、実行時間やメモリに関してより効率的であり、可変長の時系列を扱うことができ、元の時系列における識別的象徴的特徴を強調することで解釈できる。
論文 参考訳(メタデータ) (2020-05-31T15:32:08Z) - Learning Gaussian Graphical Models via Multiplicative Weights [54.252053139374205]
乗算重み更新法に基づいて,Klivans と Meka のアルゴリズムを適用した。
アルゴリズムは、文献の他のものと質的に類似したサンプル複雑性境界を楽しみます。
ランタイムが低い$O(mp2)$で、$m$サンプルと$p$ノードの場合には、簡単にオンライン形式で実装できる。
論文 参考訳(メタデータ) (2020-02-20T10:50:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。