論文の概要: An Empirical Evaluation of Time-Series Feature Sets
- arxiv url: http://arxiv.org/abs/2110.10914v1
- Date: Thu, 21 Oct 2021 06:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-23 09:10:53.975660
- Title: An Empirical Evaluation of Time-Series Feature Sets
- Title(参考訳): 時系列特徴集合の経験的評価
- Authors: Trent Henderson, Ben D. Fulcher
- Abstract要約: 7つの異なる機能セットを使用して、機能に関する時系列問題を解決することができる。
ここでは、これらの集合を計算速度で比較し、それぞれに含まれる特徴の冗長性を評価し、それらの重なり合いと冗長性を評価する。
機能セットは、1000サンプルのシリーズでノートパソコンの1機能当たりの計算時間において、桁違いに異なることがわかりました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Solving time-series problems with features has been rising in popularity due
to the availability of software for feature extraction. Feature-based
time-series analysis can now be performed using many different feature sets,
including hctsa (7730 features: Matlab), feasts (42 features: R), tsfeatures
(63 features: R), Kats (40 features: Python), tsfresh (up to 1558 features:
Python), TSFEL (390 features: Python), and the C-coded catch22 (22 features:
Matlab, R, Python, and Julia). There is substantial overlap in the types of
methods included in these sets (e.g., properties of the autocorrelation
function and Fourier power spectrum), but they are yet to be systematically
compared. Here we compare these seven sets on computational speed, assess the
redundancy of features contained in each, and evaluate the overlap and
redundancy between them. We take an empirical approach to feature similarity
based on outputs across a diverse set of real-world and simulated time series.
We find that feature sets vary across three orders of magnitude in their
computation time per feature on a laptop for a 1000-sample series, from the
fastest sets catch22 and TSFEL (~0.1ms per feature) to tsfeatures (~3s per
feature). Using PCA to evaluate feature redundancy within each set, we find the
highest within-set redundancy for TSFEL and tsfresh. For example, in TSFEL, 90%
of the variance across 390 features can be captured with just four PCs.
Finally, we introduce a metric for quantifying overlap between pairs of feature
sets, which indicates substantial overlap. We found that the largest feature
set, hctsa, is the most comprehensive, and that tsfresh is the most
distinctive, due to its incorporation of many low-level Fourier coefficients.
Our results provide empirical understanding of the differences between existing
feature sets, information that can be used to better tailor feature sets to
their applications.
- Abstract(参考訳): 機能抽出のためのソフトウェアが利用できるため、機能で時系列問題を解決することの人気が高まっている。
機能ベースの時系列分析は、hctsa (7730 機能: matlab)、fants (42 機能: r)、tsfeatures (63 機能: r)、kats (40 機能: python)、tsfresh (最大 1558 機能: python)、tsfel (390 機能: python)、c-coded catch22 (22 機能: matlab、r、python、julia) など、さまざまな機能セットを使用して実行できるようになった。
これらの集合に含まれるメソッドの種類(例えば、自己相関関数とフーリエパワースペクトルの特性)にはかなりの重複があるが、体系的に比較することはできない。
ここでは,これら7セットの計算速度を比較し,各特徴の冗長性を評価し,それらの重なりと冗長性を評価する。
実世界とシミュレーション時系列の多様な集合にまたがる出力に基づく特徴類似性に関する実証的なアプローチをとる。
機能セットは、1000サンプルシリーズのラップトップ上の1機能当たりの計算時間において、最も速いセット catch22 と TSFEL (~0.1ms per feature) から tsfeatures (~3s per feature) まで、桁違いに変化する。
各セットにおける特徴冗長性を評価するために PCA を用いて, TSFEL と tsfresh の最も高い内部冗長性を求める。
例えば、TSFELでは、390のフィーチャにまたがるばらつきの90%をわずか4台のPCでキャプチャできる。
最後に,重なり合いを示す特徴集合のペア間の重なり合いを定量化する指標を提案する。
最大の特徴集合 hctsa が最も包括的であり、tsfresh は低レベルフーリエ係数が多数含まれているため、最も顕著であることがわかった。
この結果から,既存の機能セットの違いを実証的に理解し,機能セットをアプリケーションに適合させるための情報を提供する。
関連論文リスト
- Analyzing categorical time series with the R package ctsfeatures [0.0]
Rパッケージctsfeaturesは、カテゴリの時系列を分析するための便利なツールセットを提供する。
いくつかの関数の出力は、クラスタリング、分類、外れ値検出など、従来の機械学習タスクの実行に使用することができる。
論文 参考訳(メタデータ) (2023-04-24T16:16:56Z) - FRANS: Automatic Feature Extraction for Time Series Forecasting [2.3226893628361682]
ドメイン知識を必要としない静的な機能のための自律的機能検索ネットワークを開発した。
以上の結果から,ほとんどの状況において,我々の特徴が精度の向上につながることが明らかとなった。
論文 参考訳(メタデータ) (2022-09-15T03:14:59Z) - Feature-Based Time-Series Analysis in R using the theft Package [0.0]
時系列機能の集合を計算するための多くのオープンソースソフトウェアパッケージは、複数のプログラミング言語にまたがって存在している。
ここでは、これらの問題の解決策を、盗難と呼ばれるRソフトウェアパッケージに紹介する。
論文 参考訳(メタデータ) (2022-08-12T07:29:29Z) - HyperTime: Implicit Neural Representation for Time Series [131.57172578210256]
暗黙の神経表現(INR)は、データの正確で解像度に依存しないエンコーディングを提供する強力なツールとして最近登場した。
本稿では、INRを用いて時系列の表現を分析し、再構成精度とトレーニング収束速度の点で異なるアクティベーション関数を比較した。
本稿では,INRを利用して時系列データセット全体の圧縮潜在表現を学習するハイパーネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:05:51Z) - Triformer: Triangular, Variable-Specific Attentions for Long Sequence
Multivariate Time Series Forecasting--Full Version [50.43914511877446]
本稿では,高い効率と精度を確保するために,三角形,可変特性に着目した注意点を提案する。
我々はTriformerが精度と効率の両方で最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-04-28T20:41:49Z) - Novel Features for Time Series Analysis: A Complex Networks Approach [62.997667081978825]
時系列データは、気候、経済、医療などいくつかの領域で広く使われている。
最近の概念的アプローチは、複雑なネットワークへの時系列マッピングに依存している。
ネットワーク分析は、異なるタイプの時系列を特徴付けるのに使うことができる。
論文 参考訳(メタデータ) (2021-10-11T13:46:28Z) - Temporal Dependencies in Feature Importance for Time Series Predictions [4.082348823209183]
時系列予測設定における特徴重要度を評価するためのフレームワークであるWinITを提案する。
我々は、ソリューションが時間ステップ内の機能の適切な属性をどのように改善するかを示す。
WinIT は FIT の2.47倍の性能を達成しており、実際のMIMIC の致命的課題における他の特徴的重要な手法である。
論文 参考訳(メタデータ) (2021-07-29T20:31:03Z) - Learning Aggregation Functions [78.47770735205134]
任意の濃度の集合に対する学習可能なアグリゲータであるLAF(Learning Aggregation Function)を紹介する。
半合成および実データを用いて,LAFが最先端の和(max-)分解アーキテクチャより優れていることを示す実験を報告する。
論文 参考訳(メタデータ) (2020-12-15T18:28:53Z) - Infinite Feature Selection: A Graph-based Feature Filtering Approach [78.63188057505012]
グラフ内の経路として特徴のサブセットを考慮したフィルタリング機能選択フレームワークを提案する。
無限に進むことで、選択プロセスの計算複雑性を制限できる。
Inf-FSはほとんどどんな状況でも、つまり、保持するフィーチャの数が優先順位に固定されているときに、より良く振る舞うことを示す。
論文 参考訳(メタデータ) (2020-06-15T07:20:40Z) - Supervised Feature Subset Selection and Feature Ranking for Multivariate
Time Series without Feature Extraction [78.84356269545157]
MTS分類のための教師付き特徴ランキングと特徴サブセット選択アルゴリズムを導入する。
MTSの既存の教師なし特徴選択アルゴリズムとは異なり、我々の手法は時系列から一次元特徴ベクトルを生成するために特徴抽出ステップを必要としない。
論文 参考訳(メタデータ) (2020-05-01T07:46:29Z) - A Deep Structural Model for Analyzing Correlated Multivariate Time
Series [11.009809732645888]
相関した多変量時系列入力を処理できる深層学習構造時系列モデルを提案する。
モデルは、トレンド、季節性、イベントコンポーネントを明示的に学習し、抽出する。
我々は,様々な時系列データセットに関する総合的な実験を通して,そのモデルと最先端のいくつかの手法を比較した。
論文 参考訳(メタデータ) (2020-01-02T18:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。