論文の概要: Detach-ROCKET: Sequential feature selection for time series classification with random convolutional kernels
- arxiv url: http://arxiv.org/abs/2309.14518v3
- Date: Mon, 24 Jun 2024 13:36:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 04:48:52.796117
- Title: Detach-ROCKET: Sequential feature selection for time series classification with random convolutional kernels
- Title(参考訳): Detach-ROCKET:ランダム畳み込みカーネルを用いた時系列分類のための逐次的特徴選択
- Authors: Gonzalo Uribarri, Federico Barone, Alessio Ansuini, Erik Fransén,
- Abstract要約: ROCKETに基づくモデルにおいて, 逐次的特徴分離(Sequential Feature Detachment, SFD)を導入する。
SFDは、オリジナルの機能の10%しか使用せずに、より良いテスト精度でモデルを作成することができる。
また,特徴量とモデル精度の最適バランスを決定するためのエンドツーエンドの手法を提案する。
- 参考スコア(独自算出の注目度): 0.7499722271664144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Time Series Classification (TSC) is essential in fields like medicine, environmental science, and finance, enabling tasks such as disease diagnosis, anomaly detection, and stock price analysis. While machine learning models like Recurrent Neural Networks and InceptionTime are successful in numerous applications, they can face scalability issues due to computational requirements. Recently, ROCKET has emerged as an efficient alternative, achieving state-of-the-art performance and simplifying training by utilizing a large number of randomly generated features from the time series data. However, many of these features are redundant or non-informative, increasing computational load and compromising generalization. Here we introduce Sequential Feature Detachment (SFD) to identify and prune non-essential features in ROCKET-based models, such as ROCKET, MiniRocket, and MultiRocket. SFD estimates feature importance using model coefficients and can handle large feature sets without complex hyperparameter tuning. Testing on the UCR archive shows that SFD can produce models with better test accuracy using only 10\% of the original features. We named these pruned models Detach-ROCKET. We also present an end-to-end procedure for determining an optimal balance between the number of features and model accuracy. On the largest binary UCR dataset, Detach-ROCKET improves test accuracy by 0.6\% while reducing features by 98.9\%. By enabling a significant reduction in model size without sacrificing accuracy, our methodology improves computational efficiency and contributes to model interpretability. We believe that Detach-ROCKET will be a valuable tool for researchers and practitioners working with time series data, who can find a user-friendly implementation of the model at \url{https://github.com/gon-uri/detach_rocket}.
- Abstract(参考訳): 時系列分類(TSC)は、医学、環境科学、金融などの分野において必須であり、疾患診断、異常検出、株価分析などのタスクを可能にする。
Recurrent Neural NetworksやInceptionTimeのような機械学習モデルは、多くのアプリケーションで成功しているが、計算要求のためにスケーラビリティの問題に直面している。
近年、ROCKETは効率的な代替手段として登場し、時系列データから多数のランダムに生成された特徴を活用して、最先端の性能を実現し、訓練を簡素化している。
しかし、これらの特徴の多くは冗長あるいは非形式的であり、計算負荷を増大させ、一般化を促進する。
ここでは、ROCKET、MiniRocket、MultiRocketなどのROCKETベースのモデルにおいて、シークエンシャル・フィーチャー・デタックメント (Sequential Feature Detachment, SFD) を導入し、非シークエンシャルな特徴を識別する。
SFDはモデル係数を用いて特徴を推定し、複雑なハイパーパラメータチューニングなしで大きな特徴集合を処理できる。
UCRアーカイブでのテストでは、SFDはオリジナルの機能の10%しか使用せずに、より良いテスト精度でモデルを生成することができる。
Detach-ROCKETと命名した。
また,特徴量とモデル精度の最適バランスを決定するためのエンドツーエンドの手法を提案する。
最大のバイナリ UCR データセットでは、Detach-ROCKET はテストの精度を 0.6 % 改善し、フィーチャを 98.9 % 削減している。
精度を犠牲にすることなく、モデルサイズを大幅に削減することで、計算効率を向上し、モデル解釈可能性に寄与する。
Detach-ROCKETは、時系列データを扱う研究者や実践者にとって貴重なツールであり、このモデルのユーザフレンドリな実装は、 \url{https://github.com/gon-uri/detach_rocket} で見つけることができると思います。
関連論文リスト
- Classification of Raw MEG/EEG Data with Detach-Rocket Ensemble: An Improved ROCKET Algorithm for Multivariate Time Series Analysis [0.0]
本稿では,脳波やMEGなどの高次元データを扱うための新しいROCKETアルゴリズムであるDetach-Rocket Ensembleを提案する。
我々のアルゴリズムはプルーニングを利用してチャネルの重要度を総合的に推定し、より正確な精度とラベルの確率を与える。
Detach-Rocket Ensembleは、生の脳データに直接適用しても、解釈可能なチャネル関連性と競合する分類精度の両方を提供できることを示す。
論文 参考訳(メタデータ) (2024-08-05T18:24:09Z) - TSLANet: Rethinking Transformers for Time Series Representation Learning [19.795353886621715]
時系列データは、その固有の長短の依存関係によって特徴づけられる。
本稿では,時系列タスクの普遍的畳み込みモデルとして,新しい時系列軽量ネットワーク(TSLANet)を導入する。
我々の実験では、TSLANetは分類、予測、異常検出にまたがる様々なタスクにおいて最先端のモデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-04-12T13:41:29Z) - Back to Basics: A Sanity Check on Modern Time Series Classification
Algorithms [5.225544155289783]
新たな分類器の急激な開発では、ステップバックして単純なベースラインチェックを実行することが不可欠である。
これらのチェックは、しばしば見過ごされる。研究者たちは、新しい最先端の結果を確立し、スケーラブルなアルゴリズムを開発し、モデルを説明可能にすることに注力している。
論文 参考訳(メタデータ) (2023-08-15T17:23:18Z) - Taking ROCKET on an Efficiency Mission: Multivariate Time Series
Classification with LightWaveS [3.5786621294068373]
正確な多変量時系列分類のためのフレームワークLightWaveSを提案する。
ROCKETの機能はわずか2.5%しか採用していないが、最近のディープラーニングモデルに匹敵する精度を実現している。
エッジデバイス上での推論において, ROCKETと比較して9倍から65倍のスピードアップを実現していることを示す。
論文 参考訳(メタデータ) (2022-04-04T10:52:20Z) - Learning Summary Statistics for Bayesian Inference with Autoencoders [58.720142291102135]
我々は,ディープニューラルネットワークに基づくオートエンコーダの内部次元を要約統計として利用する。
パラメータ関連情報を全て符号化するエンコーダのインセンティブを作成するため,トレーニングデータの生成に使用した暗黙的情報にデコーダがアクセスできるようにする。
論文 参考訳(メタデータ) (2022-01-28T12:00:31Z) - Online Feature Selection for Efficient Learning in Networked Systems [3.13468877208035]
データ駆動エンジニアリングのための現在のAI/MLメソッドは、主にオフラインでトレーニングされたモデルを使用する。
多数の利用可能なデータソースから小さな特徴セットを選択するオンライン安定特徴セットアルゴリズム(OSFS)を提案する。
OSFSは、調査されたすべてのデータセットに対して、1~3桁の規模で設定された機能のサイズを大幅に削減する。
論文 参考訳(メタデータ) (2021-12-15T16:31:59Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Closed-form Continuous-Depth Models [99.40335716948101]
連続深度ニューラルモデルは高度な数値微分方程式解法に依存している。
我々は,CfCネットワークと呼ばれる,記述が簡単で,少なくとも1桁高速な新しいモデル群を提示する。
論文 参考訳(メタデータ) (2021-06-25T22:08:51Z) - FastIF: Scalable Influence Functions for Efficient Model Interpretation
and Debugging [112.19994766375231]
影響関数は、テスト予測のためのトレーニングデータポイントの「影響」を近似する。
fastifは、実行時間を大幅に改善する関数に影響を与えるための、単純な修正セットです。
本実験はモデル解釈とモデル誤差の修正における影響関数の可能性を示す。
論文 参考訳(メタデータ) (2020-12-31T18:02:34Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z) - Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。
これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。
この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-02-21T05:00:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。