論文の概要: Data Augmentation for Time-Series Classification: a Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2310.10060v1
- Date: Mon, 16 Oct 2023 04:49:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 16:26:19.883078
- Title: Data Augmentation for Time-Series Classification: a Comprehensive Survey
- Title(参考訳): 時系列分類のためのデータ拡張:包括的調査
- Authors: Zijun Gao, Lingbo Li and Tianhua Xu
- Abstract要約: Data Augmentation (DA) for Time Series Classification (TSC)は、機械学習において、トレーニングサンプルの数を増やすための一般的なテクニックである。
本研究は,TSCにおけるDAの詳細な検討である。
本研究は,過去10年間のTSC分野におけるDAの展開を概観した。
この取り組みは、100以上の研究論文から60以上の異なるDA技術を集めました。
- 参考スコア(独自算出の注目度): 5.629161809575014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data Augmentation (DA) for Time Series Classification (TSC) is a common
technique in machine learning to increase the number of training samples, which
enhances model performance, enriches the dataset variety, and helps mitigate
overfitting. Nonetheless, this technique is currently faced with challenges
characterized by incomplete reviews, ambiguous taxonomies, insufficient
evaluations, and user-unfriendly tools. This study undertakes a detailed
exploration of DA for TSC. We first conducted a thorough review of the
developments in the field of DA for TSC over the past 10 years since existing
surveys on DA for TSC are not comprehensive enough. Our efforts encompassed
gathering more than 60 distinct DA techniques from a pool over 100 research
papers. This endeavor culminated in the creation of an innovative taxonomy
exclusively tailored to DA within the TSC domain. The taxonomy organizes
methods into five main categories: Transformation-Based, Pattern-Based,
Generative, Decomposition-Based, and Automated Data Augmentation. This
classification serves as a sturdy reference for researchers when choosing
methods. In addition, since there is a lack of comprehensive and detailed
evaluations of popular data augmentation methods, we conduct a comprehensive
assessment. More than 15 DA methods were tested on 8 UCR time-series datasets
using the ResNet and deploying a multi-metric evaluation strategy that includes
Accuracy, Method Ranking, and Residual Analysis, the outcome was a baseline
accuracy of 88.94 +- 11.83%. Findings highlighted the variable effectiveness of
DA methods, for instance, methods like Permutation enhanced performance while
Rotation decreased accuracy. Dataset properties also profoundly influence DA
efficacy, we give users accurate and practical advice based on our experimental
results to guide them in choosing the most appropriate DA methods for different
data characteristics.
- Abstract(参考訳): 時系列分類のためのデータ拡張(da)は、トレーニングサンプル数を増やすための機械学習の一般的なテクニックであり、モデルパフォーマンスの向上、データセットの多様性の強化、過剰フィッティングの緩和に寄与する。
それにもかかわらず、この技術は現在、不完全なレビュー、曖昧な分類、不十分な評価、ユーザーフレンドリーなツールといった課題に直面している。
本研究は,tscのためのdaの詳細な探索を行う。
da for tscに関するこれまでの調査が十分に包括的ではないため,過去10年間に初めて,da for tscの分野における開発状況を徹底的にレビューした。
この取り組みは、100以上の研究論文から60以上の異なるDA技術を集めました。
この取り組みは、tscドメイン内でdaにのみ対応した革新的な分類法の作成に結実した。
分類法は、変換ベース、パターンベース、生成、分解ベース、自動データ拡張の5つの主要なカテゴリに分類される。
この分類は、方法を選択する際に研究者にとって頑丈な参照となる。
また,一般的なデータ拡張手法の包括的かつ詳細な評価が欠如しているため,包括的評価を行う。
ResNetを用いて8つのUCR時系列データセット上で15以上のDA手法がテストされ、精度、メソッドランク付け、残留分析を含むマルチメトリック評価戦略が展開され、その結果は88.94 +-11.83%の基準精度であった。
例えば、Permutationのようなメソッドはパフォーマンスを向上し、Rotationは精度を低下させた。
また,データ特性がDAの有効性に大きく影響し,実験結果に基づいてユーザに対して,異なるデータ特性に対して最適なDA手法を選択するための,正確かつ実践的なアドバイスを与える。
関連論文リスト
- Comprehensive Review and Empirical Evaluation of Causal Discovery Algorithms for Numerical Data [3.9523536371670045]
因果解析は、様々な分野における現象の根本原因を理解する上で不可欠な要素となっている。
因果発見アルゴリズムに関する既存の文献は、一貫性のない方法論で断片化されている。
包括的な評価の欠如、すなわちデータ特性は、ベンチマークアルゴリズムにおいて共同で解析されることがしばしば無視される。
論文 参考訳(メタデータ) (2024-07-17T23:47:05Z) - Data Augmentation for Multivariate Time Series Classification: An Experimental Study [1.5390962520179197]
これらのデータセットのサイズは限られていますが、RocketとInceptionTimeモデルを使用して、13のデータセットのうち10の分類精度を向上しました。
これは、コンピュータビジョンで見られる進歩と並行して、効果的なモデルを訓練する上で、十分なデータの重要性を強調している。
論文 参考訳(メタデータ) (2024-06-10T17:58:02Z) - Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - Finding Foundation Models for Time Series Classification with a PreText
Task [7.197233473373693]
本稿では,時系列分類のための事前訓練済みドメイン基盤モデルを提案する。
我々の方法論の重要な側面は、複数のデータセットにまたがる新しいプリテキストタスクである。
UCRアーカイブの実験では,この事前学習戦略が,事前学習を伴わずに従来の訓練方法よりも有意に優れていたことが示されている。
論文 参考訳(メタデータ) (2023-11-24T15:03:55Z) - Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for Enhanced Dataset Pruning [50.809769498312434]
我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。
本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文 参考訳(メタデータ) (2023-11-22T03:45:30Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Rethinking Distribution Shifts: Empirical Analysis and Inductive Modeling for Tabular Data [30.518020409197767]
5つのデータセットと6万のメソッド構成にまたがる自然なシフトを含む実験的なテストベッドを構築します。
ML文献のX$(co)シフトに重きを置いているのとは対照的に、Y|X$-shiftsはテストベッドでもっとも一般的です。
論文 参考訳(メタデータ) (2023-07-11T14:25:10Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Training Strategies for Improved Lip-reading [61.661446956793604]
本研究では,最先端データ拡張手法,時間モデル,その他のトレーニング戦略の性能について検討する。
すべての手法を組み合わせると、分類精度は93.4%となり、現在の最先端技術よりも4.6%向上した。
各種学習手法の誤り解析により, 難解な単語の分類精度を高めることにより, 性能が向上することが明らかとなった。
論文 参考訳(メタデータ) (2022-09-03T09:38:11Z) - Data Augmentation techniques in time series domain: A survey and
taxonomy [0.20971479389679332]
時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。
この研究は、すべての利用可能なアルゴリズムの概要を提供するために、この分野の最先端を体系的にレビューする。
本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文 参考訳(メタデータ) (2022-06-25T17:09:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。