論文の概要: Data Augmentation for Time-Series Classification: a Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2310.10060v1
- Date: Mon, 16 Oct 2023 04:49:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 16:26:19.883078
- Title: Data Augmentation for Time-Series Classification: a Comprehensive Survey
- Title(参考訳): 時系列分類のためのデータ拡張:包括的調査
- Authors: Zijun Gao, Lingbo Li and Tianhua Xu
- Abstract要約: Data Augmentation (DA) for Time Series Classification (TSC)は、機械学習において、トレーニングサンプルの数を増やすための一般的なテクニックである。
本研究は,TSCにおけるDAの詳細な検討である。
本研究は,過去10年間のTSC分野におけるDAの展開を概観した。
この取り組みは、100以上の研究論文から60以上の異なるDA技術を集めました。
- 参考スコア(独自算出の注目度): 5.629161809575014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data Augmentation (DA) for Time Series Classification (TSC) is a common
technique in machine learning to increase the number of training samples, which
enhances model performance, enriches the dataset variety, and helps mitigate
overfitting. Nonetheless, this technique is currently faced with challenges
characterized by incomplete reviews, ambiguous taxonomies, insufficient
evaluations, and user-unfriendly tools. This study undertakes a detailed
exploration of DA for TSC. We first conducted a thorough review of the
developments in the field of DA for TSC over the past 10 years since existing
surveys on DA for TSC are not comprehensive enough. Our efforts encompassed
gathering more than 60 distinct DA techniques from a pool over 100 research
papers. This endeavor culminated in the creation of an innovative taxonomy
exclusively tailored to DA within the TSC domain. The taxonomy organizes
methods into five main categories: Transformation-Based, Pattern-Based,
Generative, Decomposition-Based, and Automated Data Augmentation. This
classification serves as a sturdy reference for researchers when choosing
methods. In addition, since there is a lack of comprehensive and detailed
evaluations of popular data augmentation methods, we conduct a comprehensive
assessment. More than 15 DA methods were tested on 8 UCR time-series datasets
using the ResNet and deploying a multi-metric evaluation strategy that includes
Accuracy, Method Ranking, and Residual Analysis, the outcome was a baseline
accuracy of 88.94 +- 11.83%. Findings highlighted the variable effectiveness of
DA methods, for instance, methods like Permutation enhanced performance while
Rotation decreased accuracy. Dataset properties also profoundly influence DA
efficacy, we give users accurate and practical advice based on our experimental
results to guide them in choosing the most appropriate DA methods for different
data characteristics.
- Abstract(参考訳): 時系列分類のためのデータ拡張(da)は、トレーニングサンプル数を増やすための機械学習の一般的なテクニックであり、モデルパフォーマンスの向上、データセットの多様性の強化、過剰フィッティングの緩和に寄与する。
それにもかかわらず、この技術は現在、不完全なレビュー、曖昧な分類、不十分な評価、ユーザーフレンドリーなツールといった課題に直面している。
本研究は,tscのためのdaの詳細な探索を行う。
da for tscに関するこれまでの調査が十分に包括的ではないため,過去10年間に初めて,da for tscの分野における開発状況を徹底的にレビューした。
この取り組みは、100以上の研究論文から60以上の異なるDA技術を集めました。
この取り組みは、tscドメイン内でdaにのみ対応した革新的な分類法の作成に結実した。
分類法は、変換ベース、パターンベース、生成、分解ベース、自動データ拡張の5つの主要なカテゴリに分類される。
この分類は、方法を選択する際に研究者にとって頑丈な参照となる。
また,一般的なデータ拡張手法の包括的かつ詳細な評価が欠如しているため,包括的評価を行う。
ResNetを用いて8つのUCR時系列データセット上で15以上のDA手法がテストされ、精度、メソッドランク付け、残留分析を含むマルチメトリック評価戦略が展開され、その結果は88.94 +-11.83%の基準精度であった。
例えば、Permutationのようなメソッドはパフォーマンスを向上し、Rotationは精度を低下させた。
また,データ特性がDAの有効性に大きく影響し,実験結果に基づいてユーザに対して,異なるデータ特性に対して最適なDA手法を選択するための,正確かつ実践的なアドバイスを与える。
関連論文リスト
- Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。
本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。
テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文 参考訳(メタデータ) (2024-03-28T11:50:23Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via
Code Generation [86.4326416303723]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - Benchmarking Data Science Agents [11.582116078653968]
大規模言語モデル(LLM)は、データサイエンスエージェントとして有望な支援として登場し、データ分析と処理において人間を支援している。
しかし、現実の応用の様々な要求と複雑な分析プロセスによって、それらの実用的有効性は依然として制限されている。
我々は、新しい評価パラダイムであるDSEvalと、これらのエージェントの性能を評価するための一連の革新的なベンチマークを紹介する。
論文 参考訳(メタデータ) (2024-02-27T03:03:06Z) - Overcoming Pitfalls in Graph Contrastive Learning Evaluation: Toward
Comprehensive Benchmarks [60.82579717007963]
本稿では,グラフコントラスト学習(GCL)手法の有効性,一貫性,全体的な能力をより正確に評価するために,拡張された評価フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-24T01:47:56Z) - Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for
Enhanced Dataset Pruning [54.511055635704764]
我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。
本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文 参考訳(メタデータ) (2023-11-22T03:45:30Z) - Automatic Feature Engineering for Time Series Classification: Evaluation
and Discussion [0.0]
時系列分類(TSC)は、データサイエンスと知識工学において重要かつ困難な問題である。
近年,時系列から教師なし情報要約統計,いわゆる特徴を抽出するツールがいくつか設計されている。
本稿では,既存の機能工学ツールを用いて得られた機能セットの潜在的な予測性能を評価するための,シンプルなTSCプロセスを提案する。
論文 参考訳(メタデータ) (2023-08-02T10:46:42Z) - From Threat Reports to Continuous Threat Intelligence: A Comparison of
Attack Technique Extraction Methods from Textual Artifacts [11.396560798899412]
脅威レポートには、非構造化テキスト形式で書かれた攻撃戦術、テクニック、手順(TTP)の詳細な記述が含まれている。
文献ではTP抽出法が提案されているが,これらすべての方法が互いに,あるいはベースラインと比較されているわけではない。
本研究では,本研究から既存のTP抽出研究10点を同定し,本研究から5つの方法を実装した。
提案手法は,TFIDF(Term Frequency-Inverse Document Frequency)とLSI(Latent Semantic Indexing)の2つで,F1スコアが84%,83%の他の3手法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-05T23:21:41Z) - A Comparative Study on Unsupervised Anomaly Detection for Time Series:
Experiments and Analysis [28.79393419730138]
時系列異常検出は、信頼性と安全性を実現するためにしばしば不可欠である。
近年,時系列データの異常検出が盛んに行われている。
データ、メソッド、評価戦略について紹介する。
我々は,最先端技術とディープラーニング技術とを体系的に評価し,比較した。
論文 参考訳(メタデータ) (2022-09-10T10:44:25Z) - Training Strategies for Improved Lip-reading [61.661446956793604]
本研究では,最先端データ拡張手法,時間モデル,その他のトレーニング戦略の性能について検討する。
すべての手法を組み合わせると、分類精度は93.4%となり、現在の最先端技術よりも4.6%向上した。
各種学習手法の誤り解析により, 難解な単語の分類精度を高めることにより, 性能が向上することが明らかとなった。
論文 参考訳(メタデータ) (2022-09-03T09:38:11Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - TOTOPO: Classifying univariate and multivariate time series with
Topological Data Analysis [0.9023847175654602]
この研究は、トポロジカルデータ解析の時系列分類に関する包括的な分析に費やされている。
異なるタイプのパーシステンス図からトポロジ的記述子を抽出するTOTOPOを提案する。
論文 参考訳(メタデータ) (2020-10-10T17:57:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。