Fugu-MT 論文翻訳(概要): Data Augmentation for Time-Series Classification: a Comprehensive Survey

論文の概要: Data Augmentation for Time-Series Classification: a Comprehensive Survey

arxiv url: http://arxiv.org/abs/2310.10060v1
Date: Mon, 16 Oct 2023 04:49:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-17 16:26:19.883078
Title: Data Augmentation for Time-Series Classification: a Comprehensive Survey
Title（参考訳）: 時系列分類のためのデータ拡張:包括的調査
Authors: Zijun Gao, Lingbo Li and Tianhua Xu
Abstract要約: Data Augmentation (DA) for Time Series Classification (TSC)は、機械学習において、トレーニングサンプルの数を増やすための一般的なテクニックである。本研究は,TSCにおけるDAの詳細な検討である。本研究は,過去10年間のTSC分野におけるDAの展開を概観した。この取り組みは、100以上の研究論文から60以上の異なるDA技術を集めました。
参考スコア（独自算出の注目度）: 5.629161809575014
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Data Augmentation (DA) for Time Series Classification (TSC) is a common technique in machine learning to increase the number of training samples, which enhances model performance, enriches the dataset variety, and helps mitigate overfitting. Nonetheless, this technique is currently faced with challenges characterized by incomplete reviews, ambiguous taxonomies, insufficient evaluations, and user-unfriendly tools. This study undertakes a detailed exploration of DA for TSC. We first conducted a thorough review of the developments in the field of DA for TSC over the past 10 years since existing surveys on DA for TSC are not comprehensive enough. Our efforts encompassed gathering more than 60 distinct DA techniques from a pool over 100 research papers. This endeavor culminated in the creation of an innovative taxonomy exclusively tailored to DA within the TSC domain. The taxonomy organizes methods into five main categories: Transformation-Based, Pattern-Based, Generative, Decomposition-Based, and Automated Data Augmentation. This classification serves as a sturdy reference for researchers when choosing methods. In addition, since there is a lack of comprehensive and detailed evaluations of popular data augmentation methods, we conduct a comprehensive assessment. More than 15 DA methods were tested on 8 UCR time-series datasets using the ResNet and deploying a multi-metric evaluation strategy that includes Accuracy, Method Ranking, and Residual Analysis, the outcome was a baseline accuracy of 88.94 +- 11.83%. Findings highlighted the variable effectiveness of DA methods, for instance, methods like Permutation enhanced performance while Rotation decreased accuracy. Dataset properties also profoundly influence DA efficacy, we give users accurate and practical advice based on our experimental results to guide them in choosing the most appropriate DA methods for different data characteristics.
Abstract（参考訳）: 時系列分類のためのデータ拡張(da)は、トレーニングサンプル数を増やすための機械学習の一般的なテクニックであり、モデルパフォーマンスの向上、データセットの多様性の強化、過剰フィッティングの緩和に寄与する。それにもかかわらず、この技術は現在、不完全なレビュー、曖昧な分類、不十分な評価、ユーザーフレンドリーなツールといった課題に直面している。本研究は,tscのためのdaの詳細な探索を行う。 da for tscに関するこれまでの調査が十分に包括的ではないため,過去10年間に初めて,da for tscの分野における開発状況を徹底的にレビューした。この取り組みは、100以上の研究論文から60以上の異なるDA技術を集めました。この取り組みは、tscドメイン内でdaにのみ対応した革新的な分類法の作成に結実した。分類法は、変換ベース、パターンベース、生成、分解ベース、自動データ拡張の5つの主要なカテゴリに分類される。この分類は、方法を選択する際に研究者にとって頑丈な参照となる。また,一般的なデータ拡張手法の包括的かつ詳細な評価が欠如しているため,包括的評価を行う。 ResNetを用いて8つのUCR時系列データセット上で15以上のDA手法がテストされ、精度、メソッドランク付け、残留分析を含むマルチメトリック評価戦略が展開され、その結果は88.94 +-11.83%の基準精度であった。例えば、Permutationのようなメソッドはパフォーマンスを向上し、Rotationは精度を低下させた。また,データ特性がDAの有効性に大きく影響し,実験結果に基づいてユーザに対して,異なるデータ特性に対して最適なDA手法を選択するための,正確かつ実践的なアドバイスを与える。

関連論文リスト

Review of Inference-Time Scaling Strategies: Reasoning, Search and RAG [13.772025442106544]
LLMのパフォーマンス向上は、歴史的に、モデルサイズとトレーニングデータのスケールアップによって推進されてきた。高品質なトレーニングデータの可用性が急速に低下する中で、基本的なボトルネックが発生しています。このレビューでは、新しい推論時間スケーリングの時代に寄与する様々なテクニックを体系的に調査する。
論文参考訳（メタデータ） (2025-10-12T20:09:07Z)
Modern Deep Learning Approaches for Cricket Shot Classification: A Comprehensive Baseline Study [0.0]
本稿では,クリケットショット分類における7つの異なる深層学習手法を比較した,最初の総合的ベースライン研究を提案する。我々は,従来のCNN-LSTMアーキテクチャ,アテンションベースモデル,ビジョントランスフォーマー,トランスファーラーニングアプローチ,モダンなEfficientNet-GRUの組み合わせを実装し,評価する。我々の最新のSOTAアプローチは、効率の良いNet-B0とGRUベースの時間モデルを組み合わせることで、92.25%の精度を実現している。
論文参考訳（メタデータ） (2025-10-10T09:32:29Z)
Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning [53.85659415230589]
本稿では,広く採用されている強化学習手法を体系的にレビューする。特定の設定に合わせてRLテクニックを選択するための明確なガイドラインを示す。また、2つのテクニックを最小限に組み合わせることで、批判のないポリシーの学習能力を解き放つことも明らかにした。
論文参考訳（メタデータ） (2025-08-11T17:39:45Z)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
Rebalancing the Scales: A Systematic Mapping Study of Generative Adversarial Networks (GANs) in Addressing Data Imbalance [0.16385815610837165]
Generative Adrial Networks (GANs) は、高品質な合成データを生成するデータ前処理技術として大きな可能性を示した。本研究では、4つのデジタルライブラリから得られる不均衡なデータに対して、GANに基づくサンプリング手法に関する3041の論文を体系的なマッピング手法を用いて分析する。包括的定量的分析を通じて、データの不均衡の性質を扱うために、アプリケーションドメイン、GAN技術、およびGAN変種として3つの分類写像を導入する。
論文参考訳（メタデータ） (2025-02-23T11:03:29Z)
Multi-Class Segmentation of Aortic Branches and Zones in Computed Tomography Angiography: The AortaSeg24 Challenge [55.252714550918824]
AortaSeg24 MICCAI Challengeは、23の臨床的に関連する大動脈枝と領域に注釈付き100 CTA巻の最初のデータセットを導入した。本稿では,トップパフォーマンスアルゴリズムの課題設計,データセットの詳細,評価指標,詳細な分析について述べる。
論文参考訳（メタデータ） (2025-02-07T21:09:05Z)
Comprehensive Review and Empirical Evaluation of Causal Discovery Algorithms for Numerical Data [3.9523536371670045]
因果解析は、様々な分野における現象の根本原因を理解する上で不可欠な要素となっている。因果発見アルゴリズムに関する既存の文献は、一貫性のない方法論で断片化されている。包括的な評価の欠如、すなわちデータ特性は、ベンチマークアルゴリズムにおいて共同で解析されることがしばしば無視される。
論文参考訳（メタデータ） (2024-07-17T23:47:05Z)
Data Augmentation for Multivariate Time Series Classification: An Experimental Study [1.5390962520179197]
これらのデータセットのサイズは限られていますが、RocketとInceptionTimeモデルを使用して、13のデータセットのうち10の分類精度を向上しました。これは、コンピュータビジョンで見られる進歩と並行して、効果的なモデルを訓練する上で、十分なデータの重要性を強調している。
論文参考訳（メタデータ） (2024-06-10T17:58:02Z)
Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文参考訳（メタデータ） (2024-03-28T11:50:23Z)
DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。 LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文参考訳（メタデータ） (2024-03-04T22:47:58Z)
Finding Foundation Models for Time Series Classification with a PreText Task [7.197233473373693]
本稿では,時系列分類のための事前訓練済みドメイン基盤モデルを提案する。我々の方法論の重要な側面は、複数のデータセットにまたがる新しいプリテキストタスクである。 UCRアーカイブの実験では,この事前学習戦略が,事前学習を伴わずに従来の訓練方法よりも有意に優れていたことが示されている。
論文参考訳（メタデータ） (2023-11-24T15:03:55Z)
Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for Enhanced Dataset Pruning [50.809769498312434]
我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文参考訳（メタデータ） (2023-11-22T03:45:30Z)
Consistency Regularization for Generalizable Source-free Domain Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文参考訳（メタデータ） (2023-08-03T07:45:53Z)
Rethinking Distribution Shifts: Empirical Analysis and Inductive Modeling for Tabular Data [30.518020409197767]
5つのデータセットと6万のメソッド構成にまたがる自然なシフトを含む実験的なテストベッドを構築します。 ML文献のX$(co)シフトに重きを置いているのとは対照的に、Y|X$-shiftsはテストベッドでもっとも一般的です。
論文参考訳（メタデータ） (2023-07-11T14:25:10Z)
Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。 CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文参考訳（メタデータ） (2023-05-18T16:28:29Z)
Training Strategies for Improved Lip-reading [61.661446956793604]
本研究では,最先端データ拡張手法,時間モデル,その他のトレーニング戦略の性能について検討する。すべての手法を組み合わせると、分類精度は93.4%となり、現在の最先端技術よりも4.6%向上した。各種学習手法の誤り解析により, 難解な単語の分類精度を高めることにより, 性能が向上することが明らかとなった。
論文参考訳（メタデータ） (2022-09-03T09:38:11Z)
Data Augmentation techniques in time series domain: A survey and taxonomy [0.20971479389679332]
時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。この研究は、すべての利用可能なアルゴリズムの概要を提供するために、この分野の最先端を体系的にレビューする。本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文参考訳（メタデータ） (2022-06-25T17:09:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。