論文の概要: Guidelines for Augmentation Selection in Contrastive Learning for Time Series Classification
- arxiv url: http://arxiv.org/abs/2407.09336v1
- Date: Fri, 12 Jul 2024 15:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-15 23:08:25.388588
- Title: Guidelines for Augmentation Selection in Contrastive Learning for Time Series Classification
- Title(参考訳): 時系列分類のためのコントラスト学習における拡張選択のガイドライン
- Authors: Ziyu Liu, Azadeh Alavi, Minyi Li, Xiang Zhang,
- Abstract要約: 我々は、トレンドや季節といったデータセットの特徴に基づいて、拡張を選択するための原則的な枠組みを確立する。
次に、12の合成データセットと6つの実世界のデータセットにまたがる8つの異なる拡張の有効性を評価する。
提案手法は,時系列データセットの有効拡張を正確に識別する。
- 参考スコア(独自算出の注目度): 7.712601563682029
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Self-supervised contrastive learning has become a key technique in deep learning, particularly in time series analysis, due to its ability to learn meaningful representations without explicit supervision. Augmentation is a critical component in contrastive learning, where different augmentations can dramatically impact performance, sometimes influencing accuracy by over 30%. However, the selection of augmentations is predominantly empirical which can be suboptimal, or grid searching that is time-consuming. In this paper, we establish a principled framework for selecting augmentations based on dataset characteristics such as trend and seasonality. Specifically, we construct 12 synthetic datasets incorporating trend, seasonality, and integration weights. We then evaluate the effectiveness of 8 different augmentations across these synthetic datasets, thereby inducing generalizable associations between time series characteristics and augmentation efficiency. Additionally, we evaluated the induced associations across 6 real-world datasets encompassing domains such as activity recognition, disease diagnosis, traffic monitoring, electricity usage, mechanical fault prognosis, and finance. These real-world datasets are diverse, covering a range from 1 to 12 channels, 2 to 10 classes, sequence lengths of 14 to 1280, and data frequencies from 250 Hz to daily intervals. The experimental results show that our proposed trend-seasonality-based augmentation recommendation algorithm can accurately identify the effective augmentations for a given time series dataset, achieving an average Recall@3 of 0.667, outperforming baselines. Our work provides guidance for studies employing contrastive learning in time series analysis, with wide-ranging applications. All the code, datasets, and analysis results will be released at https://github.com/DL4mHealth/TS-Contrastive-Augmentation-Recommendation.
- Abstract(参考訳): 自己教師付きコントラスト学習は、特に時系列分析において、明示的な監督なしに意味のある表現を学習する能力のために、深層学習において重要な技術となっている。
強化は対照的な学習において重要な要素であり、異なる拡張がパフォーマンスに劇的に影響を与え、時には30%以上の精度に影響を与えることがある。
しかし、拡張の選択は、主に経験的であり、最適以下、あるいは時間を要するグリッド探索である。
本稿では,トレンドや季節といったデータセットの特徴に基づく拡張を選択するための原則的枠組みを確立する。
具体的には、トレンド、季節性、統合重みを取り入れた12の合成データセットを構築した。
次に、これらの合成データセットの8つの異なる拡張の有効性を評価し、時系列特性と拡張効率の一般化を誘導する。
さらに,活動認識,疾患診断,交通監視,電気利用,機械的故障予後,財務などの領域を含む実世界の6つのデータセットの関連性を評価した。
これらの実世界のデータセットは様々で、1から12のチャンネル、2から10のクラス、14から1280のシーケンスの長さ、250Hzから毎日の間隔のデータ周波数をカバーしている。
実験結果から,提案アルゴリズムは時系列データセットの有効拡張を正確に識別し,平均Recall@3の0.667を達成し,ベースラインを上回ることを示す。
本研究は,時系列解析におけるコントラスト学習を応用した研究のガイダンスを提供する。
すべてのコード、データセット、分析結果はhttps://github.com/DL4mHealth/TS-Contrastive-Augmentation-Recommendationで公開される。
関連論文リスト
- Data Augmentation for Traffic Classification [54.92823760790628]
Data Augmentation (DA) はコンピュータビジョン(CV)と自然言語処理(NLP)に広く採用されている技術である。
DAはネットワークのコンテキスト、特にトラフィック分類(TC)タスクにおいて、牽引力を得るのに苦労しています。
論文 参考訳(メタデータ) (2024-01-19T15:25:09Z) - Empirical Study of Mix-based Data Augmentation Methods in Physiological
Time Series Data [5.6321096218738305]
6つの生理的データセット上で,ミックスアップ,カットミックス,多様体ミックスアップを含むミックスベース拡張を系統的に検討した。
以上の結果から,ミックスベースの3つの拡張が6つのデータセットのパフォーマンスを継続的に改善できることが示唆された。
論文 参考訳(メタデータ) (2023-09-18T17:51:47Z) - Time Series Contrastive Learning with Information-Aware Augmentations [57.45139904366001]
コントラスト学習の鍵となる要素は、いくつかの先行を示唆する適切な拡張を選択して、実現可能な正のサンプルを構築することである。
対照的な学習タスクやデータセットに意味のある時系列データの増大をどうやって見つけるかは、未解決の問題である。
本稿では,時系列表現学習のための最適な拡張を適応的に選択する情報認識拡張を用いた新しいコントラスト学習手法であるInfoTSを提案する。
論文 参考訳(メタデータ) (2023-03-21T15:02:50Z) - Training Strategies for Improved Lip-reading [61.661446956793604]
本研究では,最先端データ拡張手法,時間モデル,その他のトレーニング戦略の性能について検討する。
すべての手法を組み合わせると、分類精度は93.4%となり、現在の最先端技術よりも4.6%向上した。
各種学習手法の誤り解析により, 難解な単語の分類精度を高めることにより, 性能が向上することが明らかとなった。
論文 参考訳(メタデータ) (2022-09-03T09:38:11Z) - Data Augmentation techniques in time series domain: A survey and
taxonomy [0.20971479389679332]
時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。
この研究は、すべての利用可能なアルゴリズムの概要を提供するために、この分野の最先端を体系的にレビューする。
本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文 参考訳(メタデータ) (2022-06-25T17:09:00Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Data Augmentation for Electrocardiograms [2.8498944632323755]
本研究では,データスカース心電図予測問題の性能向上にデータ拡張法が有効かどうかを検討する。
本稿では,タスクごとに最適化されたフレキシブルな拡張ポリシーを定義する新しい方法であるTaskAugを紹介する。
実験では、TaskAugが以前の作業と競合するか、改善していることがわかった。
論文 参考訳(メタデータ) (2022-04-09T02:19:55Z) - Robust Augmentation for Multivariate Time Series Classification [20.38907456958682]
カットアウト,カットミックス,ミックスアップ,ウィンドウワープの簡単な方法により,堅牢性と全体的な性能が向上することを示す。
InceptionTimeネットワークは18種類のデータセットで精度を1%から45%向上することを示す。
論文 参考訳(メタデータ) (2022-01-27T18:57:49Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。