論文の概要: StiefelGen: A Simple, Model Agnostic Approach for Time Series Data
Augmentation over Riemannian Manifolds
- arxiv url: http://arxiv.org/abs/2402.19287v1
- Date: Thu, 29 Feb 2024 15:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 14:16:51.862090
- Title: StiefelGen: A Simple, Model Agnostic Approach for Time Series Data
Augmentation over Riemannian Manifolds
- Title(参考訳): StiefelGen: リーマン多様体上の時系列データ拡張のための単純でモデルに依存しないアプローチ
- Authors: Prasad Cheema, Mahito Sugiyama
- Abstract要約: 時系列データ拡張のための3つの一般的なアプローチは、 (i) 物理モデルを構築し、係数空間上で不確実性を付与すること (ii) 観測されたデータセットにノイズを加えること (iii) 堅牢な生成ニューラルネットワークモデルを訓練できる膨大な時系列データセットにアクセスすること。
本稿では,これら3つの制約の全てを,広範囲に同時に取り組もうとする方法論を提案する。
この方法は、時系列信号を置く簡単な方法を提案するため、スティフェル多様体のよく研究された行列微分幾何学に依存する。
- 参考スコア(独自算出の注目度): 10.751130375035558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation is an area of research which has seen active development in
many machine learning fields, such as in image-based learning models,
reinforcement learning for self driving vehicles, and general noise injection
for point cloud data. However, convincing methods for general time series data
augmentation still leaves much to be desired, especially since the methods
developed for these models do not readily cross-over. Three common approaches
for time series data augmentation include: (i) Constructing a physics-based
model and then imbuing uncertainty over the coefficient space (for example),
(ii) Adding noise to the observed data set(s), and, (iii) Having access to
ample amounts of time series data sets from which a robust generative neural
network model can be trained. However, for many practical problems that work
with time series data in the industry: (i) One usually does not have access to
a robust physical model, (ii) The addition of noise can in of itself require
large or difficult assumptions (for example, what probability distribution
should be used? Or, how large should the noise variance be?), and, (iii) In
practice, it can be difficult to source a large representative time series data
base with which to train the neural network model for the underlying problem.
In this paper, we propose a methodology which attempts to simultaneously tackle
all three of these previous limitations to a large extent. The method relies
upon the well-studied matrix differential geometry of the Stiefel manifold, as
it proposes a simple way in which time series signals can placed on, and then
smoothly perturbed over the manifold. We attempt to clarify how this method
works by showcasing several potential use cases which in particular work to
take advantage of the unique properties of this underlying manifold.
- Abstract(参考訳): データ拡張は、画像ベースの学習モデル、自動運転車の強化学習、ポイントクラウドデータの一般的なノイズ注入など、多くの機械学習分野において活発に開発されている研究分野である。
しかし,一般時系列データ拡張のための説得的手法は,特にこれらのモデルのために開発された手法が容易にクロスオーバーできないため,まだ多くの課題が残されている。
時系列データ拡張のための3つの一般的なアプローチは次のとおりである。
(i)物理モデルの構築と係数空間上の不確実性(例えば)
(ii)観測データ集合にノイズを加えること、及び
(iii)頑健な生成ニューラルネットワークモデルから大量の時系列データセットにアクセスすることができる。
しかしながら、業界で時系列データを扱う多くの実用的な問題に対して。
(i)通常、堅牢な物理モデルにアクセスできない。
(二)ノイズの付加は、それ自体が大きな、あるいは難しい仮定を必要とする(例えば、どの確率分布を使うべきか?又は、ノイズの分散はどの程度大きいべきか?)。
(iii)実際には、基盤となる問題に対してニューラルネットワークモデルをトレーニングする大規模な時系列データベースをソースすることは困難である。
本稿では,これら3つの制約を多数同時に取り組もうとする手法を提案する。
この方法はStiefel多様体のよく研究された行列微分幾何学に依存しており、時系列信号の配置と多様体上の滑らかな摂動の簡単な方法を提案する。
この手法がどのように機能するかを明らかにするために、この基礎となる多様体のユニークな性質を活用するために特に機能するいくつかの潜在的なユースケースを示す。
関連論文リスト
- Time Series Data Augmentation as an Imbalanced Learning Problem [2.5536554335016417]
我々は、オーバーサンプリング戦略を用いて、合成時系列観測を作成し、予測モデルの精度を向上させる。
5502個の単変量時系列を含む7種類のデータベースを用いて実験を行った。
提案手法は,グローバルモデルとローカルモデルの両方で優れており,この2つのアプローチのトレードオフが良好であることがわかった。
論文 参考訳(メタデータ) (2024-04-29T09:27:15Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Generative Modeling of Regular and Irregular Time Series Data via Koopman VAEs [50.25683648762602]
モデルの新しい設計に基づく新しい生成フレームワークであるKoopman VAEを紹介する。
クープマン理論に触発され、線形写像を用いて潜在条件事前力学を表現する。
KoVAEは、いくつかの挑戦的な合成および実世界の時系列生成ベンチマークにおいて、最先端のGANおよびVAEメソッドより優れている。
論文 参考訳(メタデータ) (2023-10-04T07:14:43Z) - On Inductive Biases for Machine Learning in Data Constrained Settings [0.0]
この論文は、データ制約された設定で表現力のあるモデルを学ぶという問題に対する異なる答えを探求する。
ニューラルネットワークを学ぶために、大きなデータセットに頼るのではなく、データ構造を反映した既知の関数によって、いくつかのモジュールを置き換えるつもりです。
我々のアプローチは「帰納的バイアス」のフードの下に置かれており、これは探索するモデルの空間を制限する手元にあるデータの仮説として定義することができる。
論文 参考訳(メタデータ) (2023-02-21T14:22:01Z) - Generative Time Series Forecasting with Diffusion, Denoise, and
Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。
実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。
本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2023-01-08T12:20:46Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Time Series Forecasting with Ensembled Stochastic Differential Equations
Driven by L\'evy Noise [2.3076895420652965]
我々は、ニューラルネットワークを備えたSDEの集合を用いて、ノイズのある時系列の長期的な傾向を予測する。
まず、位相空間再構成法を用いて時系列データの固有次元を抽出する。
次に、$alpha$-stable L'evyの動作によって駆動されるSDEを探索し、時系列データをモデル化し、ニューラルネットワーク近似を用いて問題を解く。
論文 参考訳(メタデータ) (2021-11-25T16:49:01Z) - Deep Time Series Models for Scarce Data [8.673181404172963]
時系列データは多くの領域で爆発的な速度で成長し、時系列モデリング研究の急増を刺激している。
データ希少性は、膨大なデータ分析の問題で発生する普遍的な問題です。
論文 参考訳(メタデータ) (2021-03-16T22:16:54Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z) - Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。
これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。
この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-02-21T05:00:01Z) - Multivariate Probabilistic Time Series Forecasting via Conditioned
Normalizing Flows [8.859284959951204]
時系列予測は科学的・工学的な問題の基本である。
深層学習法はこの問題に適している。
多くの実世界のデータセットにおける標準メトリクスの最先端よりも改善されていることを示す。
論文 参考訳(メタデータ) (2020-02-14T16:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。