論文の概要: STEB: In Search of the Best Evaluation Approach for Synthetic Time Series
- arxiv url: http://arxiv.org/abs/2505.21160v1
- Date: Tue, 27 May 2025 13:15:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.66366
- Title: STEB: In Search of the Best Evaluation Approach for Synthetic Time Series
- Title(参考訳): STEB:Synthetic Time Seriesのベスト評価手法の探索
- Authors: Michael Stenger, Robert Leppich, André Bauer, Samuel Kounev,
- Abstract要約: 合成時系列評価ベンチマーク(STEB)を提案する。
STEBは信頼性とスコアの整合性を測定するための指標を計算する。
実行時間、テストエラーを追跡し、シーケンシャルかつ並列な操作モードを特徴とする。
- 参考スコア(独自算出の注目度): 2.5216923314390733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The growing need for synthetic time series, due to data augmentation or privacy regulations, has led to numerous generative models, frameworks, and evaluation measures alike. Objectively comparing these measures on a large scale remains an open challenge. We propose the Synthetic Time series Evaluation Benchmark (STEB) -- the first benchmark framework that enables comprehensive and interpretable automated comparisons of synthetic time series evaluation measures. Using 10 diverse datasets, randomness injection, and 13 configurable data transformations, STEB computes indicators for measure reliability and score consistency. It tracks running time, test errors, and features sequential and parallel modes of operation. In our experiments, we determine a ranking of 41 measures from literature and confirm that the choice of upstream time series embedding heavily impacts the final score.
- Abstract(参考訳): データ拡張やプライバシー規制による合成時系列の必要性の高まりにより、多くの生成モデル、フレームワーク、評価指標が生まれている。
これらの尺度を大規模に客観的に比較することは、未解決の課題である。
我々は,合成時系列評価尺度の総合的かつ解釈可能な自動比較を可能にする最初のベンチマークフレームワークであるSynthetic Time Series Evaluation Benchmark (STEB)を提案する。
10の多様なデータセット、ランダムなインジェクション、13のコンフィギュレーション可能なデータ変換を使用して、STEBは信頼性とスコアの一貫性を計測するインジケータを算出する。
実行時間、テストエラーを追跡し、シーケンシャルかつ並列な操作モードを特徴とする。
本実験では,文献から41の項目をランク付けし,上流時系列の組込みの選択が最終スコアに大きく影響することを確認する。
関連論文リスト
- Breaking Silos: Adaptive Model Fusion Unlocks Better Time Series Forecasting [64.45587649141842]
時系列予測は多くの現実世界のアプリケーションにおいて重要な役割を果たす。
1つのモデルは、異なるテストサンプルで一貫して他よりも優れていますが、(ii) それぞれのモデルは特定のケースで優れています。
異種モデルのサンプルレベル適応融合による時系列予測のためのフレームワークであるTimeFuseを紹介する。
論文 参考訳(メタデータ) (2025-05-24T00:45:07Z) - Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.17057231661371]
時系列解析は複雑なシステムの力学を理解するために重要である。
基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。
彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。
本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文 参考訳(メタデータ) (2025-03-14T13:53:46Z) - Evaluating Time Series Foundation Models on Noisy Periodic Time Series [0.0]
本稿では,雑音周期時系列を構成する2つのデータセットに対して,時系列基礎モデル(TSFM)の性能を評価する実験的検討を行った。
以上の結果から, TSFMは, 周期が制限された時系列に対して, より長い時間, 高い雑音レベル, サンプリング率, より複雑な時系列形状で予測能力が低下することが示唆された。
論文 参考訳(メタデータ) (2025-01-01T16:36:21Z) - Recurrent Neural Goodness-of-Fit Test for Time Series [8.22915954499148]
時系列データは、金融や医療など、さまざまな分野において重要である。
従来の評価基準は、時間的依存関係と潜在的な特徴の高次元性のために不足している。
Recurrent Neural (RENAL) Goodness-of-Fit testは,生成時系列モデルを評価するための新しい,統計的に厳密なフレームワークである。
論文 参考訳(メタデータ) (2024-10-17T19:32:25Z) - EBES: Easy Benchmarking for Event Sequences [17.277513178760348]
イベントシーケンス(英: Event Sequences、EvS)とは、不規則なサンプリング間隔と分類的特徴と数値的特徴の混合を特徴とするシーケンシャルデータである。
EBESは、シーケンスレベルのターゲットを持つEvS分類のための包括的なベンチマークである。
9つのモダンモデルを実装したオープンソースのPyTorchライブラリとともに、標準化された評価シナリオとプロトコルを備えている。
論文 参考訳(メタデータ) (2024-10-04T13:03:43Z) - Seq-to-Final: A Benchmark for Tuning from Sequential Distributions to a Final Time Point [18.843395348612553]
履歴データの活用は、最終期間中に限られたデータが利用できる最後の時点のモデルを学ぶために必要である。
本研究では,3種類の手法の有効性を評価するために,異なる順序の合成シフトを用いたベンチマークを構築した。
この結果から, ベンチマークのシーケンスに対して, 逐次構造を無視し, 最終時点に適応する手法は良好に動作することが示唆された。
論文 参考訳(メタデータ) (2024-07-12T19:03:42Z) - TSI-Bench: Benchmarking Time Series Imputation [52.27004336123575]
TSI-Benchは、ディープラーニング技術を利用した時系列計算のための総合ベンチマークスイートである。
TSI-Benchパイプラインは、実験的な設定を標準化し、計算アルゴリズムの公平な評価を可能にする。
TSI-Benchは、計算目的のために時系列予測アルゴリズムを調整するための体系的なパラダイムを革新的に提供する。
論文 参考訳(メタデータ) (2024-06-18T16:07:33Z) - Evaluating DTW Measures via a Synthesis Framework for Time-Series Data [3.4437947384641037]
時系列データは、時間とともに特定の観察や興味の量を記述する様々なアプリケーションに由来する。
動的時間ワープ (DTW) は2つの時間信号間の最適アライメントを実現するための標準手法である。
ほとんどのDTW測度は、理由を明確に説明することなく、特定の時系列データに対して良好に機能する。
適切なDTW尺度を選択するためのガイドラインが提示されたのはこれが初めてである。
論文 参考訳(メタデータ) (2024-02-14T05:08:47Z) - TimeSiam: A Pre-Training Framework for Siamese Time-Series Modeling [67.02157180089573]
時系列事前トレーニングは、最近、ラベルのコストを削減し、下流の様々なタスクに利益をもたらす可能性があるとして、広く注目を集めている。
本稿では,シームズネットワークに基づく時系列の簡易かつ効果的な自己教師型事前学習フレームワークとしてTimeSiamを提案する。
論文 参考訳(メタデータ) (2024-02-04T13:10:51Z) - OrionBench: Benchmarking Time Series Generative Models in the Service of the End-User [8.05635934199494]
OrionBenchは、教師なし時系列異常検出モデルのための継続的ベンチマークフレームワークである。
OrionBenchの使用方法と,4年間で公開された17リリースにわたるパイプラインのパフォーマンスについて紹介する。
論文 参考訳(メタデータ) (2023-10-26T19:43:16Z) - Exogenous Data in Forecasting: FARM -- A New Measure for Relevance
Evaluation [62.997667081978825]
FARM - Forward Relevance Aligned Metricという新しいアプローチを導入する。
我々のフォワード法は、その後のデータポイントの変化を時系列に合わせるために比較する角測度に依存する。
第1の検証ステップとして、FARMアプローチの合成信号・代表信号への適用について述べる。
論文 参考訳(メタデータ) (2023-04-21T15:22:33Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。