Fugu-MT 論文翻訳(概要): TSGBench: Time Series Generation Benchmark

論文の概要: TSGBench: Time Series Generation Benchmark

arxiv url: http://arxiv.org/abs/2309.03755v1
Date: Thu, 7 Sep 2023 14:51:42 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-08 12:38:34.154922
Title: TSGBench: Time Series Generation Benchmark
Title（参考訳）: TSGBench: 時系列生成ベンチマーク
Authors: Yihao Ang, Qiang Huang, Yifan Bao, Anthony K. H. Tung, Zhiyong Huang
Abstract要約: textsfTSGBenchは、合成時系列生成法の統一的で包括的な評価である。 1)TSG用に調整された公開データセットの収集と標準化された前処理パイプライン、(2)バニラ測度、新しい距離ベースアセスメント、可視化ツールを含む総合的な評価スイート、(3)ドメイン適応(DA)に根ざした先駆的な一般化テストである。我々は,10の高度なTSG手法と12の評価尺度をテキストfTSGBenchで測定し,多様な領域から10の実世界のデータセットにまたがって広範な実験を行った。
参考スコア（独自算出の注目度）: 11.199605025284185
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Synthetic Time Series Generation (TSG) is crucial in a range of applications, including data augmentation, anomaly detection, and privacy preservation. Although significant strides have been made in this field, existing methods exhibit three key limitations: (1) They often benchmark against similar model types, constraining a holistic view of performance capabilities. (2) The use of specialized synthetic and private datasets introduces biases and hampers generalizability. (3) Ambiguous evaluation measures, often tied to custom networks or downstream tasks, hinder consistent and fair comparison. To overcome these limitations, we introduce \textsf{TSGBench}, the inaugural TSG Benchmark, designed for a unified and comprehensive assessment of TSG methods. It comprises three modules: (1) a curated collection of publicly available, real-world datasets tailored for TSG, together with a standardized preprocessing pipeline; (2) a comprehensive evaluation measures suite including vanilla measures, new distance-based assessments, and visualization tools; (3) a pioneering generalization test rooted in Domain Adaptation (DA), compatible with all methods. We have conducted extensive experiments across ten real-world datasets from diverse domains, utilizing ten advanced TSG methods and twelve evaluation measures, all gauged through \textsf{TSGBench}. The results highlight its remarkable efficacy and consistency. More importantly, \textsf{TSGBench} delivers a statistical breakdown of method rankings, illuminating performance variations across different datasets and measures, and offering nuanced insights into the effectiveness of each method.
Abstract（参考訳）: 合成時系列生成(TSG)は、データ拡張、異常検出、プライバシー保護など、さまざまなアプリケーションにおいて重要である。この分野では大きな進歩を遂げているが、既存の手法には3つの重要な制限がある。 2) 特殊合成データセットとプライベートデータセットの使用は、バイアスと一般化を阻害する。 (3) カスタムネットワークや下流タスクに結びついているあいまいな評価措置は、一貫性と公正な比較を妨げる。これらの制約を克服するために,TSG手法の統一的かつ総合的な評価を目的とした最初のTSGベンチマークである \textsf{TSGBench} を導入する。 1)TSG用に最適化された実世界のデータセットと標準化された前処理パイプライン、(2)バニラ測度、新しい距離ベースアセスメント、可視化ツールを含む総合的な評価スイート、(3)ドメイン適応(DA)に根ざした先駆的な一般化テスト(DA)の3つのモジュールからなる。様々な領域から10個の実世界のデータセットにまたがって大規模な実験を行い、10個の高度なTSG法と12個の評価尺度を用いた。結果は、その顕著な有効性と一貫性を強調している。さらに重要なことに、 \textsf{tsgbench} はメソッドのランキングを統計的に分解し、さまざまなデータセットや測定値のパフォーマンスのバリエーションを照らし出し、各メソッドの有効性に関する微妙な洞察を提供する。

関連論文リスト

ConTSG-Bench: A Unified Benchmark for Conditional Time Series Generation [11.663484746644615]
条件付き時系列生成は、データの不足に対処し、現実世界のアプリケーションで因果解析を可能にする上で重要な役割を果たす。条件付き時系列生成ベンチマーク(ConTSG-Bench)を紹介する。 ConTSG-Benchは、多様な条件付けのモダリティとセマンティック抽象化のレベルにまたがる、大規模で整列したデータセットで構成されている。
論文参考訳（メタデータ） (2026-03-05T03:30:52Z)
It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks [87.7937890373758]
時系列基礎モデル(TSFM)は,特定のデータセットモデルから一般化可能なタスク評価に至るまで,予測環境に革命をもたらしている。我々は、50の新しいデータセットと98の予測タスクからなる次世代タスク中心のベンチマークであるTIMEを紹介する。静的なメタラベルに基づく従来のデータセットレベルの評価を超える新しいパターンレベルの評価視点を提案する。
論文参考訳（メタデータ） (2026-02-12T16:31:01Z)
FedGPS: Statistical Rectification Against Data Heterogeneity in Federated Learning [103.45987800174724]
フェデレートラーニング(FL)は、データ不均一(data heterogeneity)として知られる重要な課題に直面し、モデルの性能と収束を損なう。統計分布と勾配情報をシームレスに統合する新しいフレームワークである textbfFedGPS を提案する。
論文参考訳（メタデータ） (2025-10-23T06:10:11Z)
FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。 FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文参考訳（メタデータ） (2025-02-26T05:19:16Z)
CoFE-RAG: A Comprehensive Full-chain Evaluation Framework for Retrieval-Augmented Generation with Enhanced Data Diversity [23.48167670445722]
Retrieval-Augmented Generation (RAG) は、外部知識ソースから取得したコンテキストの助けを借りて、より正確で信頼性の高い回答を生成することを目的としている。これらのシステムの評価は, 以下の問題により, 依然として重要な研究領域である。 RAGパイプライン全体にわたって徹底的な評価を容易にするために,包括的全チェーン評価(CoFE-RAG)フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-16T05:20:32Z)
EBES: Easy Benchmarking for Event Sequences [17.277513178760348]
イベントシーケンスは、ヘルスケア、ファイナンス、ユーザインタラクションログなど、さまざまな現実世界のドメインにおける一般的なデータ構造である。時間データモデリング技術の進歩にもかかわらず、イベントシーケンスのパフォーマンスを評価するための標準ベンチマークは存在しない。標準化された評価シナリオとプロトコルを備えた総合的なベンチマークツールであるEBESを紹介する。
論文参考訳（メタデータ） (2024-10-04T13:03:43Z)
Constructing Confidence Intervals for 'the' Generalization Error -- a Comprehensive Benchmark Study [7.094603504956301]
機械学習では、一般化誤差に対する信頼区間(CI)が重要なツールである。 7種類のインデューサと合計8個の損失関数を用いて,合計19個の回帰および分類問題に対する13種類のCI手法の評価を行った。一般化エラーのためのCI構築の方法論的基礎と固有の課題について概説し、統一されたフレームワークにおける13のメソッド全てを簡潔にレビューする。
論文参考訳（メタデータ） (2024-09-27T15:29:32Z)
UniTTA: Unified Benchmark and Versatile Framework Towards Realistic Test-Time Adaptation [66.05528698010697]
Test-Time Adaptationは、テスト中にトレーニング済みのモデルを対象のドメインに適応させることを目的としている。研究者は様々な挑戦シナリオを特定し、これらの課題に対処するための様々な方法を開発した。本稿では,包括的かつ広く適用可能な統一テスト時間適応ベンチマークを提案する。
論文参考訳（メタデータ） (2024-07-29T15:04:53Z)
On the Evaluation Consistency of Attribution-based Explanations [42.1421504321572]
本稿では,画像領域における属性メソッドのベンチマークを行うオープンプラットフォームであるMeta-Rankを紹介する。 1) 異なる設定下での属性評価手法の評価は、異なる性能ランキングを得ることができ、2) 多数のケースで矛盾するが、同一のトレーニング軌道に沿った個別のチェックポイントにまたがる顕著な一貫性を示す。
論文参考訳（メタデータ） (2024-07-28T11:49:06Z)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。 GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳（メタデータ） (2024-06-01T08:01:05Z)
TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods [27.473935782550388]
時系列は、経済、交通、健康、エネルギーといった様々な領域で生成される。本稿では,時系列予測(TSF)手法の自動ベンチマークであるTFBを提案する。
論文参考訳（メタデータ） (2024-03-29T12:37:57Z)
Test-Time Domain Generalization for Face Anti-Spoofing [60.94384914275116]
Face Anti-Spoofing (FAS) は、顔認識システムをプレゼンテーション攻撃から保護するために重要である。本稿では,テストデータを活用してモデルの一般化性を高める新しいテスト時間領域一般化フレームワークについて紹介する。テスト時間スタイル投影 (TTSP) とディバーススタイルシフトシミュレーション (DSSS) によって構成された本手法は, 目に見えないデータを領域空間に効果的に投影する。
論文参考訳（メタデータ） (2024-03-28T11:50:23Z)
Hyperspectral Benchmark: Bridging the Gap between HSI Applications through Comprehensive Dataset and Pretraining [11.935879491267634]
ハイパースペクトルイメージング (HSI) は、様々な応用の非破壊空間分光技術として機能する。繰り返し発生する課題は、ターゲットデータセットの限られたサイズであり、徹底的なアーキテクチャ検索を妨げる。本研究は、3つの顕著な異なるHSIアプリケーションを含む革新的なベンチマークデータセットを紹介する。
論文参考訳（メタデータ） (2023-09-20T08:08:34Z)
DeepfakeBench: A Comprehensive Benchmark of Deepfake Detection [55.70982767084996]
ディープフェイク検出の分野で見落とされがちな課題は、標準化され、統一され、包括的なベンチマークがないことである。 DeepfakeBenchと呼ばれる,3つの重要なコントリビューションを提供するディープフェイク検出のための,最初の包括的なベンチマークを提示する。 DeepfakeBenchには15の最先端検出方法、9CLデータセット、一連のDeepfake検出評価プロトコルと分析ツール、包括的な評価ツールが含まれている。
論文参考訳（メタデータ） (2023-07-04T01:34:41Z)
News Summarization and Evaluation in the Era of GPT-3 [73.48220043216087]
GPT-3は,大規模な要約データセット上で訓練された微調整モデルと比較する。我々は,GPT-3サマリーが圧倒的に好まれるだけでなく,タスク記述のみを用いることで,現実性に乏しいようなデータセット固有の問題に悩まされることも示している。
論文参考訳（メタデータ） (2022-09-26T01:04:52Z)
WRENCH: A Comprehensive Benchmark for Weak Supervision [66.82046201714766]
ベンチマークは、分類とシーケンスタグ付けのための22の異なる実世界のデータセットで構成されている。ベンチマークプラットフォームとしての有効性を示すために、100以上のメソッドの変種に対して広範な比較を行うためにベンチマークを使用します。
論文参考訳（メタデータ） (2021-09-23T13:47:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。