論文の概要: EpiCastBench: Datasets and Benchmarks for Multivariate Epidemic Forecasting
- arxiv url: http://arxiv.org/abs/2605.11598v1
- Date: Tue, 12 May 2026 06:22:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.628226
- Title: EpiCastBench: Datasets and Benchmarks for Multivariate Epidemic Forecasting
- Title(参考訳): EpiCastBench: 多変量エピデミック予測のためのデータセットとベンチマーク
- Authors: Madhurima Panja, Danny D'Agostino, Huitao Li, Tanujit Chakraborty, Nan Liu,
- Abstract要約: 大規模ベンチマークフレームワークであるEpiCastBenchについて紹介する。
これらのデータセットは、幅広い感染症にまたがり、時間的粒度、シリーズの長さ、空間性といった様々な特徴を示す。
この枠組みを活用することで、統計的ベースラインから最先端の深層学習および基礎モデルにまたがる15の多変量予測モデルの包括的評価を行う。
- 参考スコア(独自算出の注目度): 3.63099567325064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing adoption of data-driven decision-making in public health has established epidemic forecasting as a critical area of research. Recent advances in multivariate forecasting models better capture complex temporal dependencies than conventional univariate approaches, which model individual series independently. Despite this potential, the development of robust epidemic forecasting methods is constrained by the lack of high-quality benchmarks comprising diverse multivariate datasets across infectious diseases and geographical regions. To address this gap, we present EpiCastBench, a large-scale benchmarking framework featuring 40 curated (correlated) multivariate epidemic datasets. These publicly available datasets span a wide range of infectious diseases and exhibit diverse characteristics in terms of temporal granularity, series length, and sparsity. We analyze these datasets to identify their global features and structural patterns. To ensure reproducibility and fair comparison, we establish standardized evaluation settings, including a unified forecasting horizon, consistent preprocessing pipelines, diverse performance metrics, and statistical significance testing. By leveraging this framework, we conduct a comprehensive evaluation of 15 multivariate forecasting models spanning statistical baselines to state-of-the-art deep learning and foundation models. All datasets and code are publicly available on Kaggle (https://www.kaggle.com/datasets/aimltsf/epicastbench) and GitHub (https://github.com/aimltsf/EpiCastBench).
- Abstract(参考訳): 公衆衛生におけるデータ駆動意思決定の導入の増加は、研究の重要領域として流行予測を確立している。
多変量予測モデルの最近の進歩は、個々の系列を独立にモデル化する従来の単変量アプローチよりも複雑な時間的依存関係をよりよく捉えている。
このような可能性にもかかわらず、ロバストな流行予測手法の開発は、感染症や地理的地域にまたがる多様な多変量データセットからなる高品質なベンチマークの欠如によって制限されている。
このギャップに対処するために、40のキュレートされた(関連する)多変量流行データセットを備えた大規模ベンチマークフレームワークであるEpiCastBenchを紹介する。
これらの公開データセットは、広範囲の感染症にまたがり、時間的粒度、シリーズの長さ、空間性といった様々な特徴を示す。
これらのデータセットを分析し、そのグローバルな特徴と構造パターンを特定します。
再現性と公正な比較を確保するため、統一された予測水平線、一貫した前処理パイプライン、多種多様なパフォーマンス指標、統計的重要性テストを含む標準化された評価設定を確立する。
この枠組みを活用することで、統計的ベースラインから最先端の深層学習および基礎モデルにまたがる15の多変量予測モデルの包括的評価を行う。
すべてのデータセットとコードは、Kaggle(https://www.kaggle.com/datasets/aimltsf/epicastbench)とGitHub(https://github.com/aimltsf/EpiCastBench)で公開されている。
関連論文リスト
- IDOBE: Infectious Disease Outbreak forecasting Benchmark Ecosystem [1.443414322584475]
疫学予測は、リアルタイム感染症の流行に不可欠な要素となっている。
本稿では,流行予測に焦点をあてた疫学的時系列の収集であるIDOBEを提案する。
IDOBEは1世紀にわたる監視と、米国の州や世界各国にまたがる複数のデータリポジトリからコンパイルされる。
論文 参考訳(メタデータ) (2026-04-20T17:18:18Z) - Multi-modal Adaptive Estimation for Temporal Respiratory Disease Outbreak [8.861941883057098]
MAESTROは、スペクトル時間モデリングとマルチモーダルデータ融合を統合する、新しく統一されたフレームワークである。
香港の11年以上のデータから評価すると、MAESTRO は R-square 0.956 に適合する優れたモデルを実現している。
モジュラーで再現可能なパイプラインは、他の地域や病原体への展開と拡張を容易にするために公開されている。
論文 参考訳(メタデータ) (2025-09-10T13:27:40Z) - A Framework for Multi-source Privacy Preserving Epidemic Analysis [31.81847010151668]
一部のデータセットは、しばしばセンシティブで、適切なプライバシー保護が必要である。
プライバシには多くのモデルがありますが、その強力な保証のため、差分プライバシー(DP)は事実上の標準になっています。
本研究では,深層学習と流行モデルを統合して,流行予測を同時に実行し,流行拡大のメカニズムモデルを学習する枠組みを開発する。
論文 参考訳(メタデータ) (2025-06-27T15:52:12Z) - Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - CAMul: Calibrated and Accurate Multi-view Time-Series Forecasting [70.54920804222031]
本稿では,一般的な確率的マルチビュー予測フレームワークであるCAMulを提案する。
多様なデータソースから表現と不確実性を学ぶことができる。
動的コンテキスト固有の方法で、各データビューからの知識と不確実性を統合する。
CAMulは、他の最先端確率予測モデルよりも精度とキャリブレーションが25%以上向上していることを示す。
論文 参考訳(メタデータ) (2021-09-15T17:13:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。