論文の概要: A Dataset of Dengue Hospitalizations in Brazil (1999 to 2021) with Weekly Disaggregation from Monthly Counts
- arxiv url: http://arxiv.org/abs/2601.16994v1
- Date: Mon, 12 Jan 2026 20:27:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 02:21:38.469038
- Title: A Dataset of Dengue Hospitalizations in Brazil (1999 to 2021) with Weekly Disaggregation from Monthly Counts
- Title(参考訳): ブラジルにおけるデング入院(1999-2021)の統計 : 週ごとの集計
- Authors: Lucas M. Morello, Matheus Lima Castro, Pedro Cesar M. G. Camargo, Liliane Moreira Nery, Darllan Collins da Cunha e Silva, Leopoldo Lusquino Filho,
- Abstract要約: 本データでは、このデータセット(v)をDOI 10.5281/zenodo.18189192で公開し、公開している。
このデータセットは、疫学予測のためのAIモデルのより効果的なトレーニングを可能にするために、もともと月毎データの時間的粒度を増大させる必要性から、ブラジル全土の市レベルのデング入院時刻を調和させ、月毎の総数を保存するためのプロトコルによって毎週の解決(疫学週間)に分解する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This data paper describes and publicly releases this dataset (v1.0.0), published on Zenodo under DOI 10.5281/zenodo.18189192. Motivated by the need to increase the temporal granularity of originally monthly data to enable more effective training of AI models for epidemiological forecasting, the dataset harmonizes municipal-level dengue hospitalization time series across Brazil and disaggregates them to weekly resolution (epidemiological weeks) through an interpolation protocol with a correction step that preserves monthly totals. The statistical and temporal validity of this disaggregation was assessed using a high-resolution reference dataset from the state of Sao Paulo (2024), which simultaneously provides monthly and epidemiological-week counts, enabling a direct comparison of three strategies: linear interpolation, jittering, and cubic spline. Results indicated that cubic spline interpolation achieved the highest adherence to the reference data, and this strategy was therefore adopted to generate weekly series for the 1999 to 2021 period. In addition to hospitalization time series, the dataset includes a comprehensive set of explanatory variables commonly used in epidemiological and environmental modeling, such as demographic density, CH4, CO2, and NO2 emissions, poverty and urbanization indices, maximum temperature, mean monthly precipitation, minimum relative humidity, and municipal latitude and longitude, following the same temporal disaggregation scheme to ensure multivariate compatibility. The paper documents the datasets provenance, structure, formats, licenses, limitations, and quality metrics (MAE, RMSE, R2, KL, JSD, DTW, and the KS test), and provides usage recommendations for multivariate time-series analysis, environmental health studies, and the development of machine learning and deep learning models for outbreak forecasting.
- Abstract(参考訳): 本データでは、このデータセットをDOI 10.5281/zenodo.18189192の下でZenodoで公開し、公開している(v1.0.0)。
このデータセットは、疫学予測のためのAIモデルのより効果的なトレーニングを可能にするために、元々の月次データの時間的粒度を増大させる必要性により、ブラジル全土の自治体レベルのデング入院時間シリーズを調和させ、月次総計を保存する修正ステップを備えた補間プロトコルを通じて毎週の解決(疫学週間)にそれらを分解する。
2024年、サンパウロ州からの高解像度の基準データセットを用いて統計的・時間的妥当性を評価し、月次・疫学的週次カウントを同時に提供し、線形補間、ジッタリング、立方体スプラインの3つの戦略の直接比較を可能にした。
その結果, 立方体スプライン補間は基準データに最も順応し, この戦略が1999年から2021年にかけての週次連続生成に採用された。
このデータセットは、入院時間シリーズに加えて、人口密度、CH4、CO2、NO2排出量、貧困と都市化指標、最大温度、月平均降水量、最低相対湿度、市町村緯度、経度など、疫学および環境モデルで一般的に使用される説明変数の包括的セットを含む。
論文は、データセットの出所、構造、フォーマット、ライセンス、制限、品質指標(MAE、RMSE、R2、KL、JSD、DTW、KSテスト)を文書化し、多変量時系列分析、環境健康研究、およびアウトブレイク予測のための機械学習モデルとディープラーニングモデルの開発について推奨する。
関連論文リスト
- Independent Component Discovery in Temporal Count Data [46.526610368455096]
本稿では、時間数データの独立成分分析のための生成フレームワークを導入し、レギュラー適応力学とポアソン対数正規放出を組み合わせた。
このモデルは、状態に依存したコントリビューションで絡み合ったコンポーネントを特定し、表現学習と摂動解析を可能にする。
論文 参考訳(メタデータ) (2026-01-29T13:30:10Z) - Multi-modal Adaptive Estimation for Temporal Respiratory Disease Outbreak [8.861941883057098]
MAESTROは、スペクトル時間モデリングとマルチモーダルデータ融合を統合する、新しく統一されたフレームワークである。
香港の11年以上のデータから評価すると、MAESTRO は R-square 0.956 に適合する優れたモデルを実現している。
モジュラーで再現可能なパイプラインは、他の地域や病原体への展開と拡張を容易にするために公開されている。
論文 参考訳(メタデータ) (2025-09-10T13:27:40Z) - Multitask LSTM for Arboviral Outbreak Prediction Using Public Health Data [0.0]
本稿ではブラジル・レシフェにおけるアルボウイルスの発生とケースカウントの同時予測のためのマルチタスク学習手法を提案する。
提案モデルでは,バイナリ分類(アウトブレイク検出)と回帰(ケース予測)タスクを同時に実行する。
このアーキテクチャは、病気やタスク間での競合的なパフォーマンスを提供し、データ限定の公衆衛生シナリオにおけるスケーラブルな流行予測のための統合モデリング戦略の実現可能性とメリットを実証する。
論文 参考訳(メタデータ) (2025-05-07T16:58:18Z) - Grouped self-attention mechanism for a memory-efficient Transformer [64.0125322353281]
天気予報、電力消費、株式市場などの現実世界のタスクには、時間とともに変化するデータの予測が含まれる。
時系列データは通常、その周期的特性と時間的長期依存性のために、長いシーケンスで長い観察期間にわたって記録される。
我々はGSA(Grouped Self-Attention)とCCA(Compressed Cross-Attention)の2つの新しいモジュールを提案する。
提案モデルでは,既存の手法に匹敵する計算量と性能の低減が効果的に示された。
論文 参考訳(メタデータ) (2022-10-02T06:58:49Z) - Modeling the geospatial evolution of COVID-19 using spatio-temporal
convolutional sequence-to-sequence neural networks [48.7576911714538]
ポルトガルは世界最大の発生率を持つ国であり、人口10万人当たりの14日間の発生率が1000を超える。
その重要性にもかかわらず、covid-19の地理空間的進化の正確な予測は依然として課題である。
論文 参考訳(メタデータ) (2021-05-06T15:24:00Z) - Comparison of Traditional and Hybrid Time Series Models for Forecasting
COVID-19 Cases [0.5849513679510832]
2019年12月の新型コロナウイルスの感染は、すでに世界中で数百万人を感染させ、拡大し続けています。
流行のカーブが平ら化し始めた直後、多くの国が再びケースの増加を目撃し始めている。
したがって、国家当局や保健当局に将来の時代の即時戦略を提供するには、時系列予測モデルの徹底的な分析が必要です。
論文 参考訳(メタデータ) (2021-05-05T14:56:27Z) - STELAR: Spatio-temporal Tensor Factorization with Latent Epidemiological
Regularization [76.57716281104938]
我々は,多くの地域の流行傾向を同時に予測するテンソル法を開発した。
stelarは離散時間差分方程式のシステムを通じて潜在時間正規化を組み込むことで長期予測を可能にする。
我々は、カウンティレベルと州レベルのCOVID-19データの両方を用いて実験を行い、このモデルが流行の興味深い潜伏パターンを識別できることを示します。
論文 参考訳(メタデータ) (2020-12-08T21:21:47Z) - Ensemble Forecasting of the Zika Space-TimeSpread with Topological Data
Analysis [13.838100337224075]
ジカウイルスは、主にAedes aegyptiとAedes albopictusの蚊に噛まれて伝染する。
その結果、ジカウイルス感染の頻度は、降水量、高温、人口密度の高い地域では一般的である。
累積ベティ数の概念を導入し,その累積ベティ数をトポロジカル記述子として3つの機械学習モデルに統合する。
論文 参考訳(メタデータ) (2020-09-24T16:42:19Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。