論文の概要: A windowed correlation based feature selection method to improve time
series prediction of dengue fever cases
- arxiv url: http://arxiv.org/abs/2104.10289v1
- Date: Wed, 21 Apr 2021 00:28:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 14:22:12.562825
- Title: A windowed correlation based feature selection method to improve time
series prediction of dengue fever cases
- Title(参考訳): 窓付き相関式特徴選択法によるデング熱患者の時系列予測の改善
- Authors: Tanvir Ferdousi, Lee W. Cohnstaedt, and Caterina M. Scoglio
- Abstract要約: 予測性能の低さは、不適切なデータを持つ場所につながる可能性がある。
新しいフレームワークは、インシデントデータのウィンドウ化と時間シフト相関に基づくメトリクスの計算を行う。
繰り返しニューラルネットワークに基づく予測モデルは、平均33.6%の精度向上を達成している。
- 参考スコア(独自算出の注目度): 0.20072624123275526
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of data-driven prediction models depends on the availability
of data samples for model training. A model that learns about dengue fever
incidence in a population uses historical data from that corresponding
location. Poor performance in prediction can result in places with inadequate
data. This work aims to enhance temporally limited dengue case data by
methodological addition of epidemically relevant data from nearby locations as
predictors (features). A novel framework is presented for windowing incidence
data and computing time-shifted correlation-based metrics to quantify feature
relevance. The framework ranks incidence data of adjacent locations around a
target location by combining the correlation metric with two other metrics:
spatial distance and local prevalence. Recurrent neural network-based
prediction models achieve up to 33.6% accuracy improvement on average using the
proposed method compared to using training data from the target location only.
These models achieved mean absolute error (MAE) values as low as 0.128 on [0,1]
normalized incidence data for a municipality with the highest dengue prevalence
in Brazil's Espirito Santo. When predicting cases aggregated over geographical
ecoregions, the models achieved accuracy improvements up to 16.5%, using only
6.5% of incidence data from ranked feature sets. The paper also includes two
techniques for windowing time series data: fixed-sized windows and outbreak
detection windows. Both of these techniques perform comparably, while the
window detection method uses less data for computations. The framework
presented in this paper is application-independent, and it could improve the
performances of prediction models where data from spatially adjacent locations
are available.
- Abstract(参考訳): データ駆動予測モデルの性能は、モデルトレーニングのためのデータサンプルの可用性に依存する。
人口のデング熱の発生率を学習するモデルでは、その場所から履歴データを使用している。
予測性能の低さは、不適切なデータを持つ場所につながる可能性がある。
本研究は,近接地からの流行関連データを予測者として方法論的に追加することにより,デングケースデータの時間的制限を強化することを目的としている(特徴)。
特徴の関連性を定量化するために、入出力データと時間シフト相関に基づくメトリクスのウィンドウ化のための新しいフレームワークが提示される。
このフレームワークは、相関メトリックと他の2つの指標、すなわち空間距離と局所的頻度を組み合わせることで、ターゲット位置周辺の隣接位置の入射データをランク付けする。
リカレントニューラルネットワークに基づく予測モデルは,目標位置のみからのトレーニングデータを使用する場合と比較して,提案手法を用いて平均33.6%の精度向上を実現している。
これらのモデルは,ブラジルのエスピリトサント州で最もデング頻度が高い自治体において,[0,1]正常化頻度データに対して平均絶対誤差(MAE)が0.128まで低かった。
地理的エコリージョンに集約されたケースを予測した場合、モデルの精度は16.5%まで向上し、ランク付けされた特徴集合からの入射データのわずか6.5%しか得られなかった。
また,固定サイズウィンドウとアウトブレイク検出ウィンドウの2つの時系列データのウィンドウ化手法についても検討した。
これらの手法は両立可能であり、ウィンドウ検出法は計算に少ないデータを使用する。
本論文はアプリケーションに依存しないフレームワークであり,空間的に隣接した位置からのデータが得られる予測モデルの性能を向上させることができる。
関連論文リスト
- Joint Prediction Regions for time-series models [0.0]
IIDデータの場合、JPR(Joint Prediction Region)の計算は容易である。
このプロジェクトは、JPRを構築するWolfとWunderliのメソッドを実装し、他のメソッドと比較することを目的としている。
論文 参考訳(メタデータ) (2024-05-14T02:38:49Z) - Spatial-temporal Forecasting for Regions without Observations [13.805203053973772]
本研究では,歴史的観察を伴わない関心領域の時空間予測について検討した。
タスクに対してSTSMというモデルを提案する。
私たちの重要な洞察は、関心のある領域に類似している場所から学ぶことです。
論文 参考訳(メタデータ) (2024-01-19T06:26:05Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Multi-time Predictions of Wildfire Grid Map using Remote Sensing Local
Data [0.0]
本稿では,米国西部の10か所で収集されたローカルデータをローカルエージェントで共有する分散学習フレームワークを提案する。
提案モデルには,動的オンライン推定や時系列モデリングなど,予測評価における特徴的ニーズに対処する特徴がある。
論文 参考訳(メタデータ) (2022-09-15T22:34:06Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Heterogeneous Data Fusion Considering Spatial Correlations using Graph
Convolutional Networks and its Application in Air Quality Prediction [4.9960351797442515]
本稿では, グラフ畳み込みネットワーク(GCN)を用いて, 複数のモニタリングポイントから収集した異種データを融合する深層学習手法を提案する。
大気質予測の適用シナリオでは,RBF法に基づく核融合法から得られた融解データが良好な整合性を実現することが観察された。
提案手法は,研究領域に散在する複数のモニタリングポイントから連続した異種データを収集するシナリオに適用できる。
論文 参考訳(メタデータ) (2021-05-24T15:57:31Z) - Predicting traffic signals on transportation networks using
spatio-temporal correlations on graphs [56.48498624951417]
本稿では,複数の熱拡散カーネルをデータ駆動予測モデルにマージして交通信号を予測する交通伝搬モデルを提案する。
予測誤差を最小限に抑えるためにベイズ推定を用いてモデルパラメータを最適化し,2つの手法の混合率を決定する。
提案モデルでは,計算労力の少ない最先端のディープニューラルネットワークに匹敵する予測精度を示す。
論文 参考訳(メタデータ) (2021-04-27T18:17:42Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z) - Mission-Aware Spatio-Temporal Deep Learning Model for UAS Instantaneous
Density Prediction [3.59465210252619]
制御されていない低高度空域での日々のsUAS活動の数は、数年のうちに数百万人に達すると予想されている。
深層学習に基づくUAS瞬時密度予測モデルを提案する。
論文 参考訳(メタデータ) (2020-03-22T02:40:28Z) - Parameter Space Factorization for Zero-Shot Learning across Tasks and
Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。
タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。
我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文 参考訳(メタデータ) (2020-01-30T16:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。