論文の概要: Flusion: Integrating multiple data sources for accurate influenza predictions
- arxiv url: http://arxiv.org/abs/2407.19054v1
- Date: Fri, 26 Jul 2024 19:24:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 20:02:28.879892
- Title: Flusion: Integrating multiple data sources for accurate influenza predictions
- Title(参考訳): Flusion: 正確なインフルエンザ予測のための複数のデータソースの統合
- Authors: Evan L. Ray, Yijin Wang, Russell D. Wolfinger, Nicholas G. Reich,
- Abstract要約: アメリカ疾病予防管理センター(CDC)は毎年インフルエンザの予測課題を組織している。
我々のモデルであるFlusionは、量子レグレッションモデルとベイズ自己回帰モデルを組み合わせたアンサンブルである。
フラクションは、2023/24シーズンにおけるCDCのインフルエンザ予測における最高パフォーマンスモデルであった。
- 参考スコア(独自算出の注目度): 0.24999074238880484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the last ten years, the US Centers for Disease Control and Prevention (CDC) has organized an annual influenza forecasting challenge with the motivation that accurate probabilistic forecasts could improve situational awareness and yield more effective public health actions. Starting with the 2021/22 influenza season, the forecasting targets for this challenge have been based on hospital admissions reported in the CDC's National Healthcare Safety Network (NHSN) surveillance system. Reporting of influenza hospital admissions through NHSN began within the last few years, and as such only a limited amount of historical data are available for this signal. To produce forecasts in the presence of limited data for the target surveillance system, we augmented these data with two signals that have a longer historical record: 1) ILI+, which estimates the proportion of outpatient doctor visits where the patient has influenza; and 2) rates of laboratory-confirmed influenza hospitalizations at a selected set of healthcare facilities. Our model, Flusion, is an ensemble that combines gradient boosting quantile regression models with a Bayesian autoregressive model. The gradient boosting models were trained on all three data signals, while the autoregressive model was trained on only the target signal; all models were trained jointly on data for multiple locations. Flusion was the top-performing model in the CDC's influenza prediction challenge for the 2023/24 season. In this article we investigate the factors contributing to Flusion's success, and we find that its strong performance was primarily driven by the use of a gradient boosting model that was trained jointly on data from multiple surveillance signals and locations. These results indicate the value of sharing information across locations and surveillance signals, especially when doing so adds to the pool of available training data.
- Abstract(参考訳): 過去10年間、アメリカ疾病予防管理センター(CDC)は、正確な確率的予測が状況認識を改善し、より効果的な公衆衛生行動をもたらすという動機から、毎年インフルエンザの予測課題を組織してきた。
2021/22インフルエンザシーズン以降、この課題の予測対象はCDCのNHSN(National Healthcare Safety Network)監視システムで報告された病院の入院に基づく。
NHSNによるインフルエンザ病院入院の報告は、ここ数年のうちに始まり、この信号には限られた史料しか残っていない。
対象監視システムに限られたデータが存在する場合の予測を行うため、より長い歴史記録を持つ2つの信号でこれらのデータを拡張した。
1) ILI+は、外来の医師がインフルエンザに罹患した場所を訪問する割合を推定し、
2) 特定医療施設におけるインフルエンザ入院率について検討した。
我々のモデルであるFlusionは、量子レグレッションモデルの勾配をベイズ自己回帰モデルと組み合わせたアンサンブルである。
勾配促進モデルは3つのデータ信号全てで訓練され、自己回帰モデルは目標信号のみで訓練され、全てのモデルは複数の場所のデータで共同訓練された。
フラクションは、2023/24シーズンにおけるCDCのインフルエンザ予測における最高パフォーマンスモデルであった。
本稿では,Flusionの成功に寄与する要因について検討し,その強力な性能は,複数の監視信号や位置からのデータを共同でトレーニングした勾配押し上げモデルを使用することによってもたらされたことが確認された。
これらの結果は、位置情報と監視信号間で情報を共有することの価値を示している。
関連論文リスト
- Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Predicting COVID-19 Spread from Large-Scale Mobility Data [22.55034017418318]
将来のケースナンバーのほぼリアルタイム予測には、人間の移動性がある。
本稿では,モビリティマークホークスモデルと呼ばれる,モビリティデータに基づく流行予測の新しいモデルを提案する。
私たちの研究は、通信データから新型コロナウイルスの感染拡大を予測する最初のものです。
論文 参考訳(メタデータ) (2021-06-01T10:05:02Z) - EventScore: An Automated Real-time Early Warning Score for Clinical
Events [3.3039612529376625]
臨床劣化を示す各種臨床事象の早期予測のための解釈可能なモデルを構築した。
このモデルは2つのデータセットと4つの臨床イベントで評価される。
私達のモデルは手動で記録された特徴を要求しないで完全に自動化することができます。
論文 参考訳(メタデータ) (2021-02-11T11:55:08Z) - Deep learning via LSTM models for COVID-19 infection forecasting in
India [13.163271874039191]
卓越した計算モデルと数学的モデルは、感染の拡散の複雑さのために信頼性が低い。
リカレントニューラルネットワークのようなディープラーニングモデルは、時間的シーケンスをモデル化するのに適している。
感染率の面では、新型コロナウイルスのホットポットを持つ州を選択し、感染の有無やピークに達した州と比較する。
以上の結果から,他の国や地域での手法の適用を動機づける長期予測が期待されていることが示唆された。
論文 参考訳(メタデータ) (2021-01-28T09:19:10Z) - Predicting seasonal influenza using supermarket retail records [59.18952050885709]
我々は,スーパーマーケットの小売データを,センチネルバスケットの識別を通じてインフルエンザの代替信号とみなす。
SVR(Support Vector Regression)モデルを用いて、季節性インフルエンザ発生の予測を行います。
論文 参考訳(メタデータ) (2020-12-08T16:30:43Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Steering a Historical Disease Forecasting Model Under a Pandemic: Case
of Flu and COVID-19 [75.99038202534628]
我々は、インフルエンザとCOVID-19が共存する新しいシナリオに、歴史的疾患予測モデルを「操る」ことができる神経伝達学習アーキテクチャであるCALI-Netを提案する。
我々の実験は、現在のパンデミックに歴史的予測モデルを適用することに成功していることを示している。
論文 参考訳(メタデータ) (2020-09-23T22:35:43Z) - Privacy-Preserving Technology to Help Millions of People: Federated
Prediction Model for Stroke Prevention [25.276264953982253]
私たちの科学者とエンジニアは、ストロークのリスクを予測し、当社の連合予測モデルをクラウドサーバにデプロイするプライバシー保護スキームを提案しています。
我々のモデルは、特定の都市の病院から、実際のデータを共有することなく、すべての医療データをトレーニングします。
特に脳卒中例が少ない小さな病院では,いくつかの機械学習指標でフェデレーションモデルによりモデル性能が10%向上する。
論文 参考訳(メタデータ) (2020-06-15T08:51:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。