論文の概要: Modeling and Forecasting COVID-19 Cases using Latent Subpopulations
- arxiv url: http://arxiv.org/abs/2302.04829v1
- Date: Thu, 9 Feb 2023 18:33:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 14:50:23.921754
- Title: Modeling and Forecasting COVID-19 Cases using Latent Subpopulations
- Title(参考訳): 潜在集団を用いたcovid-19症例のモデル化と予測
- Authors: Roberto Vega, Zehra Shah, Pouria Ramazi, Russell Greiner
- Abstract要約: 新型コロナウイルス感染者数を時間とともにモデル化する2つの新しい方法を提案する。
メソッド#1は辞書ベースのアプローチであり、多くの事前定義されたサブポピュレーションモデルから始まる。
メソッド#2はM$の混合可能な曲線であり、M$、使用するサブポピュレーションの数である$M$は、ユーザによって与えられる。
- 参考スコア(独自算出の注目度): 8.69240208462227
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classical epidemiological models assume homogeneous populations. There have
been important extensions to model heterogeneous populations, when the identity
of the sub-populations is known, such as age group or geographical location.
Here, we propose two new methods to model the number of people infected with
COVID-19 over time, each as a linear combination of latent sub-populations --
i.e., when we do not know which person is in which sub-population, and the only
available observations are the aggregates across all sub-populations. Method #1
is a dictionary-based approach, which begins with a large number of pre-defined
sub-population models (each with its own starting time, shape, etc), then
determines the (positive) weight of small (learned) number of sub-populations.
Method #2 is a mixture-of-$M$ fittable curves, where $M$, the number of
sub-populations to use, is given by the user. Both methods are compatible with
any parametric model; here we demonstrate their use with first (a)~Gaussian
curves and then (b)~SIR trajectories. We empirically show the performance of
the proposed methods, first in (i) modeling the observed data and then in (ii)
forecasting the number of infected people 1 to 4 weeks in advance. Across 187
countries, we show that the dictionary approach had the lowest mean absolute
percentage error and also the lowest variance when compared with classical SIR
models and moreover, it was a strong baseline that outperforms many of the
models developed for COVID-19 forecasting.
- Abstract(参考訳): 古典的疫学モデルは同種集団を仮定する。
年齢層や地理的位置などのサブ人口の同一性が知られている場合、異種個体群をモデル化するための重要な拡張がなされている。
そこで本研究では,潜伏するサブ人口の線形結合として,時間とともに感染する人の数をモデル化する2つの新しい手法を提案する。
メソッド#1は辞書ベースのアプローチで、事前定義された多数のサブ人口モデル(それぞれが独自の開始時間、形状などを持つ)から始まり、小さな(リードされた)サブ人口の(正の)重量を決定する。
メソッド #2 は$m$ の混合可能な曲線で、使用すべきサブ人口の数である $m$ がユーザによって与えられる。
どちらの手法も任意のパラメトリックモデルと互換性がある。
(a)-ガウス曲線、それから
(b)~SIR軌道
まず,提案手法の性能を実証的に示す。
(i)観測データをモデル化し、それから、
(二)事前に1〜4週間の感染者数を予測すること。
187か国で,従来のSIRモデルと比較した場合,辞書のアプローチは平均絶対誤差が最低であり,また,従来のSIRモデルよりも低分散であり,また,新型コロナウイルスの予測のために開発されたモデルの多くを上回り,強力なベースラインであった。
関連論文リスト
- Heterogeneous Peer Effects in the Linear Threshold Model [13.452510519858995]
線形閾値モデル(Linear Threshold Model)は、ソーシャルネットワークを通じて情報がどのように拡散するかを記述する。
本研究では,個々の閾値を推定するための因果推論手法を提案する。
合成および実世界のデータセットに対する実験結果から、線形閾値モデルにおける個々のレベルの閾値をより正確に予測できることが示唆された。
論文 参考訳(メタデータ) (2022-01-27T00:23:26Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Loss function based second-order Jensen inequality and its application
to particle variational inference [112.58907653042317]
粒子変分推論(PVI)は、後部分布の実験的近似としてモデルのアンサンブルを用いる。
PVIは、最適化されたモデルの多様性を保証するために、各モデルを反発力で反復的に更新する。
我々は,新たな一般化誤差を導出し,モデルの多様性を高めて低減できることを示す。
論文 参考訳(メタデータ) (2021-06-09T12:13:51Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Model-based metrics: Sample-efficient estimates of predictive model
subpopulation performance [11.994417027132807]
健康状態の表示、診断、予測のために現在一般的に開発されている機械学習モデル$-$は、様々なパフォーマンス指標で評価される。
サブ集団のパフォーマンスメトリクスは、通常、そのサブグループのデータのみを使用して計算されるため、より小さなグループに対する分散推定が高くなる。
本稿では,予測モデルスコアの条件分布を記述した評価モデル$-$を用いて,モデルベース計量(MBM)の推定値を生成する。
論文 参考訳(メタデータ) (2021-04-25T19:06:34Z) - STELAR: Spatio-temporal Tensor Factorization with Latent Epidemiological
Regularization [76.57716281104938]
我々は,多くの地域の流行傾向を同時に予測するテンソル法を開発した。
stelarは離散時間差分方程式のシステムを通じて潜在時間正規化を組み込むことで長期予測を可能にする。
我々は、カウンティレベルと州レベルのCOVID-19データの両方を用いて実験を行い、このモデルが流行の興味深い潜伏パターンを識別できることを示します。
論文 参考訳(メタデータ) (2020-12-08T21:21:47Z) - Binary Classification of Gaussian Mixtures: Abundance of Support
Vectors, Benign Overfitting and Regularization [39.35822033674126]
生成ガウス混合モデルに基づく二項線形分類について検討する。
後者の分類誤差に関する新しい非漸近境界を導出する。
この結果は, 確率が一定である雑音モデルに拡張される。
論文 参考訳(メタデータ) (2020-11-18T07:59:55Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Inference in Stochastic Epidemic Models via Multinomial Approximations [2.28438857884398]
疫病モデルに新しい推論法を導入する。
この方法は離散時間有限人口構成モデルのクラスに適用できる。
本手法は,中国武漢で発生した新型コロナウイルスの再現数の経時変化を推定するために,シークエンシャルモンテカルロ法に組み込むことができることを示す。
論文 参考訳(メタデータ) (2020-06-24T13:08:56Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。