論文の概要: Curse of Small Sample Size in Forecasting of the Active Cases in
COVID-19 Outbreak
- arxiv url: http://arxiv.org/abs/2011.03628v2
- Date: Thu, 26 Nov 2020 09:23:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 04:33:56.355864
- Title: Curse of Small Sample Size in Forecasting of the Active Cases in
COVID-19 Outbreak
- Title(参考訳): 新型コロナウイルス(covid-19)感染活動例の予測における小標本サイズの呪い
- Authors: Mert Nak{\i}p, Onur \c{C}opur, C\"uneyt G\"uzeli\c{s}
- Abstract要約: 新型コロナウイルス(COVID-19)のパンデミックでは、感染者数や今後の流行を予想する試みが多数行われている。
しかし、信頼性の高い方法では、新型コロナウイルス(COVID-19)の根本的特徴の中期的・長期的進化を許容できる精度で予測することができない。
本稿では,この予測問題における機械学習モデルの故障について説明する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: During the COVID-19 pandemic, a massive number of attempts on the predictions
of the number of cases and the other future trends of this pandemic have been
made. However, they fail to predict, in a reliable way, the medium and long
term evolution of fundamental features of COVID-19 outbreak within acceptable
accuracy. This paper gives an explanation for the failure of machine learning
models in this particular forecasting problem. The paper shows that simple
linear regression models provide high prediction accuracy values reliably but
only for a 2-weeks period and that relatively complex machine learning models,
which have the potential of learning long term predictions with low errors,
cannot achieve to obtain good predictions with possessing a high generalization
ability. It is suggested in the paper that the lack of a sufficient number of
samples is the source of low prediction performance of the forecasting models.
The reliability of the forecasting results about the active cases is measured
in terms of the cross-validation prediction errors, which are used as
expectations for the generalization errors of the forecasters. To exploit the
information, which is of most relevant with the active cases, we perform
feature selection over a variety of variables. We apply different feature
selection methods, namely the Pairwise Correlation, Recursive Feature
Selection, and feature selection by using the Lasso regression and compare them
to each other and also with the models not employing any feature selection.
Furthermore, we compare Linear Regression, Multi-Layer Perceptron, and
Long-Short Term Memory models each of which is used for prediction active cases
together with the mentioned feature selection methods. Our results show that
the accurate forecasting of the active cases with high generalization ability
is possible up to 3 days only because of the small sample size of COVID-19
data.
- Abstract(参考訳): 新型コロナウイルス(covid-19)パンデミックの間、このパンデミックの感染者数とその他の将来の傾向を予測するために、膨大な数の試みが行われてきた。
しかし、信頼性の高い方法では、新型コロナウイルスのアウトブレイクの基本的な特徴の中長期的な進化を許容できる精度で予測できない。
本稿では,この予測問題における機械学習モデルの故障について説明する。
本稿では, 線形回帰モデルにより, 2週間の期間にのみ高い予測精度が得られたが, 比較的複雑な機械学習モデルでは, 低誤差で長期予測を学習する可能性があり, 高い一般化能力を有するような予測が得られないことを示す。
本論文では,十分なサンプル数の不足が予測モデルの予測性能の低下の原因であることを示唆している。
有効事例に関する予測結果の信頼性は、予測者の一般化誤差に対する期待値として使用されるクロスバリデーション予測誤差の観点から測定する。
アクティブなケースと最も関連性の高い情報を活用するために,様々な変数に対して特徴選択を行う。
特徴選択法として,ラッソ回帰を用いて特徴選択法,再帰的特徴選択法,特徴選択法をそれぞれ適用し,特徴選択を行わないモデルと比較した。
さらに, 線形回帰, 多重層知覚, 長短項記憶モデルを比較し, 上記の特徴選択法と合わせて, アクティブケースの予測に用いている。
以上の結果から,covid-19データのサンプルサイズが小さければ3日以内で,高い汎化能を有する能動的症例の正確な予測が可能であることが示された。
関連論文リスト
- An Experimental Study on the Rashomon Effect of Balancing Methods in Imbalanced Classification [0.0]
本稿では,ラショモン効果を用いた予測多重度に及ぼすバランス法の影響について検討する。
データ中心のAIにおける盲点モデル選択は、ほぼ同じ精度のモデルのセットからリスクが高いため、非常に重要です。
論文 参考訳(メタデータ) (2024-03-22T13:08:22Z) - Predictive Churn with the Set of Good Models [64.05949860750235]
近似機械学習モデルの集合に対する競合予測の効果について検討する。
ラーショモン集合内のモデル間の係り受けに関する理論的結果を示す。
当社のアプローチは、コンシューマ向けアプリケーションにおいて、より予測し、削減し、混乱を避けるためにどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Random features models: a way to study the success of naive imputation [0.0]
これは、欠落したデータを扱うための最初の使い易いテクニックである。
最近の研究は、このバイアスが高次元線形予測器の文脈で低いことを示唆している。
本稿は, 偏見が無視可能であり, 意外なナイーブな計算も極めて低次元で関連している,という直感を裏付けるものである。
論文 参考訳(メタデータ) (2024-02-06T09:37:06Z) - Learning Sample Difficulty from Pre-trained Models for Reliable
Prediction [55.77136037458667]
本稿では,大規模事前学習モデルを用いて,サンプル難易度を考慮したエントロピー正規化による下流モデルトレーニングを指導する。
我々は、挑戦的なベンチマークで精度と不確実性の校正を同時に改善する。
論文 参考訳(メタデータ) (2023-04-20T07:29:23Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Robust self-healing prediction model for high dimensional data [0.685316573653194]
本研究は、ロバスト自己治癒(RSH)ハイブリッド予測モデルを提案する。
それは、データを捨てるのではなく、エラーや不整合を取り除くことによって、データ全体を活用することによって機能する。
提案手法は,既存のハイパフォーマンスモデルと比較し,解析を行った。
論文 参考訳(メタデータ) (2022-10-04T17:55:50Z) - Predictive Multiplicity in Probabilistic Classification [25.111463701666864]
確率的分類における予測的乗数性を測定するための枠組みを提案する。
実世界のタスクにおける予測多重度の発生頻度と頻度を実証する。
その結果,予測多重度をより広範囲に報告する必要性が強調された。
論文 参考訳(メタデータ) (2022-06-02T16:25:29Z) - Pathologies of Pre-trained Language Models in Few-shot Fine-tuning [50.3686606679048]
実例が少ない事前学習言語モデルはラベル間に強い予測バイアスを示すことを示す。
わずかな微調整で予測バイアスを軽減できるが,本分析では,非タスク関連の特徴を捉えることで,モデルの性能向上を図っている。
これらの観察は、より少ない例でモデルのパフォーマンスを追求することは、病理学的予測行動を引き起こす可能性があることを警告する。
論文 参考訳(メタデータ) (2022-04-17T15:55:18Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。