論文の概要: Forecasting COVID-19 Caseloads Using Unsupervised Embedding Clusters of
Social Media Posts
- arxiv url: http://arxiv.org/abs/2205.10408v1
- Date: Fri, 20 May 2022 18:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 19:19:00.177211
- Title: Forecasting COVID-19 Caseloads Using Unsupervised Embedding Clusters of
Social Media Posts
- Title(参考訳): ソーシャルメディア投稿の教師なし埋め込みクラスタを用いたcovid-19ケースロードの予測
- Authors: Felix Drinkall, Stefan Zohren and Janet B. Pierrehumbert
- Abstract要約: 本稿では,トランスフォーマーをベースとした言語モデルを感染症モデルに組み込んだ新しいアプローチを提案する。
他の高品質データセットから抽出した特徴に対して,これらのクラスタ化埋め込み機能をベンチマークする。
しきい値分類タスクでは、上向きトレンド信号の予測において、他の全ての特徴種よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 14.201816626446885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel approach incorporating transformer-based language models
into infectious disease modelling. Text-derived features are quantified by
tracking high-density clusters of sentence-level representations of Reddit
posts within specific US states' COVID-19 subreddits. We benchmark these
clustered embedding features against features extracted from other high-quality
datasets. In a threshold-classification task, we show that they outperform all
other feature types at predicting upward trend signals, a significant result
for infectious disease modelling in areas where epidemiological data is
unreliable. Subsequently, in a time-series forecasting task we fully utilise
the predictive power of the caseload and compare the relative strengths of
using different supplementary datasets as covariate feature sets in a
transformer-based time-series model.
- Abstract(参考訳): 本稿では,感染症モデルにトランスフォーマー言語モデルを組み込んだ新しい手法を提案する。
テキスト由来の機能は、特定の米国のCOVID-19サブレディット内のReddit投稿の文レベル表現の高密度クラスタを追跡することで定量化される。
他の高品質データセットから抽出した特徴に対して,これらのクラスタ化埋め込み機能をベンチマークする。
閾値分類タスクでは,上向きのトレンド信号の予測において他の特徴型を上回っており,疫学的データが信頼できない地域における感染症モデルの重要な結果である。
その後、時系列予測タスクにおいて、ケースロードの予測力をフル活用し、変圧器ベースの時系列モデルにおいて、異なる補足データセットを共変量特徴集合として使用する場合の相対強度を比較する。
関連論文リスト
- Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Forecast reconciliation for vaccine supply chain optimization [61.13962963550403]
ワクチンサプライチェーン最適化は階層的な時系列予測の恩恵を受けることができる。
異なる階層レベルの予測は、上位レベルの予測が下位レベルの予測の総和と一致しないときに不整合となる。
我々は2010年から2021年にかけてのGSKの販売データを階層的時系列としてモデル化し,ワクチン販売予測問題に取り組む。
論文 参考訳(メタデータ) (2023-05-02T14:34:34Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - VAESim: A probabilistic approach for self-supervised prototype discovery [0.23624125155742057]
条件付き変分オートエンコーダに基づく画像階層化アーキテクチャを提案する。
我々は、連続した潜伏空間を用いて障害の連続を表現し、訓練中にクラスターを見つけ、画像/患者の成層に使用することができる。
本手法は,標準VAEに対して,分類タスクで測定されたkNN精度において,ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-25T17:55:31Z) - Cancer Subtyping by Improved Transcriptomic Features Using Vector
Quantized Variational Autoencoder [10.835673227875615]
本稿では,Vector Quantized Variational AutoEncoder (VQ-VAE)を提案する。
VQ-VAEは厳密な仮定を課さないため、その潜在機能は入力のより良い表現であり、メインストリームのクラスタリング手法で優れたクラスタリング性能を得ることができる。
論文 参考訳(メタデータ) (2022-07-20T09:47:53Z) - Automatic Pharma News Categorization [0.0]
医薬情報科学に関連する23のニュースカテゴリからなるテキストデータセットを使用する。
分類タスクにおける複数変圧器モデルの微調整性能を比較した。
本稿では,最上位の個人予測器からなるアンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2021-12-28T08:42:16Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - STELAR: Spatio-temporal Tensor Factorization with Latent Epidemiological
Regularization [76.57716281104938]
我々は,多くの地域の流行傾向を同時に予測するテンソル法を開発した。
stelarは離散時間差分方程式のシステムを通じて潜在時間正規化を組み込むことで長期予測を可能にする。
我々は、カウンティレベルと州レベルのCOVID-19データの両方を用いて実験を行い、このモデルが流行の興味深い潜伏パターンを識別できることを示します。
論文 参考訳(メタデータ) (2020-12-08T21:21:47Z) - Examining Deep Learning Models with Multiple Data Sources for COVID-19
Forecasting [10.052302234274256]
COVID-19予測のためのディープラーニングモデルの設計と分析を行う。
新型コロナウイルス(COVID-19)や死亡例数などの複数のソースが、より良い予測のためにデータとテストデータを数えている。
時間的予測のためのクラスタリングに基づくトレーニングを提案する。
論文 参考訳(メタデータ) (2020-10-27T17:52:02Z) - DeepCOVIDNet: An Interpretable Deep Learning Model for Predictive
Surveillance of COVID-19 Using Heterogeneous Features and their Interactions [2.30238915794052]
今後の新型コロナウイルス感染者の増加範囲を予測するための深層学習モデルを提案する。
様々なソースから収集したデータを用いて、米国全郡で7日以内に感染が拡大する範囲を推定する。
論文 参考訳(メタデータ) (2020-07-31T23:37:38Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。