論文の概要: Influenza Surveillance using Search Engine, SNS, On-line Shopping, Q&A
Service and Past Flu Patients
- arxiv url: http://arxiv.org/abs/2104.06646v1
- Date: Wed, 14 Apr 2021 06:33:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 21:21:56.336293
- Title: Influenza Surveillance using Search Engine, SNS, On-line Shopping, Q&A
Service and Past Flu Patients
- Title(参考訳): 検索エンジン,SNS,オンラインショッピング,Q&Aサービス,過去のインフルエンザ患者を用いたインフルエンザサーベイランス
- Authors: Taichi Murayama, Nobuyuki Shimizu, Sumio Fujita, Shoko Wakamiya, Eiji
Aramaki
- Abstract要約: 我々は,過去のインフルエンザ患者,(2)SNS(Twitter),(3)検索エンジン(Yahoo!日本),(4)ショッピングサービス(Yahoo!ショッピング),(5)Q&Aサービス(Yahoo!Chieuro)の5つのオンラインデータリソースをリソースとして使っている。
実験の結果, 各種データ資源に基づくハマー回帰モデルが最も正確な結果が得られることがわかった。
- 参考スコア(独自算出の注目度): 7.500222253148924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Influenza, an infectious disease, causes many deaths worldwide. Predicting
influenza victims during epidemics is an important task for clinical, hospital,
and community outbreak preparation. On-line user-generated contents (UGC),
primarily in the form of social media posts or search query logs, are generally
used for prediction for reaction to sudden and unusual outbreaks. However, most
studies rely only on the UGC as their resource and do not use various UGCs. Our
study aims to solve these questions about Influenza prediction: Which model is
the best? What combination of multiple UGCs works well? What is the nature of
each UGC? We adapt some models, LASSO Regression, Huber Regression, Support
Vector Machine regression with Linear kernel (SVR) and Random Forest, to test
the influenza volume prediction in Japan during 2015 - 2018. For that, we use
on-line five data resources: (1) past flu patients, (2) SNS (Twitter), (3)
search engines (Yahoo! Japan), (4) shopping services (Yahoo! Shopping), and (5)
Q&A services (Yahoo! Chiebukuro) as resources of each model. We then validate
respective resources contributions using the best model, Huber Regression, with
all resources except one resource. Finally, we use Bayesian change point method
for ascertaining whether the trend of time series on any resources is reflected
in the trend of flu patient count or not. Our experiments show Huber Regression
model based on various data resources produces the most accurate results. Then,
from the change point analysis, we get the result that search query logs and
social media posts for three years represents these resources as a good
predictor. Conclusions: We show that Huber Regression based on various data
resources is strong for outliers and is suitable for the flu prediction.
Additionally, we indicate the characteristics of each resource for the flu
prediction.
- Abstract(参考訳): インフルエンザは感染症であり、世界中で多くの死を引き起こす。
インフルエンザの流行による犠牲者の予測は、臨床、病院、およびコミュニティのアウトブレイクの準備にとって重要な課題である。
オンラインユーザ生成コンテンツ(UGC)は、主にソーシャルメディア投稿や検索クエリログの形式で、突然および異常なアウトブレイクに対する反応を予測するために一般的に使用される。
しかし、ほとんどの研究はUGCのみを資源としており、様々なUGCを使用していない。
我々の研究は、インフルエンザの予測に関するこれらの疑問を解決することを目的としている。
複数のUGCの組み合わせは、うまく機能しますか?
それぞれのUGCの性質は何ですか?
我々は,2015~2018年の日本におけるインフルエンザ量予測に,LASSO回帰,Huber回帰,Linear kernel(SVR)とRandom Forestを用いたサポートベクトルマシン回帰などのモデルを適用した。
そこで我々は,(1)過去のインフルエンザ患者,(2)SNS(Twitter),(3)検索エンジン(Yahoo!日本),(4)ショッピングサービス(Yahoo!ショッピング),(5)Q&Aサービス(Yahoo!Chiebukuro)の5つのオンラインデータリソースを各モデルのリソースとして利用している。
そして、最高のモデルであるフーバー回帰(huber regression)を使用して、各リソースのコントリビュートを検証する。
最後に,ベイズ変化点法を用いて,インフルエンザ患者数に時系列の傾向が反映されているかどうかを確認する。
実験では,様々なデータ資源に基づくフーバー回帰モデルが最も正確な結果が得られることを示す。
そして,変化点分析の結果から,3年間の検索クエリログとソーシャルメディア投稿が,これらのリソースを優れた予測指標として表現していることがわかった。
結論: さまざまなデータリソースに基づくHuber Regressionは,アウトレーヤに強く,インフルエンザの予測に適していることを示す。
さらに,各資源の特性をインフルエンザ予知のために示す。
関連論文リスト
- Med-Flamingo: a Multimodal Medical Few-shot Learner [58.85676013818811]
医療領域に適応したマルチモーダル・数ショット学習者であるMed-Flamingoを提案する。
OpenFlamingo-9Bに基づいて、出版物や教科書からの医療画像テキストデータのペア化とインターリーブ化を継続する。
本研究は,医療用VQA(ジェネレーティブ医療用VQA)の最初の人間評価である。
論文 参考訳(メタデータ) (2023-07-27T20:36:02Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Transfer-Recursive-Ensemble Learning for Multi-Day COVID-19 Prediction
in India using Recurrent Neural Networks [8.452187000165491]
新型コロナウイルス(COVID-19)のパンデミックは、インドの医療インフラに大きな課題をもたらした。
本書は、新型コロナウイルスの新規感染者、新規死亡者、合計感染者の予知を数日前に行う。
論文 参考訳(メタデータ) (2021-08-20T11:56:15Z) - #StayHome or #Marathon? Social Media Enhanced Pandemic Surveillance on
Spatial-temporal Dynamic Graphs [23.67939019353524]
新型コロナウイルスは、公衆衛生、社会、経済のほぼすべての領域に永続的な被害をもたらしている。
既存の研究は、伝統的な統計モデルと流行拡散理論の集約に依存している。
我々は,抽出した出来事と関係に基づいて,ソーシャルメディアがパンデミックの知識を広める新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-08-08T15:46:05Z) - Predicting Zip Code-Level Vaccine Hesitancy in US Metropolitan Areas
Using Machine Learning Models on Public Tweets [10.45742327204133]
過去1年間に収集された公開Twitterデータを用いて,方法論と実験的検討を行った。
我々のゴールは、新しい機械学習アルゴリズムを考案することではなく、既存のモデルと確立されたモデルを比較フレームワークで評価することである。
論文 参考訳(メタデータ) (2021-08-03T18:43:46Z) - Can Self Reported Symptoms Predict Daily COVID-19 Cases? [12.029443053416399]
機械学習モデルを開発し、自己報告症状を用いてCOVID-19の流行を推定する。
その結果,グローバルモデルとは対照的に,局所モデルに対する誤差が低かった。
この研究は、オンラインプラットフォームを介して収集されたクラウドソースデータに基づいて開発されたモデルが、既存の疫学的監視インフラストラクチャを補完できることを示しています。
論文 参考訳(メタデータ) (2021-05-18T07:26:09Z) - Evaluating the performance of personal, social, health-related,
biomarker and genetic data for predicting an individuals future health using
machine learning: A longitudinal analysis [0.0]
この研究の目的は、個人、社会、健康関連、バイオマーカーおよび遺伝データの相対的貢献を個人における将来の健康の予測因子として識別するために機械学習アプローチを適用することである。
ニューラルネットワークによるディープラーニングとXGBoostという,予測モデル構築に2つの機械学習アプローチが使用された。
その結果、健康関連の指標が将来の健康状態を最も予測し、遺伝データが劣っていることがわかった。
論文 参考訳(メタデータ) (2021-04-26T12:31:40Z) - Predicting seasonal influenza using supermarket retail records [59.18952050885709]
我々は,スーパーマーケットの小売データを,センチネルバスケットの識別を通じてインフルエンザの代替信号とみなす。
SVR(Support Vector Regression)モデルを用いて、季節性インフルエンザ発生の予測を行います。
論文 参考訳(メタデータ) (2020-12-08T16:30:43Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Steering a Historical Disease Forecasting Model Under a Pandemic: Case
of Flu and COVID-19 [75.99038202534628]
我々は、インフルエンザとCOVID-19が共存する新しいシナリオに、歴史的疾患予測モデルを「操る」ことができる神経伝達学習アーキテクチャであるCALI-Netを提案する。
我々の実験は、現在のパンデミックに歴史的予測モデルを適用することに成功していることを示している。
論文 参考訳(メタデータ) (2020-09-23T22:35:43Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。