論文の概要: COVIDHealth: A Benchmark Twitter Dataset and Machine Learning based Web
Application for Classifying COVID-19 Discussions
- arxiv url: http://arxiv.org/abs/2402.09897v1
- Date: Thu, 15 Feb 2024 11:45:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-16 15:50:03.281808
- Title: COVIDHealth: A Benchmark Twitter Dataset and Machine Learning based Web
Application for Classifying COVID-19 Discussions
- Title(参考訳): COVIDHealth: COVID-19の議論を分類するためのベンチマークTwitterデータセットと機械学習ベースのWebアプリケーション
- Authors: Mahathir Mohammad Bishal, Md. Rakibul Hassan Chowdory, Anik Das,
Muhammad Ashad Kabir
- Abstract要約: 新型コロナウイルス関連のTwitterデータをラベル付けし、ベンチマーク分類結果を提供し、Webアプリケーションを開発する。
様々な特徴抽出法を用いて特徴を抽出し、7種類の従来の機械学習アルゴリズムに適用した。
線形SVCアルゴリズムは86.13%のF1スコアを示し、他の伝統的な機械学習手法を上回った。
- 参考スコア(独自算出の注目度): 1.4018975578160688
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The COVID-19 pandemic has had adverse effects on both physical and mental
health. During this pandemic, numerous studies have focused on gaining insights
into health-related perspectives from social media. In this study, our primary
objective is to develop a machine learning-based web application for
automatically classifying COVID-19-related discussions on social media. To
achieve this, we label COVID-19-related Twitter data, provide benchmark
classification results, and develop a web application. We collected data using
the Twitter API and labeled a total of 6,667 tweets into five different
classes: health risks, prevention, symptoms, transmission, and treatment. We
extracted features using various feature extraction methods and applied them to
seven different traditional machine learning algorithms, including Decision
Tree, Random Forest, Stochastic Gradient Descent, Adaboost, K-Nearest
Neighbour, Logistic Regression, and Linear SVC. Additionally, we used four deep
learning algorithms: LSTM, CNN, RNN, and BERT, for classification. Overall, we
achieved a maximum F1 score of 90.43% with the CNN algorithm in deep learning.
The Linear SVC algorithm exhibited the highest F1 score at 86.13%, surpassing
other traditional machine learning approaches. Our study not only contributes
to the field of health-related data analysis but also provides a valuable
resource in the form of a web-based tool for efficient data classification,
which can aid in addressing public health challenges and increasing awareness
during pandemics. We made the dataset and application publicly available, which
can be downloaded from this link
https://github.com/Bishal16/COVID19-Health-Related-Data-Classification-Website.
- Abstract(参考訳): 新型コロナウイルス(covid-19)のパンデミックは、身体と精神の健康に悪影響を及ぼしている。
このパンデミックの間、ソーシャルメディアから健康関連の観点からの洞察を得ることに多くの研究が焦点を当ててきた。
本研究の目的は,ソーシャルメディア上でcovid-19関連の議論を自動的に分類する機械学習ベースのwebアプリケーションを開発することである。
これを実現するために、COVID-19関連Twitterデータをラベル付けし、ベンチマーク分類結果を提供し、Webアプリケーションを開発する。
われわれはTwitter APIを使ってデータを収集し、合計6,667のツイートを健康リスク、予防、症状、伝達、治療の5つのクラスに分類した。
様々な特徴抽出手法を用いて特徴を抽出し, 決定木, ランダムフォレスト, 確率勾配Descent, Adaboost, K-Nearest Neighbour, Logistic Regression, 線形SVCなど, 従来の7種類の機械学習アルゴリズムに適用した。
さらに,LSTM,CNN,RNN,BERTの4つのディープラーニングアルゴリズムを用いて分類を行った。
総じて,深層学習におけるcnnアルゴリズムによる最大f1スコアの90.43%を達成した。
線形SVCアルゴリズムは86.13%のF1スコアを示し、他の伝統的な機械学習手法を上回った。
本研究は,健康関連データ分析の分野に貢献するだけでなく,公衆衛生問題への対処やパンデミック時の意識向上に役立つ,効率的なデータ分類のためのWebベースのツールとして,貴重なリソースを提供する。
データセットとアプリケーションは、このリンクからダウンロードできる。https://github.com/Bishal16/COVID19-Health-Related-Data-Classification-Website。
関連論文リスト
- Deep Feature Learning for Medical Acoustics [78.56998585396421]
本研究の目的は,医療音響の課題における学習内容の比較である。
ヒトの呼吸音と心臓の鼓動を健康的または病態の影響の2つのカテゴリに分類する枠組みが実装されている。
論文 参考訳(メタデータ) (2022-08-05T10:39:37Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Checkovid: A COVID-19 misinformation detection system on Twitter using
network and content mining perspectives [9.69596041242667]
新型コロナウイルス(COVID-19)パンデミックの間、ソーシャルメディアプラットフォームは社会的孤立と隔離のためにコミュニケーションするのに理想的だった。
この問題に対処するため、Twitterに2つのCOVID-19関連誤情報データセットを提示する。
機械学習アルゴリズムとNLP技術に基づくネットワークベースおよびコンテンツベースプロセスからなる誤情報検出システムを提案する。
論文 参考訳(メタデータ) (2021-07-20T20:58:23Z) - Explainable Multi-class Classification of the CAMH COVID-19 Mental
Health Data [0.9137554315375922]
本稿では,Covid-19のメンタルヘルスデータの多クラス分類について述べる。
機械学習研究では、コビッドウイルスのパンデミックにおいて、個人のメンタルヘルスに影響を与える潜在的な要因を見つけることを目的としている。
論文 参考訳(メタデータ) (2021-05-27T20:08:58Z) - Designing ECG Monitoring Healthcare System with Federated Transfer
Learning and Explainable AI [4.694126527114577]
我々は、ECGベースの医療アプリケーションのための連合環境で、新しい説明可能な人工知能(XAI)ベースのディープラーニングフレームワークを設計する。
提案したフレームワークは、MIT-BIH Arrhythmiaデータベースを使用してトレーニングされ、テストされた。
論文 参考訳(メタデータ) (2021-05-26T11:59:44Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Explainable Multi-class Classification of Medical Data [0.9137554315375922]
大規模医療データセットの多クラス分類について解説する。
この研究では、SVM(Support Vector Machine)、Na"ive Bayes、Gradient Boosting、Decision Trees、Random Forest、Logistic Regressionの6つのアルゴリズムが使用されている。
本研究では,23の薬物機能を用いて6つの応用学習アルゴリズムのうち5つのリコールを改善することを示した。
論文 参考訳(メタデータ) (2020-12-26T18:56:07Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。