論文の概要: COVID-19 on YouTube: A Data-Driven Analysis of Sentiment, Toxicity, and Content Recommendations
- arxiv url: http://arxiv.org/abs/2412.17180v1
- Date: Sun, 22 Dec 2024 22:43:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 16:02:02.219446
- Title: COVID-19 on YouTube: A Data-Driven Analysis of Sentiment, Toxicity, and Content Recommendations
- Title(参考訳): YouTube上のCOVID-19: 知覚、毒性、コンテンツ推奨に関するデータ駆動分析
- Authors: Vanessa Su, Nirmalya Thakur,
- Abstract要約: 本研究は、YouTube上での新型コロナウイルスに関するデータ駆動分析である。
2023年1月から2024年10月までに公開されたビデオコンテンツの感情、毒性、テーマパターンを調べます。
関連性およびコンテキストに整合したビデオレコメンデーションを保証するためのレコメンデーションシステムを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This study presents a data-driven analysis of COVID-19 discourse on YouTube, examining the sentiment, toxicity, and thematic patterns of video content published between January 2023 and October 2024. The analysis involved applying advanced natural language processing (NLP) techniques: sentiment analysis with VADER, toxicity detection with Detoxify, and topic modeling using Latent Dirichlet Allocation (LDA). The sentiment analysis revealed that 49.32% of video descriptions were positive, 36.63% were neutral, and 14.05% were negative, indicating a generally informative and supportive tone in pandemic-related content. Toxicity analysis identified only 0.91% of content as toxic, suggesting minimal exposure to toxic content. Topic modeling revealed two main themes, with 66.74% of the videos covering general health information and pandemic-related impacts and 33.26% focused on news and real-time updates, highlighting the dual informational role of YouTube. A recommendation system was also developed using TF-IDF vectorization and cosine similarity, refined by sentiment, toxicity, and topic filters to ensure relevant and context-aligned video recommendations. This system achieved 69% aggregate coverage, with monthly coverage rates consistently above 85%, demonstrating robust performance and adaptability over time. Evaluation across recommendation sizes showed coverage reaching 69% for five video recommendations and 79% for ten video recommendations per video. In summary, this work presents a framework for understanding COVID-19 discourse on YouTube and a recommendation system that supports user engagement while promoting responsible and relevant content related to COVID-19.
- Abstract(参考訳): 本研究では、2023年1月から2024年10月までに公開されたビデオコンテンツの感情、毒性、テーマパターンを調査し、YouTube上のCOVID-19談話のデータ駆動分析を行った。
この分析は、VADERによる感情分析、Detoxifyによる毒性検出、Latent Dirichlet Allocation (LDA)を用いたトピックモデリングなど、高度な自然言語処理(NLP)技術を適用した。
感情分析の結果、ビデオの説明の49.32%が肯定的、36.63%が中立、14.05%が否定的であり、パンデミック関連コンテンツにおいて一般に情報的かつ支持的なトーンを示していることが明らかになった。
毒性分析では、毒性物質は0.91%しか認められておらず、毒性物質への曝露が最小限であることが示唆された。
トピックモデリングは2つの主要なテーマを明らかにし、ビデオの66.74%は一般的な健康情報とパンデミックに関連する影響をカバーし、33.26%はニュースとリアルタイムのアップデートに焦点を当て、YouTubeの二重情報の役割を強調した。
また、TF-IDFベクタライゼーションとコサイン類似性を用いて、感情、毒性、トピックフィルタによって洗練され、関連性および文脈に整合したビデオレコメンデーションが確保されるようにレコメンデーションシステムを開発した。
このシステムは総カバレッジの69%を達成し、毎月のカバレッジ率は85%を超え、時間の経過とともに堅牢なパフォーマンスと適応性を実証した。
レコメンデーションサイズの評価では、ビデオレコメンデーション5件で69%、ビデオレコメンデーション10件で79%に達した。
要約すると、この研究は、YouTube上の新型コロナウイルスの言論を理解するためのフレームワークと、ユーザーのエンゲージメントをサポートするレコメンデーションシステムを示し、同時に、COVID-19に関連する責任ある関連コンテンツを促進する。
関連論文リスト
- CineXDrama: Relevance Detection and Sentiment Analysis of Bangla YouTube Comments on Movie-Drama using Transformers: Insights from Interpretability Tool [0.0]
本稿では,まずコメントの関連性を評価し,関連するものに対する感情分析を行うシステムを提案する。
手作業で収集した14,000のコメントと前処理されたコメントのデータセットを導入し、関連性(関連性または非関連性)と感情(肯定的または否定的)に注釈を付ける。
論文 参考訳(メタデータ) (2024-11-10T18:04:41Z) - ToxVidLM: A Multimodal Framework for Toxicity Detection in Code-Mixed Videos [46.148023197749396]
ToxVidLMには、マルチモーダルモジュール、クロスモーダルシンクロナイゼーションモジュール、マルチタスクモジュールという3つの重要なモジュールが含まれている。
本稿では,YouTubeから収集した931の動画と4021のコード混成ヒンディー語発話からなるベンチマークデータセットを提案する。
論文 参考訳(メタデータ) (2024-05-31T05:40:56Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - UATVR: Uncertainty-Adaptive Text-Video Retrieval [90.8952122146241]
一般的なプラクティスは、テキストとビデオのペアを同じ埋め込みスペースに転送し、特定のエンティティとのクロスモーダルなインタラクションを構築することである。
UATVRと呼ばれる不確実性言語によるテキスト・ビデオ検索手法を提案し、各ルックアップを分布マッチング手順としてモデル化する。
論文 参考訳(メタデータ) (2023-01-16T08:43:17Z) - "Learn the Facts About COVID-19": Analyzing the Use of Warning Labels on
TikTok Videos [12.196005698116858]
我々は、TikTok上の警告ラベルの使用を分析し、COVID-19ビデオに焦点を当てる。
我々の分析によると、TikTokはTikTokビデオに警告ラベルを広く適用している。
より心配なのは、実際のコンテンツが新型コロナウイルスとは無関係なビデオに、新型コロナウイルスの警告ラベルが加わったことだ。
論文 参考訳(メタデータ) (2022-01-19T17:05:23Z) - The Report on China-Spain Joint Clinical Testing for Rapid COVID-19 Risk
Screening by Eye-region Manifestations [59.48245489413308]
携帯電話カメラで中国とスペインで撮影された視線領域の画像を用いて、新型コロナウイルスの早期スクリーニングモデルを開発し、テストした。
AUC, 感度, 特異性, 精度, F1。
論文 参考訳(メタデータ) (2021-09-18T02:28:01Z) - Global Tweet Mentions of COVID-19 [3.3043776328952226]
われわれは、2020年1月から現在まで毎週更新されている190万件のキーワード選択されたTwitter投稿のオープンソースデータセットを提示する。
ダッシュボードには、キーワードやハッシュタグを含むジオタグ付きツイートの100%が表示される。
新型コロナウイルスの新たな変種が出現する一方で、ワクチンの根絶と耐性が進行中であるため、このデータセットは研究者によって新型コロナウイルスのさまざまな側面を研究するために使われる可能性がある。
論文 参考訳(メタデータ) (2021-08-13T20:21:29Z) - Reliability of Content and Echo Chambers on YouTube during the COVID-19
Debate [0.0]
本稿では、YouTube上でのニュース消費を評価することで、新型コロナウイルスパンデミック時の情報拡散を調査することを目的とする。
我々は、政治的偏見とファクトチェックの指標でラベル付けされた68のYouTubeチャンネルがリリースした13,000本のビデオで、200万人以上のユーザーのエンゲージメントを分析した。
論文 参考訳(メタデータ) (2021-06-16T10:44:29Z) - COVIDx-US -- An open-access benchmark dataset of ultrasound imaging data
for AI-driven COVID-19 analytics [116.6248556979572]
COVIDx-USは、新型コロナウイルス関連超音波画像データのオープンアクセスベンチマークデータセットです。
肺超音波93本と,SARS-CoV-2肺炎,非SARS-CoV-2肺炎,健康管理症例10,774本からなる。
論文 参考訳(メタデータ) (2021-03-18T03:31:33Z) - Classification supporting COVID-19 diagnostics based on patient survey
data [82.41449972618423]
新型コロナウイルス患者の効果的なスクリーニングを可能にするロジスティック回帰とXGBoost分類器が作成された。
得られた分類モデルは、DECODEサービス(decode.polsl.pl)の基礎を提供し、COVID-19病患者のスクリーニング支援に役立てることができる。
このデータセットは、3,000以上のサンプルで構成されており、ポーランドの病院で収集されたアンケートに基づいている。
論文 参考訳(メタデータ) (2020-11-24T17:44:01Z) - Accelerating COVID-19 Differential Diagnosis with Explainable Ultrasound
Image Analysis [7.471424290647929]
われわれは106本のビデオからなる新型コロナウイルスの肺超音波(US)データセットを公開している。
我々は、フレームベースの畳み込みニューラルネットワークを提案し、COVID-19 USビデオの感度0.98+0.04、特異度0.91+-08で正しく分類する。
論文 参考訳(メタデータ) (2020-09-13T23:52:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。