論文の概要: Five Years of COVID-19 Discourse on Instagram: A Labeled Instagram Dataset of Over Half a Million Posts for Multilingual Sentiment Analysis
- arxiv url: http://arxiv.org/abs/2410.03293v2
- Date: Wed, 16 Oct 2024 14:11:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 23:18:35.976529
- Title: Five Years of COVID-19 Discourse on Instagram: A Labeled Instagram Dataset of Over Half a Million Posts for Multilingual Sentiment Analysis
- Title(参考訳): Instagram上での新型コロナウイルスに関する5年間の議論: 多言語知覚分析のための50万以上の投稿のInstagramデータセット
- Authors: Nirmalya Thakur,
- Abstract要約: 本稿では、2020年1月から2024年9月までに発行された新型コロナウイルスに関する500,153件のInstagram投稿の多言語データセットを示す。
第二に、2020年から2024年にかけての感情分析の結果を示す。
第3に,言語固有の感情分析の知見も提示する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The work presented in this paper makes three scientific contributions with a specific focus on mining and analysis of COVID-19-related posts on Instagram. First, it presents a multilingual dataset of 500,153 Instagram posts about COVID-19 published between January 2020 and September 2024. This dataset, available at https://dx.doi.org/10.21227/d46p-v480, contains Instagram posts in 161 different languages as well as 535,021 distinct hashtags. After the development of this dataset, multilingual sentiment analysis was performed, which involved classifying each post as positive, negative, or neutral. The results of sentiment analysis are presented as a separate attribute in this dataset. Second, it presents the results of performing sentiment analysis per year from 2020 to 2024. The findings revealed the trends in sentiment related to COVID-19 on Instagram since the beginning of the pandemic. For instance, between 2020 and 2024, the sentiment trends show a notable shift, with positive sentiment decreasing from 38.35% to 28.69%, while neutral sentiment rising from 44.19% to 58.34%. Finally, the paper also presents findings of language-specific sentiment analysis. This analysis highlighted similar and contrasting trends of sentiment across posts published in different languages on Instagram. For instance, out of all English posts, 49.68% were positive, 14.84% were negative, and 35.48% were neutral. In contrast, among Hindi posts, 4.40% were positive, 57.04% were negative, and 38.56% were neutral, reflecting distinct differences in the sentiment distribution between these two languages.
- Abstract(参考訳): 本稿では,Instagram上での新型コロナウイルス関連投稿のマイニングと分析に焦点を当てた3つの科学的コントリビューションについて述べる。
まず、2020年1月から2024年9月までに発行された新型コロナウイルスに関する500,153件のInstagram投稿の多言語データセットを提示する。
このデータセットはhttps://dx.doi.org/10.21227/d46p-v480で利用可能で、161の異なる言語でInstagramの投稿と535,021のハッシュタグを含んでいる。
このデータセットの開発後、多言語感情分析が行われ、各ポストを肯定的、否定的、中立的なものに分類した。
このデータセットでは、感情分析の結果が別の属性として示される。
第二に、2020年から2024年にかけての感情分析の結果を示す。
パンデミックの開始以来、Instagram上での新型コロナウイルス関連感情の傾向が明らかになった。
例えば、2020年から2024年の間、感情傾向は顕著な変化を示し、肯定的な感情は38.35%から28.69%に減少し、中立的な感情は44.19%から58.34%に増加した。
最後に,言語固有の感情分析の知見も提示する。
この分析は、Instagram上のさまざまな言語で投稿された投稿にまたがって、同様の、対照的な感情傾向を浮き彫りにした。
例えば、全英語投稿のうち49.68%が肯定的、14.84%が否定的、35.48%が中立的だった。
対照的にヒンディー語の投稿では4.40%が肯定的、57.04%が否定的、38.56%が中立的であり、この2つの言語間の感情分布の違いを反映している。
関連論文リスト
- You Shall Know a Tool by the Traces it Leaves: The Predictability of Sentiment Analysis Tools [74.98850427240464]
感情分析ツールが同じデータセットで一致しないことを示す。
感傷的アノテーションに使用される感情ツールは,その結果から予測できることを示す。
論文 参考訳(メタデータ) (2024-10-18T17:27:38Z) - Mpox Narrative on Instagram: A Labeled Multilingual Dataset of Instagram Posts on Mpox for Sentiment, Hate Speech, and Anxiety Analysis [0.0]
WHOは、世界保健機関(WHO)の国際的懸念の公衆衛生非常事態を宣言している。
ソーシャルメディアのマイニングに関する以前の研究は、mpoxのアウトブレイクに関するInstagram投稿のデータセットの開発に重点を置いていなかった。
本稿では,2022年7月23日から2024年9月5日までに発行されたmpoxに関する60,127件のInstagram投稿の多言語データセットについて述べる。
論文 参考訳(メタデータ) (2024-09-09T03:00:53Z) - A Labelled Dataset for Sentiment Analysis of Videos on YouTube, TikTok, and Other Sources about the 2024 Outbreak of Measles [0.0]
本稿では2024年1月1日から5月31日までに264のウェブサイトで公表された麻疹の流行に関する4011件のビデオデータを含むデータセットを提案する。
YouTubeとTikTokはそれぞれ48.6%と15.2%を占めている。
これらのビデオのそれぞれについて、ビデオのURL、投稿のタイトル、投稿の説明、およびビデオの公開日をデータセット内の別の属性として提示する。
論文 参考訳(メタデータ) (2024-06-11T20:14:22Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - Exploring Cross-Cultural Differences in English Hate Speech Annotations: From Dataset Construction to Analysis [44.17106903728264]
ほとんどのヘイトスピーチデータセットは、単一の言語における文化的多様性を無視している。
そこで本研究では,CRoss文化の英語Hate音声データセットであるCREHateを紹介する。
CREHateのポストの56.2%のみが全国でコンセンサスを達成しており、ペアのラベル差が最も高いのは26%である。
論文 参考訳(メタデータ) (2023-08-31T13:14:47Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Extracting Feelings of People Regarding COVID-19 by Social Network
Mining [0.0]
英語における新型コロナウイルス関連ツイートのデータセットが収集される。
2020年3月23日から6月23日までに200万件以上のツイートが分析されている。
論文 参考訳(メタデータ) (2021-10-12T16:45:33Z) - Country Image in COVID-19 Pandemic: A Case Study of China [79.17323278601869]
国像は国際関係と経済発展に大きな影響を与えている。
新型コロナウイルス(COVID-19)の世界的な流行で、各国と国民は異なる反応を見せている。
本研究では,中国を具体的かつ典型的な事例として捉え,大規模Twitterデータセットのアスペクトベース感情分析を用いてそのイメージを考察する。
論文 参考訳(メタデータ) (2020-09-12T15:54:51Z) - COVID-19 Twitter Dataset with Latent Topics, Sentiments and Emotions
Attributes [4.254099382808598]
本稿は、Twitterプラットフォーム上でのCOVID-19パンデミックに対する人々の言論と対応に関する大規模なグローバルデータセットについて述べる。
われわれは2億2200万件以上のTwitter投稿を「コロナ」「武漢」「nCov」「コビッド」という4つのキーワードを使って収集、処理した。
この論文は、コミュニケーション、心理学、公衆衛生、経済学、疫学におけるデータセットの使用に関する議論から締めくくっている。
論文 参考訳(メタデータ) (2020-07-14T10:30:47Z) - SenWave: Monitoring the Global Sentiments under the COVID-19 Pandemic [26.109661374693935]
SenWaveは105万以上のツイートとWeiboメッセージを使って、感情分析を行う。
SenWaveは、新型コロナウイルスに関する6つの言語でグローバルな会話の感情を明らかにしている。
全体として、SenWaveは楽観的かつ肯定的な感情が時間とともに増加し、新型コロナウイルス(COVID-19)の世界を改良するためのリセットを欲しがっていることを示している。
論文 参考訳(メタデータ) (2020-06-18T20:33:41Z) - Analyzing COVID-19 on Online Social Media: Trends, Sentiments and
Emotions [44.92240076313168]
我々は、2020年1月20日から2020年5月11日までの間に、TwitterとWeiboの投稿に基づいて、アメリカ人と中国人の感情的な軌跡を分析した。
中国と国連の2つの非常に異なる国とは対照的に、異なる文化におけるCOVID-19に対する人々の見解に顕著な違いが浮かび上がっている。
我々の研究は、公共の感情やパンデミックに対する懸念をリアルタイムで明らかにするための計算的アプローチを提供し、政策立案者が人々のニーズをよりよく理解し、それによって最適な政策を立案するのに役立つ可能性がある。
論文 参考訳(メタデータ) (2020-05-29T09:24:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。