論文の概要: Mpox Narrative on Instagram: A Labeled Multilingual Dataset of Instagram Posts on Mpox for Sentiment, Hate Speech, and Anxiety Analysis
- arxiv url: http://arxiv.org/abs/2409.05292v1
- Date: Mon, 9 Sep 2024 03:00:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 16:00:52.348717
- Title: Mpox Narrative on Instagram: A Labeled Multilingual Dataset of Instagram Posts on Mpox for Sentiment, Hate Speech, and Anxiety Analysis
- Title(参考訳): Mpox Narrative on Instagram: 感情、ヘイトスピーチ、不安分析のためのMpox上のInstagram投稿のラベル付き多言語データセット
- Authors: Nirmalya Thakur,
- Abstract要約: WHOは、世界保健機関(WHO)の国際的懸念の公衆衛生非常事態を宣言している。
ソーシャルメディアのマイニングに関する以前の研究は、mpoxのアウトブレイクに関するInstagram投稿のデータセットの開発に重点を置いていなかった。
本稿では,2022年7月23日から2024年9月5日までに発行されたmpoxに関する60,127件のInstagram投稿の多言語データセットについて述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The world is currently experiencing an outbreak of mpox, which has been declared a Public Health Emergency of International Concern by WHO. No prior work related to social media mining has focused on the development of a dataset of Instagram posts about the mpox outbreak. The work presented in this paper aims to address this research gap and makes two scientific contributions to this field. First, it presents a multilingual dataset of 60,127 Instagram posts about mpox, published between July 23, 2022, and September 5, 2024. The dataset, available at https://dx.doi.org/10.21227/7fvc-y093, contains Instagram posts about mpox in 52 languages. For each of these posts, the Post ID, Post Description, Date of publication, language, and translated version of the post (translation to English was performed using the Google Translate API) are presented as separate attributes in the dataset. After developing this dataset, sentiment analysis, hate speech detection, and anxiety or stress detection were performed. This process included classifying each post into (i) one of the sentiment classes, i.e., fear, surprise, joy, sadness, anger, disgust, or neutral, (ii) hate or not hate, and (iii) anxiety/stress detected or no anxiety/stress detected. These results are presented as separate attributes in the dataset. Second, this paper presents the results of performing sentiment analysis, hate speech analysis, and anxiety or stress analysis. The variation of the sentiment classes - fear, surprise, joy, sadness, anger, disgust, and neutral were observed to be 27.95%, 2.57%, 8.69%, 5.94%, 2.69%, 1.53%, and 50.64%, respectively. In terms of hate speech detection, 95.75% of the posts did not contain hate and the remaining 4.25% of the posts contained hate. Finally, 72.05% of the posts did not indicate any anxiety/stress, and the remaining 27.95% of the posts represented some form of anxiety/stress.
- Abstract(参考訳): WHOは、世界保健機関(WHO)の国際的懸念の公衆衛生非常事態を宣言している。
ソーシャルメディアのマイニングに関する以前の研究は、mpoxのアウトブレイクに関するInstagram投稿のデータセットの開発に重点を置いていなかった。
本研究は, この研究ギャップに対処し, この分野に2つの科学的貢献を行うことを目的としている。
まず、2022年7月23日から2024年9月5日までに発行されたmpoxに関する60,127のInstagram投稿の多言語データセットを示す。
データセットはhttps://dx.doi.org/10.21227/7fvc-y093で公開されている。
これらの投稿のそれぞれについて、データセット内の別々の属性として、ポストID、ポスト説明、出版日時、言語、翻訳版(Google Translate APIを使用して英訳が行われた)が提示される。
このデータセットを開発した後、感情分析、ヘイトスピーチ検出、不安やストレス検出を行った。
このプロセスには各ポストを分類することが含まれる。
(i)恐怖、驚き、喜び、悲しみ、怒り、嫌悪、中立という感情階級の1つ
(二)憎むこと、憎まないこと、
(3)不安・ストレス、または不安・ストレスは検出されなかった。
これらの結果はデータセット内の別の属性として示されます。
次に、感情分析、ヘイトスピーチ分析、不安やストレス分析の結果について述べる。
恐怖、驚き、喜び、悲しみ、怒り、嫌悪、中立性の差は27.95%、2.57%、8.69%、5.94%、2.69%、1.53%、50.64%であった。
ヘイトスピーチの検出に関しては、95.75%の投稿にはヘイトが含まれておらず、残りの4.25%にはヘイトが含まれていた。
最後に、投稿の72.05%は不安/ストレスを示しておらず、残りの27.95%はある種の不安/ストレスを表している。
関連論文リスト
- Five Years of COVID-19 Discourse on Instagram: A Labeled Instagram Dataset of Over Half a Million Posts for Multilingual Sentiment Analysis [0.0]
本稿では、2020年1月から2024年9月までに発行された新型コロナウイルスに関する500,153件のInstagram投稿の多言語データセットを示す。
第二に、2020年から2024年にかけての感情分析の結果を示す。
第3に,言語固有の感情分析の知見も提示する。
論文 参考訳(メタデータ) (2024-10-04T10:06:55Z) - Exploring the topics, sentiments and hate speech in the Spanish information environment [0.0]
本研究は,スペインのメディア5社のニュースに対して,337,807件の回答メッセージ(サイトコメントとツイート)の話題,感情,憎悪の頻度について検討した。
コンテンツは主に陰性(62.7%)で中性(28.57%)で、低い陽性(8.73%)である。
低レベルのヘイトスピーチ(3.98%)にもかかわらず、この研究は社会や政治の話題に対するオンライン反応の毒性が高いことを確認している。
論文 参考訳(メタデータ) (2024-09-19T11:19:44Z) - Sentiment Analysis and Text Analysis of the Public Discourse on Twitter
about COVID-19 and MPox [0.0]
新型コロナウイルス(COVID-19)とMPox(MPox)の最近の流行は、情報の検索や共有、意見、感情の両面でのTwitter利用の触媒となった。
この分野での以前の研究は、COVID-19とMPoxの両方に焦点を当てたツイートを同時に分析することはなかった。
この研究ギャップに対処するため、2022年5月7日から2023年3月3日までに、MPoxとCOVID-19を同時に対象とする合計61,862のツイートが調査された。
論文 参考訳(メタデータ) (2023-12-17T01:50:27Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Why Do You Feel This Way? Summarizing Triggers of Emotions in Social
Media Posts [61.723046082145416]
CovidET (Emotions and their Triggers during Covid-19)は、COVID-19に関連する英国のReddit投稿1,900件のデータセットである。
我々は、感情を共同で検出し、感情のトリガーを要約する強力なベースラインを開発する。
分析の結果,コビデットは感情特異的要約における新たな課題と,長文のソーシャルメディア投稿におけるマルチ感情検出の課題が示唆された。
論文 参考訳(メタデータ) (2022-10-22T19:10:26Z) - Assessing the impact of contextual information in hate speech detection [0.48369513656026514]
我々は,Twitter上のメディアからのニュース投稿に対するユーザの反応に基づいた,文脈的ヘイトスピーチ検出のための新しいコーパスを提供する。
このコーパスはリオプラテンセ方言のスペイン語で収集され、新型コロナウイルスのパンデミックに関連するヘイトスピーチに焦点を当てている。
論文 参考訳(メタデータ) (2022-10-02T09:04:47Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - SenWave: Monitoring the Global Sentiments under the COVID-19 Pandemic [26.109661374693935]
SenWaveは105万以上のツイートとWeiboメッセージを使って、感情分析を行う。
SenWaveは、新型コロナウイルスに関する6つの言語でグローバルな会話の感情を明らかにしている。
全体として、SenWaveは楽観的かつ肯定的な感情が時間とともに増加し、新型コロナウイルス(COVID-19)の世界を改良するためのリセットを欲しがっていることを示している。
論文 参考訳(メタデータ) (2020-06-18T20:33:41Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。