論文の概要: HP-BERT: A framework for longitudinal study of Hinduphobia on social media via LLMs
- arxiv url: http://arxiv.org/abs/2501.05482v1
- Date: Tue, 07 Jan 2025 23:22:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 15:27:00.678026
- Title: HP-BERT: A framework for longitudinal study of Hinduphobia on social media via LLMs
- Title(参考訳): HP-BERT : LLMを用いたソーシャルメディア上でのヒンドゥー恐怖の縦断的研究のためのフレームワーク
- Authors: Ashutosh Singh, Rohitash Chandra,
- Abstract要約: 新型コロナウイルスのパンデミックの前後におけるX(Twitter)上でのヒンドゥー恐怖症を経時的に分析する悪用検知・感情分析フレームワークを提案する。
この枠組みはヒンドゥー恐怖の言説の流行と強さを評価し、軽蔑的ジョークや人種差別的発言といった要素を捉えている。
調査にはオーストラリア、ブラジル、インド、インドネシア、日本、英国を含む6カ国のツイートが2740万件含まれている。
- 参考スコア(独自算出の注目度): 1.9376226959814953
- License:
- Abstract: During the COVID-19 pandemic, community tensions intensified, fuelling Hinduphobic sentiments and discrimination against individuals of Hindu descent within India and worldwide. Large language models (LLMs) have become prominent in natural language processing (NLP) tasks and social media analysis, enabling longitudinal studies of platforms like X (formerly Twitter) for specific issues during COVID-19. We present an abuse detection and sentiment analysis framework that offers a longitudinal analysis of Hinduphobia on X (Twitter) during and after the COVID-19 pandemic. This framework assesses the prevalence and intensity of Hinduphobic discourse, capturing elements such as derogatory jokes and racist remarks through sentiment analysis and abuse detection from pre-trained and fine-tuned LLMs. Additionally, we curate and publish a "Hinduphobic COVID-19 X (Twitter) Dataset" of 8,000 tweets annotated for Hinduphobic abuse detection, which is used to fine-tune a BERT model, resulting in the development of the Hinduphobic BERT (HP-BERT) model. We then further fine-tune HP-BERT using the SenWave dataset for multi-label sentiment analysis. Our study encompasses approximately 27.4 million tweets from six countries, including Australia, Brazil, India, Indonesia, Japan, and the United Kingdom. Our findings reveal a strong correlation between spikes in COVID-19 cases and surges in Hinduphobic rhetoric, highlighting how political narratives, misinformation, and targeted jokes contributed to communal polarisation. These insights provide valuable guidance for developing strategies to mitigate communal tensions in future crises, both locally and globally. We advocate implementing automated monitoring and removal of such content on social media to curb divisive discourse.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)パンデミックの間、地域社会の緊張が高まり、ヒンドゥー教徒の感情が高まり、インドや世界中でヒンドゥー教徒の個人に対する差別が高まった。
大規模言語モデル(LLM)は、自然言語処理(NLP)タスクやソーシャルメディア分析において顕著になり、新型コロナウイルス(COVID-19)の期間に特定の問題に対して、X(旧Twitter)のようなプラットフォームを縦断的に研究することを可能にした。
新型コロナウイルスのパンデミックの前後におけるX(Twitter)上でのヒンドゥー恐怖症を経時的に分析する悪用検知・感情分析フレームワークを提案する。
この枠組みは、感情分析や、事前訓練された、微調整されたLLMからの乱用検出を通じて、軽蔑的ジョークや人種差別的発言などの要素を捉え、ヒンドゥー恐怖の言説の有病率と強度を評価する。
さらに,Hududphobic COVID-19 X (Twitter) Dataset" という,Hududphobic abuse Detection に注釈付き8,000ツイートをキュレートして公開し,BERT モデルを微調整し,Hududphobic BERT (HP-BERT) モデルを開発した。
マルチラベル感情分析のためのSenWaveデータセットを用いたHP-BERTをさらに微調整する。
調査にはオーストラリア、ブラジル、インド、インドネシア、日本、英国を含む6カ国のツイートが2740万件含まれている。
以上の結果から,ヒンズー・フォビック・レトリックのスパイクと急激な増加との間には強い相関関係がみられ,政治的物語,誤報,標的とするジョークが共分極にどのように寄与するかが明らかになった。
これらの洞察は、地域と世界の両方で、将来の危機における共同体の緊張を軽減するための戦略を開発するための貴重なガイダンスを提供する。
ソーシャルメディア上でこのようなコンテンツを自動で監視・削除し、ディバイシブな言論を抑えることを提唱する。
関連論文リスト
- A longitudinal sentiment analysis of Sinophobia during COVID-19 using large language models [3.3741245091336083]
新型コロナウイルス(COVID-19)のパンデミックにより、キセノフォビア、特にシナフォビアが悪化し、中国系個人に対する差別が広まりつつある。
新型コロナウイルスのパンデミック時にX(Twitter)で表現されたSinophobic sentimentsの縦断的感情分析にLLMを用いた感情分析フレームワークを提案する。
その結果, SinophobicTweets, Sinophobic sentiments, surges in COVID-19 case, it is a significant correlation between the spikes in Sinophobic tweetss, Sinophobic sentiments and surges in COVID-19 case, showed that the evolution of the spread of public sentiment and the prevalence of Sinophobic discourse。
論文 参考訳(メタデータ) (2024-08-29T23:39:11Z) - Exploring a Hybrid Deep Learning Framework to Automatically Discover
Topic and Sentiment in COVID-19 Tweets [2.3940819037450987]
新型コロナウイルスは、世界的な公衆衛生問題や、経済危機、失業、精神的苦痛などの問題を引き起こしている。
このパンデミックは世界中で致命的であり、多くの人々が感染症だけでなく、問題、ストレス、不思議、恐怖、恨み、憎しみに悩まされている。
Twitterは、非常に影響力のあるソーシャルメディアプラットフォームであり、健康関連情報、ニュース、意見、世論などの重要な情報源である。
論文 参考訳(メタデータ) (2023-12-02T16:58:17Z) - Exploring Cross-Cultural Differences in English Hate Speech Annotations: From Dataset Construction to Analysis [44.17106903728264]
ほとんどのヘイトスピーチデータセットは、単一の言語における文化的多様性を無視している。
そこで本研究では,CRoss文化の英語Hate音声データセットであるCREHateを紹介する。
CREHateのポストの56.2%のみが全国でコンセンサスを達成しており、ペアのラベル差が最も高いのは26%である。
論文 参考訳(メタデータ) (2023-08-31T13:14:47Z) - What goes on inside rumour and non-rumour tweets and their reactions: A
Psycholinguistic Analyses [58.75684238003408]
ソーシャルメディアのテキストの心理言語学的分析は、誤情報を緩和するために意味のある結論を導くのに不可欠である。
本研究は,様々な事象に関する噂の深い心理言語学的分析を行うことによって貢献する。
論文 参考訳(メタデータ) (2021-11-09T07:45:11Z) - When a crisis strikes: Emotion analysis and detection during COVID-19 [96.03869351276478]
感情をラベル付けした1万ツイートのCovidEmoを紹介します。
事前学習された言語モデルがドメインや危機をまたいでどのように一般化するかを検討する。
論文 参考訳(メタデータ) (2021-07-23T04:07:14Z) - COVID-19 sentiment analysis via deep learning during the rise of novel
cases [0.5156484100374059]
我々はtwitter上で感情分析を行うために,long short-term memory(lstm)リカレントニューラルネットワークを用いたディープラーニング言語モデルを用いた。
我々は、ほとんどのツイートは、インドのCOVID-19事件の台頭中に高いレベルの楽観主義で肯定的であることが判明しました。
楽観的で冗談を言うツイートは、主に月間ツイートを支配しており、ネガティブな感情が表される回数はずっと少なかった。
論文 参考訳(メタデータ) (2021-04-05T04:31:19Z) - Country Image in COVID-19 Pandemic: A Case Study of China [79.17323278601869]
国像は国際関係と経済発展に大きな影響を与えている。
新型コロナウイルス(COVID-19)の世界的な流行で、各国と国民は異なる反応を見せている。
本研究では,中国を具体的かつ典型的な事例として捉え,大規模Twitterデータセットのアスペクトベース感情分析を用いてそのイメージを考察する。
論文 参考訳(メタデータ) (2020-09-12T15:54:51Z) - Analyzing COVID-19 on Online Social Media: Trends, Sentiments and
Emotions [44.92240076313168]
我々は、2020年1月20日から2020年5月11日までの間に、TwitterとWeiboの投稿に基づいて、アメリカ人と中国人の感情的な軌跡を分析した。
中国と国連の2つの非常に異なる国とは対照的に、異なる文化におけるCOVID-19に対する人々の見解に顕著な違いが浮かび上がっている。
我々の研究は、公共の感情やパンデミックに対する懸念をリアルタイムで明らかにするための計算的アプローチを提供し、政策立案者が人々のニーズをよりよく理解し、それによって最適な政策を立案するのに役立つ可能性がある。
論文 参考訳(メタデータ) (2020-05-29T09:24:38Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z) - #Coronavirus or #Chinesevirus?!: Understanding the negative sentiment
reflected in Tweets with racist hashtags across the development of COVID-19 [1.0878040851638]
人種差別的なハッシュタグでマークされたツイートに反映される否定的な感情の分析に焦点を当てた。
我々は、新型コロナウイルスの3つの発達段階とともに、ネガティブな感情がどのように変化するかを把握するためのステージベースのアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-17T11:15:50Z) - Psychometric Analysis and Coupling of Emotions Between State Bulletins
and Twitter in India during COVID-19 Infodemic [7.428097999824421]
新型コロナウイルスのインフォデミックは、パンデミックそのものよりも急速に広まっている。
ソーシャルメディアは情報の最大の源であるため、インフォデミックの管理には誤情報を緩和する必要がある。
Twitterだけでも、キュレートされたイベントページの利用が急激な45%増加した。
論文 参考訳(メタデータ) (2020-05-12T01:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。