論文の概要: HP-BERT: A framework for longitudinal study of Hinduphobia on social media via LLMs
- arxiv url: http://arxiv.org/abs/2501.05482v1
- Date: Tue, 07 Jan 2025 23:22:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 18:34:15.027566
- Title: HP-BERT: A framework for longitudinal study of Hinduphobia on social media via LLMs
- Title(参考訳): HP-BERT : LLMを用いたソーシャルメディア上でのヒンドゥー恐怖の縦断的研究のためのフレームワーク
- Authors: Ashutosh Singh, Rohitash Chandra,
- Abstract要約: 新型コロナウイルスのパンデミックの前後におけるX(Twitter)上でのヒンドゥー恐怖症を経時的に分析する悪用検知・感情分析フレームワークを提案する。
この枠組みはヒンドゥー恐怖の言説の流行と強さを評価し、軽蔑的ジョークや人種差別的発言といった要素を捉えている。
調査にはオーストラリア、ブラジル、インド、インドネシア、日本、英国を含む6カ国のツイートが2740万件含まれている。
- 参考スコア(独自算出の注目度): 1.9376226959814953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: During the COVID-19 pandemic, community tensions intensified, fuelling Hinduphobic sentiments and discrimination against individuals of Hindu descent within India and worldwide. Large language models (LLMs) have become prominent in natural language processing (NLP) tasks and social media analysis, enabling longitudinal studies of platforms like X (formerly Twitter) for specific issues during COVID-19. We present an abuse detection and sentiment analysis framework that offers a longitudinal analysis of Hinduphobia on X (Twitter) during and after the COVID-19 pandemic. This framework assesses the prevalence and intensity of Hinduphobic discourse, capturing elements such as derogatory jokes and racist remarks through sentiment analysis and abuse detection from pre-trained and fine-tuned LLMs. Additionally, we curate and publish a "Hinduphobic COVID-19 X (Twitter) Dataset" of 8,000 tweets annotated for Hinduphobic abuse detection, which is used to fine-tune a BERT model, resulting in the development of the Hinduphobic BERT (HP-BERT) model. We then further fine-tune HP-BERT using the SenWave dataset for multi-label sentiment analysis. Our study encompasses approximately 27.4 million tweets from six countries, including Australia, Brazil, India, Indonesia, Japan, and the United Kingdom. Our findings reveal a strong correlation between spikes in COVID-19 cases and surges in Hinduphobic rhetoric, highlighting how political narratives, misinformation, and targeted jokes contributed to communal polarisation. These insights provide valuable guidance for developing strategies to mitigate communal tensions in future crises, both locally and globally. We advocate implementing automated monitoring and removal of such content on social media to curb divisive discourse.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)パンデミックの間、地域社会の緊張が高まり、ヒンドゥー教徒の感情が高まり、インドや世界中でヒンドゥー教徒の個人に対する差別が高まった。
大規模言語モデル(LLM)は、自然言語処理(NLP)タスクやソーシャルメディア分析において顕著になり、新型コロナウイルス(COVID-19)の期間に特定の問題に対して、X(旧Twitter)のようなプラットフォームを縦断的に研究することを可能にした。
新型コロナウイルスのパンデミックの前後におけるX(Twitter)上でのヒンドゥー恐怖症を経時的に分析する悪用検知・感情分析フレームワークを提案する。
この枠組みは、感情分析や、事前訓練された、微調整されたLLMからの乱用検出を通じて、軽蔑的ジョークや人種差別的発言などの要素を捉え、ヒンドゥー恐怖の言説の有病率と強度を評価する。
さらに,Hududphobic COVID-19 X (Twitter) Dataset" という,Hududphobic abuse Detection に注釈付き8,000ツイートをキュレートして公開し,BERT モデルを微調整し,Hududphobic BERT (HP-BERT) モデルを開発した。
マルチラベル感情分析のためのSenWaveデータセットを用いたHP-BERTをさらに微調整する。
調査にはオーストラリア、ブラジル、インド、インドネシア、日本、英国を含む6カ国のツイートが2740万件含まれている。
以上の結果から,ヒンズー・フォビック・レトリックのスパイクと急激な増加との間には強い相関関係がみられ,政治的物語,誤報,標的とするジョークが共分極にどのように寄与するかが明らかになった。
これらの洞察は、地域と世界の両方で、将来の危機における共同体の緊張を軽減するための戦略を開発するための貴重なガイダンスを提供する。
ソーシャルメディア上でこのようなコンテンツを自動で監視・削除し、ディバイシブな言論を抑えることを提唱する。
関連論文リスト
- The Shifting Landscape of Vaccine Discourse: Insights From a Decade of Pre- to Post-COVID-19 Vaccine Posts on Social Media [61.575555311964706]
我々は、英語話者がソーシャルメディア上でワクチンについて話す方法を分析し、ソーシャルメディア投稿におけるワクチンに関する進化的物語を理解する。
最初に、2013年から2022年までのワクチンに関する1870万のキュレートされた投稿からなる、新しいデータセットを紹介した。
我々の分析は、新型コロナウイルスのパンデミックが、ワクチンに関するXユーザーの感情と言論に複雑な変化をもたらしたことを示している。
論文 参考訳(メタデータ) (2025-11-20T22:28:59Z) - SenWave: A Fine-Grained Multi-Language Sentiment Analysis Dataset Sourced from COVID-19 Tweets [42.98177831933239]
SenWaveは、新型コロナウイルス(COVID-19)のツイートを分析するために特別に設計された、新しい微粒な多言語感情分析データセットである。
このデータセットは、英語とアラビア語でそれぞれ1万の注釈付きツイートと、スペイン語、フランス語、イタリア語で3万の翻訳ツイートで構成されている。
本研究は,言語,国,トピック間の進化する情緒的景観を詳細に分析し,時間とともに重要な洞察を明らかにする。
論文 参考訳(メタデータ) (2025-10-09T13:38:05Z) - A longitudinal sentiment analysis of Sinophobia during COVID-19 using large language models [3.3741245091336083]
新型コロナウイルス(COVID-19)のパンデミックにより、キセノフォビア、特にシナフォビアが悪化し、中国系個人に対する差別が広まりつつある。
新型コロナウイルスのパンデミック時にX(Twitter)で表現されたSinophobic sentimentsの縦断的感情分析にLLMを用いた感情分析フレームワークを提案する。
その結果, SinophobicTweets, Sinophobic sentiments, surges in COVID-19 case, it is a significant correlation between the spikes in Sinophobic tweetss, Sinophobic sentiments and surges in COVID-19 case, showed that the evolution of the spread of public sentiment and the prevalence of Sinophobic discourse。
論文 参考訳(メタデータ) (2024-08-29T23:39:11Z) - Exploring a Hybrid Deep Learning Framework to Automatically Discover
Topic and Sentiment in COVID-19 Tweets [2.3940819037450987]
新型コロナウイルスは、世界的な公衆衛生問題や、経済危機、失業、精神的苦痛などの問題を引き起こしている。
このパンデミックは世界中で致命的であり、多くの人々が感染症だけでなく、問題、ストレス、不思議、恐怖、恨み、憎しみに悩まされている。
Twitterは、非常に影響力のあるソーシャルメディアプラットフォームであり、健康関連情報、ニュース、意見、世論などの重要な情報源である。
論文 参考訳(メタデータ) (2023-12-02T16:58:17Z) - Exploring Cross-Cultural Differences in English Hate Speech Annotations: From Dataset Construction to Analysis [44.17106903728264]
ほとんどのヘイトスピーチデータセットは、単一の言語における文化的多様性を無視している。
そこで本研究では,CRoss文化の英語Hate音声データセットであるCREHateを紹介する。
CREHateのポストの56.2%のみが全国でコンセンサスを達成しており、ペアのラベル差が最も高いのは26%である。
論文 参考訳(メタデータ) (2023-08-31T13:14:47Z) - Sensing the Pulse of the Pandemic: Geovisualizing the Demographic
Disparities of Public Sentiment toward COVID-19 through Social Media [9.906180010952406]
ソーシャルメディアの利用は人口層によって異なるが、若年ユーザーの方が高齢ユーザーに比べて多い。
本研究は、Twitterデータを用いて、新型コロナウイルスに関する世論感情を推定するケーススタディを通じて、ソーシャルメディア分析における解決策と人口統計バイアスを調査した。
論文 参考訳(メタデータ) (2023-03-17T02:59:46Z) - What goes on inside rumour and non-rumour tweets and their reactions: A
Psycholinguistic Analyses [58.75684238003408]
ソーシャルメディアのテキストの心理言語学的分析は、誤情報を緩和するために意味のある結論を導くのに不可欠である。
本研究は,様々な事象に関する噂の深い心理言語学的分析を行うことによって貢献する。
論文 参考訳(メタデータ) (2021-11-09T07:45:11Z) - AraCOVID19-SSD: Arabic COVID-19 Sentiment and Sarcasm Detection Dataset [0.0]
本稿は、AraCOVID19-SSDに5,162ツイートを含む、手動でアノテートされたアラビア語 COVID-19 sarcasm と感情検出データセットを構築し、リリースする。
これらのユーザの多くは、自分の意図した意味をユーモラスで面白い間接的な方法で伝達するために、サルカズム(sarcasm)を使っている。
論文 参考訳(メタデータ) (2021-10-05T11:24:24Z) - American Twitter Users Revealed Social Determinants-related Oral Health
Disparities amid the COVID-19 Pandemic [72.44305630014534]
新型コロナウイルス(COVID-19)パンデミックの期間中に、26州で9,104人のTwitterユーザーから、口腔の健康関連ツイートを収集しました。
女性や若年者(19-29)は口腔の健康問題について話す傾向が強い。
新型コロナウイルス(COVID-19)のリスクが高い郡の人々は、歯の腐敗や歯の出血、歯の破折について語っています。
論文 参考訳(メタデータ) (2021-09-16T01:10:06Z) - When a crisis strikes: Emotion analysis and detection during COVID-19 [96.03869351276478]
感情をラベル付けした1万ツイートのCovidEmoを紹介します。
事前学習された言語モデルがドメインや危機をまたいでどのように一般化するかを検討する。
論文 参考訳(メタデータ) (2021-07-23T04:07:14Z) - COVID-19 sentiment analysis via deep learning during the rise of novel
cases [0.5156484100374059]
我々はtwitter上で感情分析を行うために,long short-term memory(lstm)リカレントニューラルネットワークを用いたディープラーニング言語モデルを用いた。
我々は、ほとんどのツイートは、インドのCOVID-19事件の台頭中に高いレベルの楽観主義で肯定的であることが判明しました。
楽観的で冗談を言うツイートは、主に月間ツイートを支配しており、ネガティブな感情が表される回数はずっと少なかった。
論文 参考訳(メタデータ) (2021-04-05T04:31:19Z) - COVID-19 Tweets Analysis through Transformer Language Models [0.0]
本研究では、COVID-19におけるツイートの詳細な感情分析を行う。
訓練されたトランスフォーマーモデルは、ツイートのトーンを高精度で正確に予測することができる。
次にこのモデルを利用して、covid-19の20万ツイートのトーンを予測する。
論文 参考訳(メタデータ) (2021-02-27T12:06:33Z) - Country Image in COVID-19 Pandemic: A Case Study of China [79.17323278601869]
国像は国際関係と経済発展に大きな影響を与えている。
新型コロナウイルス(COVID-19)の世界的な流行で、各国と国民は異なる反応を見せている。
本研究では,中国を具体的かつ典型的な事例として捉え,大規模Twitterデータセットのアスペクトベース感情分析を用いてそのイメージを考察する。
論文 参考訳(メタデータ) (2020-09-12T15:54:51Z) - On Analyzing Antisocial Behaviors Amid COVID-19 Pandemic [5.900114841365645]
新型コロナウイルスのパンデミックでオンラインの反社会的行動を研究する研究はほとんどない。
本稿では、4000万以上の新型コロナウイルス関連ツイートの大規模なデータセットを収集し、注釈を付けることで、研究ギャップを埋める。
また、アノテーション付きデータセットの実証分析を行い、新型コロナウイルスのパンデミックの中で、新しい虐待的レキシコンが導入されたことを発見した。
論文 参考訳(メタデータ) (2020-07-21T11:11:35Z) - TICO-19: the Translation Initiative for Covid-19 [112.5601530395345]
COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
論文 参考訳(メタデータ) (2020-07-03T16:26:17Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z) - Analyzing COVID-19 on Online Social Media: Trends, Sentiments and
Emotions [44.92240076313168]
我々は、2020年1月20日から2020年5月11日までの間に、TwitterとWeiboの投稿に基づいて、アメリカ人と中国人の感情的な軌跡を分析した。
中国と国連の2つの非常に異なる国とは対照的に、異なる文化におけるCOVID-19に対する人々の見解に顕著な違いが浮かび上がっている。
我々の研究は、公共の感情やパンデミックに対する懸念をリアルタイムで明らかにするための計算的アプローチを提供し、政策立案者が人々のニーズをよりよく理解し、それによって最適な政策を立案するのに役立つ可能性がある。
論文 参考訳(メタデータ) (2020-05-29T09:24:38Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z) - #Coronavirus or #Chinesevirus?!: Understanding the negative sentiment
reflected in Tweets with racist hashtags across the development of COVID-19 [1.0878040851638]
人種差別的なハッシュタグでマークされたツイートに反映される否定的な感情の分析に焦点を当てた。
我々は、新型コロナウイルスの3つの発達段階とともに、ネガティブな感情がどのように変化するかを把握するためのステージベースのアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-17T11:15:50Z) - Psychometric Analysis and Coupling of Emotions Between State Bulletins
and Twitter in India during COVID-19 Infodemic [7.428097999824421]
新型コロナウイルスのインフォデミックは、パンデミックそのものよりも急速に広まっている。
ソーシャルメディアは情報の最大の源であるため、インフォデミックの管理には誤情報を緩和する必要がある。
Twitterだけでも、キュレートされたイベントページの利用が急激な45%増加した。
論文 参考訳(メタデータ) (2020-05-12T01:51:07Z) - Fighting the COVID-19 Infodemic: Modeling the Perspective of
Journalists, Fact-Checkers, Social Media Platforms, Policy Makers, and the
Society [37.9389191670008]
新型コロナウイルスは世界保健機関(WHO)にとって最も重要な分野の一つだと宣言されている。
このインフォデミックと戦うことは、世界保健機関(WHO)の最も重要な焦点の1つと宣言されている。
詳細な偽情報分析のために,手動で注釈付きツイート16Kの大規模なデータセットをリリースする。
論文 参考訳(メタデータ) (2020-04-30T18:04:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。