論文の概要: An NLP-Assisted Bayesian Time Series Analysis for Prevalence of Twitter
Cyberbullying During the COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2208.04980v1
- Date: Sat, 23 Jul 2022 15:24:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-14 18:17:00.160457
- Title: An NLP-Assisted Bayesian Time Series Analysis for Prevalence of Twitter
Cyberbullying During the COVID-19 Pandemic
- Title(参考訳): NLP支援ベイズ時系列分析によるCOVID-19パンデミック時のTwitterサイバーバブル発生状況
- Authors: Christopher Perez, Sayar Karmakar
- Abstract要約: 2019年初めから2021年末にかけて、サイバーいじめに関連するキーワードを含むツイートが1100万件を集めた。
Twitterのコーパスで事前訓練された自然言語処理モデルは、ツイートが攻撃的で憎悪である可能性を生み出した。
その結果、ヘイトフルスピーチでは週毎と年毎の季節性は強いが、新型コロナウイルスによる可能性があるため、年々若干の違いが見られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: COVID-19 has brought about many changes in social dynamics. Stay-at-home
orders and disruptions in school teaching can influence bullying behavior
in-person and online, both of which leading to negative outcomes in victims. To
study cyberbullying specifically, 1 million tweets containing keywords
associated with abuse were collected from the beginning of 2019 to the end of
2021 with the Twitter API search endpoint. A natural language processing model
pre-trained on a Twitter corpus generated probabilities for the tweets being
offensive and hateful. To overcome limitations of sampling, data was also
collected using the count endpoint. The fraction of tweets from a given daily
sample marked as abusive is multiplied to the number reported by the count
endpoint. Once these adjusted counts are assembled, a Bayesian autoregressive
Poisson model allows one to study the mean trend and lag functions of the data
and how they vary over time. The results reveal strong weekly and yearly
seasonality in hateful speech but with slight differences across years that may
be attributed to COVID-19.
- Abstract(参考訳): 新型コロナウイルスは、社会的ダイナミクスに多くの変化をもたらした。
家庭での注文と学校教育の中断は、個人およびオンラインでのいじめ行動に影響を与える可能性がある。
具体的には、2019年の初めから2021年の終わりにかけてtwitter api検索エンドポイントで、悪用に関連するキーワードを含む100万のツイートが収集された。
twitterコーパスで事前学習された自然言語処理モデルは、攻撃的で憎悪的なツイートの確率を生み出した。
サンプリングの制限を克服するために、カウントエンドポイントを使ってデータも収集された。
乱用とマークされた毎日のサンプルからのツイートの割合はカウントエンドポイントから報告された数に乗じる。
これらの調整された数を組み立てると、ベイズ自己回帰ポアソンモデルにより、データの平均トレンドとラグ関数と、時間とともにどのように変化するかを研究することができる。
その結果、憎しみに満ちたスピーチでは週毎と年毎の季節性は強いが、新型コロナウイルスによる可能性がある年々の差はわずかである。
関連論文リスト
- Sentiment Analysis of Cyberbullying Data in Social Media [0.0]
我々の研究は、ソーシャルメディア投稿におけるいじめの痕跡を検出するために、ディープラーニングと自然言語理解技術を活用することに焦点を当てている。
1つのアプローチではBERT埋め込みを使用し、もう1つはOpenAIから最近リリースされた埋め込みAPIに埋め込みレイヤを置き換える。
フォームスプリング型サイバーバブルデータにおける感情分析の有効性を評価するために,これらの2つの手法の性能比較を行った。
論文 参考訳(メタデータ) (2024-11-08T20:41:04Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Manipulating Twitter Through Deletions [64.33261764633504]
Twitter上でのインフルエンスキャンペーンの研究は、公開APIを通じて得られたツイートから悪意のあるアクティビティを識別することに大きく依存している。
ここでは,1100万以上のアカウントによる10億以上の削除を含む,異常な削除パターンを網羅的かつ大規模に分析する。
少数のアカウントが毎日大量のツイートを削除していることがわかった。
まず、ツイートのボリューム制限が回避され、特定のアカウントが毎日2600万以上のツイートをネットワークに流すことができる。
第二に、調整されたアカウントのネットワークは、繰り返しのいいね!や、最終的に削除されるコンテンツとは違って、ランキングアルゴリズムを操作できる。
論文 参考訳(メタデータ) (2022-03-25T20:07:08Z) - A deep dive into the consistently toxic 1% of Twitter [9.669275987983447]
この調査は、112万のTwitterプロフィールから14年間のツイートと2億2300万以上のツイートをカバーしている。
有害なコンテンツの一貫性の観点から最も極端なプロファイルを選択し、彼らのツイートテキストと、彼らが共有したドメイン、ハッシュタグ、URLを調べました。
その結果、これらのプロファイルはハッシュタグ、URL、ドメインの多様性の低い狭いテーマに保たれており、数学的に互いに似ており、ボットのような振る舞いの可能性が高いことがわかった。
論文 参考訳(メタデータ) (2022-02-16T04:21:48Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Probabilistic Impact Score Generation using Ktrain-BERT to Identify Hate
Words from Twitter Discussions [0.5735035463793008]
本稿では,Kerasをラップした軽量BERTモデルによるヘイトスピーチの同定実験を行った。
このタスクで使用されるデータセットは、英語のFIRE 2021からのHate Speech and Offensive Content Detection (HASOC 2021)データである。
検証精度は82.60%,F1スコアは82.68%であった。
論文 参考訳(メタデータ) (2021-11-25T06:35:49Z) - Evaluating the Impact of COVID-19 on Cyberbullying through Bayesian
Trend Analysis [1.52292571922932]
サイバーいじめに関連する公開ツイート(N=454,046)が2020年1月1日から6月7日まで投稿された。
この新しいベイズ方式は、2020年3月中旬以降、サイバーいじめに関連するツイートの上昇傾向をはっきりと示している。
我々の研究は、サイバーいじめの重大な問題と、世界的危機がソーシャルメディアの悪用にどのように影響するかを強調している。
論文 参考訳(メタデータ) (2020-08-08T00:01:32Z) - Change-Point Analysis of Cyberbullying-Related Twitter Discussions
During COVID-19 [1.2891210250935146]
ソーシャルメディアの利用も増加しており、これがサイバーいじめを引き起こした疑いが持たれている。
この傾向を評価するために、2020年1月1日から2020年6月7日までに投稿された454,046件のサイバーいじめに関連する公開ツイートを収集しました。
ほぼすべての変更点のタイムロケーションは、新型コロナウイルス(COVID-19)によるもので、Twitter上での議論の分析を通じて、サイバーいじめの増加に関する最初の仮説を裏付けるものだ。
論文 参考訳(メタデータ) (2020-08-07T22:50:42Z) - Writer Identification Using Microblogging Texts for Social Media
Forensics [53.180678723280145]
私たちは、文学的分析に広く使われている人気のあるスタイル的特徴と、URL、ハッシュタグ、返信、引用などの特定のTwitter機能を評価します。
我々は、様々なサイズの著者集合と、著者毎のトレーニング/テストテキストの量をテストする。
論文 参考訳(メタデータ) (2020-07-31T00:23:18Z) - Detecting Perceived Emotions in Hurricane Disasters [62.760131661847986]
私たちはHurricaneEmoを紹介します。HurricaneEmoは、Harvey、Irma、Mariaの3つのハリケーンにまたがる15,000の英語ツイートの感情データセットです。
本稿では, きめ細かい感情を包括的に研究し, 粗い感情群を識別するための分類タスクを提案する。
論文 参考訳(メタデータ) (2020-04-29T16:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。