論文の概要: AI Enabled User-Specific Cyberbullying Severity Detection with Explainability
- arxiv url: http://arxiv.org/abs/2503.10650v1
- Date: Tue, 04 Mar 2025 05:11:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-23 07:08:08.661758
- Title: AI Enabled User-Specific Cyberbullying Severity Detection with Explainability
- Title(参考訳): AIで説明可能性のあるユーザ特有のサイバーバブル検出が可能に
- Authors: Tabia Tanzin Prama, Jannatul Ferdaws Amrin, Md. Mushfique Anwar, Iqbal H. Sarker,
- Abstract要約: 本稿では, 心理的要因(自尊心, 不安, 抑うつ), オンライン行動(ネットワーク利用, 学歴), 人口統計特性(人種, 性別, 民族性), ソーシャルメディアのコメントなど, ユーザ固有の属性を取り入れたAIモデルを提案する。
LSTMモデルは,ユーザレベルの属性だけでなく,ソーシャルメディアコメントの感情的,話題的,言葉2vec表現を取り入れた146の特徴を用いて訓練されている。
以上の結果から、ヘイトコメント以外にも、特定の人種・性別グループに属する被害者は、より頻繁に標的にされ、うつ病、懲戒的問題、自尊心の低さを呈することが明らかとなった。
- 参考スコア(独自算出の注目度): 1.949927790632678
- License:
- Abstract: The rise of social media has significantly increased the prevalence of cyberbullying (CB), posing serious risks to both mental and physical well-being. Effective detection systems are essential for mitigating its impact. While several machine learning (ML) models have been developed, few incorporate victims' psychological, demographic, and behavioral factors alongside bullying comments to assess severity. In this study, we propose an AI model intregrating user-specific attributes, including psychological factors (self-esteem, anxiety, depression), online behavior (internet usage, disciplinary history), and demographic attributes (race, gender, ethnicity), along with social media comments. Additionally, we introduce a re-labeling technique that categorizes social media comments into three severity levels: Not Bullying, Mild Bullying, and Severe Bullying, considering user-specific factors.Our LSTM model is trained using 146 features, incorporating emotional, topical, and word2vec representations of social media comments as well as user-level attributes and it outperforms existing baseline models, achieving the highest accuracy of 98\% and an F1-score of 0.97. To identify key factors influencing the severity of cyberbullying, we employ explainable AI techniques (SHAP and LIME) to interpret the model's decision-making process. Our findings reveal that, beyond hate comments, victims belonging to specific racial and gender groups are more frequently targeted and exhibit higher incidences of depression, disciplinary issues, and low self-esteem. Additionally, individuals with a prior history of bullying are at a greater risk of becoming victims of cyberbullying.
- Abstract(参考訳): ソーシャルメディアの台頭は、サイバーいじめ(CB)の流行を著しく増加させ、精神と身体の両方に深刻なリスクをもたらしている。
効果的な検出システムは、その影響を軽減するために不可欠である。
いくつかの機械学習(ML)モデルが開発されているが、被害者の心理的、人口統計学的、行動的要因と、重大さを評価するコメントをいじめているものはほとんどない。
本研究では, 心理的要因(自尊心, 不安, 抑うつ), オンライン行動(インターネット利用, 学歴), 人口統計学的属性(人種, 性別, 民族性), ソーシャルメディアのコメントなど, ユーザ固有の属性を取り入れたAIモデルを提案する。
さらに,ソーシャルメディアのコメントを「Not Bullying」,「Mild Bullying」,「Severe Bullying」の3つの重大レベルに分類するリラベル手法を導入する。私たちのLSTMモデルは,ソーシャルメディアコメントの感情的,話題的,ワード2ベック表現を取り入れた146の特徴と,ユーザレベルの属性を取り入れ,既存のベースラインモデルより優れ,98\%,F1スコアが0.97である。
サイバーいじめの重大さに影響を及ぼす重要な要因を特定するために、モデルの決定過程を解釈するために説明可能なAI技術(SHAPとLIME)を用いる。
以上の結果から, ヘイトコメント以外にも, 特定の人種・性別グループに属する被害者は, より頻繁に標的にされ, うつ病, 懲戒的問題, 自尊心の低さを呈することが明らかとなった。
さらに、いじめの既往歴を持つ個人は、サイバーいじめの犠牲者になるリスクが高い。
関連論文リスト
- CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.78357530675446]
人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文 参考訳(メタデータ) (2024-10-30T15:06:44Z) - Detecting LGBTQ+ Instances of Cyberbullying [3.5723815685584013]
サイバーいじめは、世界中の青少年にとって重大な脅威となる。
LGBTQ+のコミュニティは特に危険にさらされており、研究者はLGBTQ+の特定とオンラインハラスメントの増大との間に強い相関関係があることを発見した。
LGBTQ+のメンバーに起きたサイバーいじめ事件を正確に識別できる機械学習モデルを開発することは重要である。
論文 参考訳(メタデータ) (2024-09-18T18:49:55Z) - Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - Deep Learning Based Cyberbullying Detection in Bangla Language [0.0]
本研究は,ベンガルのサイバーいじめを識別する深層学習戦略を実証する。
2層双方向長短期メモリ(Bi-LSTM)モデルが構築され、サイバーいじめを識別する。
論文 参考訳(メタデータ) (2024-01-07T04:58:59Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - Are Personalized Stochastic Parrots More Dangerous? Evaluating Persona
Biases in Dialogue Systems [103.416202777731]
我々は、対話モデルが採用するペルソナに付随する有害な行動の感度であると定義する「ペルソナバイアス」について検討する。
我々は,人格バイアスを有害な表現と有害な合意のバイアスに分類し,攻撃性,有害継続性,関連性,ステレオタイプ合意,および有害合意の5つの側面において,人格バイアスを測定する包括的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2023-10-08T21:03:18Z) - Investigating Human-Identifiable Features Hidden in Adversarial
Perturbations [54.39726653562144]
我々の研究では、最大5つの攻撃アルゴリズムを3つのデータセットにわたって探索する。
対人摂動における人間の識別可能な特徴を同定する。
画素レベルのアノテーションを用いて、そのような特徴を抽出し、ターゲットモデルに妥協する能力を実証する。
論文 参考訳(メタデータ) (2023-09-28T22:31:29Z) - Analysing Cyberbullying using Natural Language Processing by
Understanding Jargon in Social Media [4.932130498861987]
本稿では,さまざまなソーシャルメディアプラットフォームからのデータセットの組み合わせを用いて,バイナリ分類について検討する。
我々は,Bi-LSTM,GloVe,BERTなどの最先端モデルなど複数のモデルを用いて実験を行い,スラング悪用コーパスを導入して独自の前処理手法を適用した。
論文 参考訳(メタデータ) (2021-04-23T04:20:19Z) - Enhancing the Identification of Cyberbullying through Participant Roles [1.399948157377307]
本稿では,ロールモデリングによるサイバーバブル検出の高度化に向けた新しいアプローチを提案する。
我々は、ASKfmからのデータセットを利用してマルチクラス分類を行い、参加者の役割を検出する。
論文 参考訳(メタデータ) (2020-10-13T19:13:07Z) - Measurement-driven Security Analysis of Imperceptible Impersonation
Attacks [54.727945432381716]
本稿では,ディープニューラルネットワークを用いた顔認識システムの実用性について検討する。
皮膚の色,性別,年齢などの要因が,特定の標的に対する攻撃を行う能力に影響を及ぼすことを示す。
また,攻撃者の顔のさまざまなポーズや視点に対して堅牢なユニバーサルアタックを構築する可能性についても検討した。
論文 参考訳(メタデータ) (2020-08-26T19:27:27Z) - Aggressive, Repetitive, Intentional, Visible, and Imbalanced: Refining
Representations for Cyberbullying Classification [4.945634077636197]
本研究では,その社会的・言語的側面を表現するために,5つの明確な要因を用いて,サイバーいじめのニュアンスな問題を考察する。
これらの結果は、サイバーいじめを社会現象として表現し、モデル化することの重要性を示している。
論文 参考訳(メタデータ) (2020-04-04T00:35:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。