論文の概要: Cyberbullying Detection in Hinglish Text Using MURIL and Explainable AI
- arxiv url: http://arxiv.org/abs/2506.16066v1
- Date: Thu, 19 Jun 2025 06:46:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.966798
- Title: Cyberbullying Detection in Hinglish Text Using MURIL and Explainable AI
- Title(参考訳): MURILと説明可能なAIを用いたヒングリッシュテキストの乱流検出
- Authors: Devesh Kumar,
- Abstract要約: デジタルプラットフォーム上でのHindi-English(Hinglish)通信のコード混在は、既存のサイバーいじめ検知システムに課題をもたらす。
本稿では,インド語多言語表現(MURIL)アーキテクチャを用いたHinglishテキストにおけるサイバーいじめ検出のためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.356008609689971
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The growth of digital communication platforms has led to increased cyberbullying incidents worldwide, creating a need for automated detection systems to protect users. The rise of code-mixed Hindi-English (Hinglish) communication on digital platforms poses challenges for existing cyberbullying detection systems, which were designed primarily for monolingual text. This paper presents a framework for cyberbullying detection in Hinglish text using the Multilingual Representations for Indian Languages (MURIL) architecture to address limitations in current approaches. Evaluation across six benchmark datasets -- Bohra \textit{et al.}, BullyExplain, BullySentemo, Kumar \textit{et al.}, HASOC 2021, and Mendeley Indo-HateSpeech -- shows that the MURIL-based approach outperforms existing multilingual models including RoBERTa and IndicBERT, with improvements of 1.36 to 13.07 percentage points and accuracies of 86.97\% on Bohra, 84.62\% on BullyExplain, 86.03\% on BullySentemo, 75.41\% on Kumar datasets, 83.92\% on HASOC 2021, and 94.63\% on Mendeley dataset. The framework includes explainability features through attribution analysis and cross-linguistic pattern recognition. Ablation studies show that selective layer freezing, appropriate classification head design, and specialized preprocessing for code-mixed content improve detection performance, while failure analysis identifies challenges including context-dependent interpretation, cultural understanding, and cross-linguistic sarcasm detection, providing directions for future research in multilingual cyberbullying detection.
- Abstract(参考訳): デジタル通信プラットフォームの成長により、世界中のサイバーいじめ事件が増加し、ユーザーを保護する自動検知システムの必要性が高まっている。
コードミキシングされたヒンディー語(ヒングリッシュ)通信のデジタルプラットフォームにおける台頭は、主にモノリンガルテキスト用に設計された既存のサイバーいじめ検出システムに課題をもたらす。
本稿では,HinglishテキストにおけるMultilingual Representations for Indian Languages (MURIL)アーキテクチャを用いたサイバーいじめ検出のためのフレームワークを提案する。
Bohra \textit{et al }, BullyExplain, BullySentemo, Kumar \textit{et al }, HASOC 2021, Mendeley Indo-HateSpeechの6つのベンチマークデータセットから評価すると、MURILベースのアプローチはRoBERTaやIndicBERTといった既存のマルチリンガルモデルよりも優れており、Bohraでは1.36~13.07ポイント、Accuraciesは86.97ポイント、BullyExplainでは84.62パーセント、BullySentemoでは86.03パーセント、Kumarデータセットでは75.41パーセント、HASOC 2021では83.92パーセント、Mendleyデータセットでは94.63パーセントである。
このフレームワークは、帰属分析と言語間パターン認識による説明可能性機能を含む。
アブレーション研究では、コード混合コンテンツの選択的層凍結、適切な分類ヘッド設計、特殊前処理により検出性能が向上する一方、故障解析では、文脈依存的な解釈、文化的理解、言語間皮肉検出などの課題を認識し、多言語サイバーバブル検出における今後の研究の方向性を提供する。
関連論文リスト
- A Hybrid DeBERTa and Gated Broad Learning System for Cyberbullying Detection in English Text [0.356008609689971]
最近の研究によると サイバーいじめは 約54.4%の若者に影響を与えます
本稿では,変圧器モデルにおける文脈理解能力と広範学習システムのパターン認識強度を併用して,効果的なサイバーバブル検出を行うハイブリッドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-06-19T06:15:22Z) - OMNIGUARD: An Efficient Approach for AI Safety Moderation Across Modalities [54.152681077418805]
現在の検出アプローチは誤りがあり、特にモデル機能のミスマッチした一般化を利用する攻撃の影響を受けやすい。
OMNIGUARDは,言語やモダリティにまたがる有害なプロンプトを検出する手法である。
提案手法は,多言語環境において最強のベースラインよりも11.57%,有害なプロンプト分類精度を向上する。
論文 参考訳(メタデータ) (2025-05-29T05:25:27Z) - Multilingual Email Phishing Attacks Detection using OSINT and Machine Learning [0.0]
本稿では、オープンソースのインテリジェンス(OSINT)ツールと機械学習(ML)モデルを統合して、多言語データセット間のフィッシング検出を強化する。
NmapとTheHarvesterを用いて、ドメイン名、IPアドレス、オープンポートを含む17の機能を抽出し、検出精度を向上した。
論文 参考訳(メタデータ) (2025-01-15T11:05:25Z) - Leveraging Cross-Attention Transformer and Multi-Feature Fusion for Cross-Linguistic Speech Emotion Recognition [60.58049741496505]
音声感情認識(SER)は、人間とコンピュータの相互作用を強化する上で重要な役割を担っている。
本稿では,HuBERT,MFCC,および韻律特性を組み合わせたHuMP-CATを提案する。
HMP-CATは、ターゲットデータセットから少量の音声でソースモデルを微調整することにより、平均78.75%の精度が得られることを示す。
論文 参考訳(メタデータ) (2025-01-06T14:31:25Z) - Sharif-MGTD at SemEval-2024 Task 8: A Transformer-Based Approach to Detect Machine Generated Text [2.2039952888743253]
MGTは自然言語処理において重要な研究領域となっている。
本研究では,強力なニューラルアーキテクチャであるRoBERTaベーストランスを微調整し,MGT検出に対処する効果について検討する。
提案システムでは,テストデータセットの78.9%の精度を達成し,参加者の57位に位置づけた。
論文 参考訳(メタデータ) (2024-07-16T14:33:01Z) - Mast Kalandar at SemEval-2024 Task 8: On the Trail of Textual Origins: RoBERTa-BiLSTM Approach to Detect AI-Generated Text [7.959800630494841]
SemEval 2024は、マルチジェネレータ、マルチドメイン、マルチ言語ブラックボックスマシン生成テキスト検出のタスクを導入している。
本稿では,テキストをAI生成か人間かの2つのカテゴリに分類するために,RoBERTa-BiLSTMに基づく分類器を提案する。
私たちのアーキテクチャは、125の内、80.83の正確さで、公式のリーダーボードで46位でした。
論文 参考訳(メタデータ) (2024-07-03T10:22:23Z) - Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - Fine-Tuning Llama 2 Large Language Models for Detecting Online Sexual
Predatory Chats and Abusive Texts [2.406214748890827]
本稿では,Llama 2 7B-パラメーターモデルを用いて,オンライン性的捕食チャットと虐待言語の検出手法を提案する。
我々は、異なる大きさ、不均衡度、言語(英語、ローマ・ウルドゥー語、ウルドゥー語)のデータセットを用いてLLMを微調整する。
実験結果から,提案手法は3つの異なるデータセットに対して精度よく一貫した性能を示す。
論文 参考訳(メタデータ) (2023-08-28T16:18:50Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。