論文の概要: A Fusion of context-aware based BanglaBERT and Two-Layer Stacked LSTM Framework for Multi-Label Cyberbullying Detection
- arxiv url: http://arxiv.org/abs/2602.22449v1
- Date: Wed, 25 Feb 2026 22:24:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.43262
- Title: A Fusion of context-aware based BanglaBERT and Two-Layer Stacked LSTM Framework for Multi-Label Cyberbullying Detection
- Title(参考訳): コンテキスト認識型BanglaBERTと2層重ねLSTMフレームワークの融合によるマルチラベルサイバーバブル検出
- Authors: Mirza Raquib, Asif Pervez Polok, Kedar Nath Biswas, Rahat Uddin Azad, Saydul Akbar Murad, Nick Rahimi,
- Abstract要約: 本稿では,BanglaBERT-Largeと2層積み重ねLSTMを組み合わせた融合アーキテクチャを提案する。
我々はそれらの振る舞いを分析し、コンテキストとシーケンスを共同でモデル化する。
評価には、精度、精度、リコール、F1スコア、ハミングロス、Cohens kappa、AUC-ROCなど、複数のメトリクスを使用する。
- 参考スコア(独自算出の注目度): 2.0524609401792397
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cyberbullying has become a serious and growing concern in todays virtual world. When left unnoticed, it can have adverse consequences for social and mental health. Researchers have explored various types of cyberbullying, but most approaches use single-label classification, assuming that each comment contains only one type of abuse. In reality, a single comment may include overlapping forms such as threats, hate speech, and harassment. Therefore, multilabel detection is both realistic and essential. However, multilabel cyberbullying detection has received limited attention, especially in low-resource languages like Bangla, where robust pre-trained models are scarce. Developing a generalized model with moderate accuracy remains challenging. Transformers offer strong contextual understanding but may miss sequential dependencies, while LSTM models capture temporal flow but lack semantic depth. To address these limitations, we propose a fusion architecture that combines BanglaBERT-Large with a two-layer stacked LSTM. We analyze their behavior to jointly model context and sequence. The model is fine-tuned and evaluated on a publicly available multilabel Bangla cyberbullying dataset covering cyberbully, sexual harassment, threat, and spam. We apply different sampling strategies to address class imbalance. Evaluation uses multiple metrics, including accuracy, precision, recall, F1-score, Hamming loss, Cohens kappa, and AUC-ROC. We employ 5-fold cross-validation to assess the generalization of the architecture.
- Abstract(参考訳): サイバーいじめは、今日のバーチャルワールドにおいて深刻な関心事となりつつある。
意識を失った場合、社会的および精神的な健康に悪影響を及ぼす可能性がある。
研究者は様々なタイプのサイバーいじめを調査してきたが、ほとんどのアプローチでは、それぞれのコメントが1つのタイプの悪用しか含まないと仮定して、シングルラベルの分類を使用する。
実際には、1つのコメントには、脅威、ヘイトスピーチ、ハラスメントなど、重複するフォームが含まれる可能性がある。
したがって、マルチラベル検出は現実的かつ必須である。
しかし、特に堅牢な事前学習モデルが少ないバングラのような低リソース言語では、マルチラベルのサイバーバブル検出が注目されている。
適度な精度で一般化されたモデルを開発することは依然として困難である。
トランスフォーマーは強いコンテキスト理解を提供するが、シーケンシャルな依存関係を欠く可能性がある。
これらの制約に対処するため,BanglaBERT-Largeと2層重ねLSTMを組み合わせた融合アーキテクチャを提案する。
我々はそれらの振る舞いを分析し、コンテキストとシーケンスを共同でモデル化する。
このモデルは、サイバーバブル、セクシャルハラスメント、脅威、スパムをカバーした、公開されているマルチラベルのBanglaサイバーバブルデータセットで微調整され、評価されている。
クラス不均衡に対処するために異なるサンプリング戦略を適用する。
評価には、精度、精度、リコール、F1スコア、ハミングロス、Cohens kappa、AUC-ROCなど、複数のメトリクスを使用する。
アーキテクチャの一般化を評価するために、5倍のクロスバリデーションを採用している。
関連論文リスト
- SEMA: Simple yet Effective Learning for Multi-Turn Jailbreak Attacks [53.97948802255959]
本稿では,既存の戦略や外部データに頼ることなく,マルチターン攻撃者を訓練するフレームワークを提案する。
準備された自己調整は、非拒否的で、よく構造化された、多ターンの逆のプロンプトを微調整することで、使用可能なロールアウトを可能にする。
私たちは、意図の整合性、コンプライアンスリスク、詳細レベルを組み合わせたインテントドリフト対応の報酬を通じて、多ターンジェイルブレイクにおける有害な意図を保ちます。
論文 参考訳(メタデータ) (2026-02-06T16:44:57Z) - Enhanced Arabic-language cyberbullying detection: deep embedding and transformer (BERT) approaches [0.0]
アラビア語のサイバーいじめを検出する方法は少ない。
本稿では,アラビア語コンテンツにおけるサイバーいじめの検出方法の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2025-10-02T17:20:02Z) - Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.16354555208417]
PADとFFDはそれぞれ物理メディアベースのプレゼンテーションアタックとデジタル編集ベースのDeepFakeから顔データを保護するために提案されている。
これら2つのカテゴリの攻撃を同時に処理する統一顔攻撃検出モデルがないことは、主に2つの要因に起因する。
本稿では,異なる意味空間から複数の分類基準を適応的に探索する,視覚言語モデルに基づく階層型プロンプトチューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T16:35:45Z) - Detecting harassment and defamation in cyberbullying with emotion-adaptive training [10.769252194833625]
サイバーいじめはデニグレーションやハラスメントなどの様々な形態を含み、有名人がしばしば直面する。
まず、ハラスメントと非難という2つの異なるタイプのインシデントを含む有名人のサイバーいじめデータセットを開発する。
本稿では,感情検出領域からサイバーいじめ検出領域への知識伝達を支援する感情適応トレーニングフレームワーク(EAT)を提案する。
論文 参考訳(メタデータ) (2025-01-28T13:15:07Z) - The Use of a Large Language Model for Cyberbullying Detection [0.0]
サイバーいじめ(CB)は、今日のサイバー世界で最も多い現象である。
これは市民の精神的および身体的健康に対する深刻な脅威である。
これにより、オンラインフォーラム、ブログ、ソーシャルメディアプラットフォームからいじめコンテンツを防ぐ堅牢なシステムを開発する必要が生じる。
論文 参考訳(メタデータ) (2024-02-06T15:46:31Z) - Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - A Trustable LSTM-Autoencoder Network for Cyberbullying Detection on
Social Media Using Synthetic Data [2.378735224874938]
本稿では,ソーシャルメディア上でのサイバーバブル検出のための信頼性の高いLSTM-Autoencoderネットワークを提案する。
我々は、機械翻訳データを生成することにより、データの可用性の難しさに対処する最先端の手法を実証した。
我々はヒンディー語、バングラ語、英語のデータセットに対するアグレッシブなコメントを実験的に同定した。
論文 参考訳(メタデータ) (2023-08-15T17:20:05Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Analysing Cyberbullying using Natural Language Processing by
Understanding Jargon in Social Media [4.932130498861987]
本稿では,さまざまなソーシャルメディアプラットフォームからのデータセットの組み合わせを用いて,バイナリ分類について検討する。
我々は,Bi-LSTM,GloVe,BERTなどの最先端モデルなど複数のモデルを用いて実験を行い,スラング悪用コーパスを導入して独自の前処理手法を適用した。
論文 参考訳(メタデータ) (2021-04-23T04:20:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。