論文の概要: Cyberbullying Detection Using Deep Neural Network from Social Media
Comments in Bangla Language
- arxiv url: http://arxiv.org/abs/2106.04506v1
- Date: Tue, 8 Jun 2021 16:47:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 19:06:27.899326
- Title: Cyberbullying Detection Using Deep Neural Network from Social Media
Comments in Bangla Language
- Title(参考訳): バングラ語におけるソーシャルメディアコメントからのディープニューラルネットワークによるサイバブリング検出
- Authors: Md Faisal Ahmed, Zalish Mahmud, Zarin Tasnim Biash, Ahmed Ann Noor
Ryen, Arman Hossain, Faisal Bin Ashraf
- Abstract要約: 我々は,ベンガル語におけるいじめ表現検出のためのハイブリッドニューラルネットワークを用いた二分分類モデルと多クラス分類モデルを提案する。
我々は、人気のある公開Facebookページからの44,001人のユーザーコメントを使用しており、これは、Non-bully、Sexual、Threat、Troll、Religiousの5つのクラスに分類される。
私たちのバイナリ分類モデルでは,87.91%の精度が得られていますが,マルチクラス分類のためのニューラルネットワーク後のアンサンブル手法を導入すれば,85%の精度が得られます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cyberbullying or Online harassment detection on social media for various
major languages is currently being given a good amount of focus by researchers
worldwide. Being the seventh most speaking language in the world and increasing
usage of online platform among the Bengali speaking people urge to find
effective detection technique to handle the online harassment. In this paper,
we have proposed binary and multiclass classification model using hybrid neural
network for bully expression detection in Bengali language. We have used 44,001
users comments from popular public Facebook pages, which fall into five classes
- Non-bully, Sexual, Threat, Troll and Religious. We have examined the
performance of our proposed models from different perspective. Our binary
classification model gives 87.91% accuracy, whereas introducing ensemble
technique after neural network for multiclass classification, we got 85%
accuracy.
- Abstract(参考訳): さまざまな主要言語のソーシャルメディア上でのサイバーいじめやオンラインハラスメントの検出が、世界中の研究者から注目されている。
ベンガル語話者の間では、世界で7番目の言語であり、オンラインプラットフォームの利用が増加しているため、オンラインハラスメントに対処する効果的な検出手法を見出す必要がある。
本稿では,ベンガル語におけるいじめ表現検出のためのハイブリッドニューラルネットワークを用いたバイナリ・マルチクラス分類モデルを提案する。
私たちは、人気のfacebookページから44,001人のユーザーのコメントを、非いじめ、性的、脅威、トロール、宗教の5つのクラスに分類した。
我々は,提案するモデルの性能を異なる視点から検討した。
二分分類モデルは87.91%の精度を示すが,多クラス分類ではニューラルネットワークの後にアンサンブル手法を導入すると85%の精度が得られる。
関連論文リスト
- Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - Deep Learning Based Cyberbullying Detection in Bangla Language [0.0]
本研究は,ベンガルのサイバーいじめを識別する深層学習戦略を実証する。
2層双方向長短期メモリ(Bi-LSTM)モデルが構築され、サイバーいじめを識別する。
論文 参考訳(メタデータ) (2024-01-07T04:58:59Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Cyberbullying Detection for Low-resource Languages and Dialects: Review
of the State of the Art [0.9831489366502298]
この論文では、バングラ語、ヒンディー語、ドラヴィダ語など、23の低資源言語と方言がカバーされている。
本調査では,サイバーいじめの信頼性定義の欠如を含む,過去の研究における研究ギャップのいくつかを明らかにした。
これらの提案に基づき,バングラのチタゴニア方言におけるサイバーいじめデータセットを収集,公開する。
論文 参考訳(メタデータ) (2023-08-30T03:52:28Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Hate Speech and Offensive Language Detection in Bengali [5.765076125746209]
我々は、5Kの実際のツイートと5Kのロマンティックなベンガルツイートからなる10Kのベンガルポストの注釈付きデータセットを開発する。
このような憎しみのあるポストの分類のためのベースラインモデルをいくつか実装する。
また、分類性能を高めるための言語間移動機構についても検討する。
論文 参考訳(メタデータ) (2022-10-07T12:06:04Z) - You Don't Know My Favorite Color: Preventing Dialogue Representations
from Revealing Speakers' Private Personas [44.82330540456883]
簡単なニューラルネットワークを用いて話者のペルソナを高精度に推定可能であることを示す。
提案する防衛目標が,攻撃精度を37.6%から0.5%に大幅に低減できることを示すため,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-04-26T09:36:18Z) - Bangla hate speech detection on social media using attention-based
recurrent neural network [2.1349209400003932]
この記事では、Facebookページ上のユーザのBengaliコメントを分類するために、NLPで人気のツールであるエンコーダデコーダベースの機械学習モデルを提案する。
7つの異なるカテゴリーのヘイトスピーチからなる7,425のBengaliコメントのデータセットを使用して、モデルをトレーニングし、評価した。
3つのエンコーダデコーダアルゴリズムのうち、アテンションベースのデコーダが最も精度が高い(77%)。
論文 参考訳(メタデータ) (2022-03-31T03:31:53Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Coarse and Fine-Grained Hostility Detection in Hindi Posts using Fine
Tuned Multilingual Embeddings [4.3012765978447565]
敵意検出タスクは、英語のようなリソースに富む言語でよく研究されているが、Hindidueのようなリソースに制約のある言語では探索されていない。
ヒンディー語投稿における敵意検出に有効なニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2021-01-13T11:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。