論文の概要: Assessing Text Classification Methods for Cyberbullying Detection on Social Media Platforms
- arxiv url: http://arxiv.org/abs/2412.19928v1
- Date: Fri, 27 Dec 2024 21:22:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:05:36.565506
- Title: Assessing Text Classification Methods for Cyberbullying Detection on Social Media Platforms
- Title(参考訳): ソーシャルメディアプラットフォーム上でのサイバーいじめ検出のためのテキスト分類手法の評価
- Authors: Adamu Gaston Philipo, Doreen Sebastian Sarwatt, Jianguo Ding, Mahmoud Daneshmand, Huansheng Ning,
- Abstract要約: 本研究は,サイバーバブル検出領域における既存のテキスト分類手法を適応し,評価することを目的とする。
BERT、RoBERTa、XLNet、DistilBERT、GPT-2.0など、大規模な言語モデルの活用と評価に重点を置いている。
その結果,BERTは性能,時間効率,計算資源のバランスを保っていることがわかった。
- 参考スコア(独自算出の注目度): 3.235558067839701
- License:
- Abstract: Cyberbullying significantly contributes to mental health issues in communities by negatively impacting the psychology of victims. It is a prevalent problem on social media platforms, necessitating effective, real-time detection and monitoring systems to identify harmful messages. However, current cyberbullying detection systems face challenges related to performance, dataset quality, time efficiency, and computational costs. This research aims to conduct a comparative study by adapting and evaluating existing text classification techniques within the cyberbullying detection domain. The study specifically evaluates the effectiveness and performance of these techniques in identifying cyberbullying instances on social media platforms. It focuses on leveraging and assessing large language models, including BERT, RoBERTa, XLNet, DistilBERT, and GPT-2.0, for their suitability in this domain. The results show that BERT strikes a balance between performance, time efficiency, and computational resources: Accuracy of 95%, Precision of 95%, Recall of 95%, F1 Score of 95%, Error Rate of 5%, Inference Time of 0.053 seconds, RAM Usage of 35.28 MB, CPU/GPU Usage of 0.4%, and Energy Consumption of 0.000263 kWh. The findings demonstrate that generative AI models, while powerful, do not consistently outperform fine-tuned models on the tested benchmarks. However, state-of-the-art performance can still be achieved through strategic adaptation and fine-tuning of existing models for specific datasets and tasks.
- Abstract(参考訳): サイバーいじめは、被害者の心理に悪影響を及ぼすことによって、地域社会のメンタルヘルス問題に大きく貢献する。
ソーシャルメディアプラットフォームでは、有害なメッセージを特定するために、効果的でリアルタイムな検知と監視システムが必要である。
しかし、現在のサイバーバブル検出システムは、性能、データセットの品質、時間効率、計算コストに関連する課題に直面している。
本研究は,サイバーバブル検出領域内の既存のテキスト分類手法を適応し,評価することにより比較研究を行うことを目的とする。
本研究は,ソーシャルメディアプラットフォーム上でのサイバーいじめ事例の特定において,これらの手法の有効性と性能を特に評価する。
BERT、RoBERTa、XLNet、DistilBERT、GPT-2.0といった大きな言語モデルの活用と評価に重点を置いている。
その結果、BERTは性能、時間効率、計算資源のバランスを保ち、95%の精度、95%の精度、95%のF1スコア、5%の誤差率、0.053秒の推論時間、35.28MBのRAM使用量、0.4%のCPU/GPU使用量、0.000263kWhのエネルギー消費であることがわかった。
この結果は、生成AIモデルは強力ではあるが、テストされたベンチマークで微調整されたモデルよりも一貫して優れているわけではないことを示している。
しかし、現在のパフォーマンスは、特定のデータセットやタスクに対する既存のモデルの戦略的適応と微調整によって達成できる。
関連論文リスト
- Identifying Cyberbullying Roles in Social Media [3.5568310805420427]
サイバーいじめ事件に関与している個人の役割を正確に検出し、この問題を大規模に効果的に解決することが重要である。
本研究では,サイバーバブルの相互作用に関わる役割を検出する機械学習モデルについて検討する。
論文 参考訳(メタデータ) (2024-12-21T00:46:48Z) - Scalable and Effective Negative Sample Generation for Hyperedge Prediction [55.9298019975967]
ハイパーエッジ予測は、Webベースのアプリケーションにおける複雑なマルチエンタリティ相互作用を理解するために不可欠である。
従来の手法では、正と負のインスタンスの不均衡により、高品質な負のサンプルを生成するのが困難であることが多い。
本稿では,これらの課題に対処するために拡散モデルを利用するハイパーエッジ予測(SEHP)フレームワークのスケーラブルで効果的な負のサンプル生成について述べる。
論文 参考訳(メタデータ) (2024-11-19T09:16:25Z) - The Surprising Effectiveness of Test-Time Training for Abstract Reasoning [64.36534512742736]
モデル推論能力向上のためのメカニズムとして,テストタイムトレーニング(TTT)の有効性を検討する。
TTTはARCタスクのパフォーマンスを大幅に改善し、ベースとなる微調整モデルと比較して最大6倍の精度向上を実現した。
本研究は,ニューラルネットワークモデルにおける抽象的推論改善の道筋として,明示的な記号探索が唯一の道ではないことを示唆している。
論文 参考訳(メタデータ) (2024-11-11T18:59:45Z) - Optimizing Transformer based on high-performance optimizer for predicting employment sentiment in American social media content [9.49688045612671]
本稿では,Swarmインテリジェンス最適化アルゴリズムに基づくTransformerモデルの改良を行い,雇用関係のテキストコンテンツの感情を予測することを目的とする。
トレーニング期間中、モデルの精度は49.27%から82.83%に徐々に上昇し、損失値は0.67から0.35に低下した。
本稿では、ソーシャルメディア上での雇用関連テキストにおける感情認識の精度の向上だけでなく、重要な実践的意義も挙げる。
論文 参考訳(メタデータ) (2024-10-09T03:14:05Z) - How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open Models [95.44559524735308]
大規模言語またはマルチモーダルモデルに基づく検証は、偽コンテンツや有害コンテンツの拡散を緩和するためのオンラインポリシングメカニズムをスケールアップするために提案されている。
我々は,知識伝達の初期研究を通じて,継続的な更新を行うことなく基礎モデルの性能向上の限界をテストする。
最近の2つのマルチモーダルなファクトチェックベンチマークであるMochegとFakedditの結果は、知識伝達戦略がファクドディットのパフォーマンスを最先端よりも1.7%向上し、Mochegのパフォーマンスを2.9%向上させることができることを示唆している。
論文 参考訳(メタデータ) (2024-06-29T08:39:07Z) - Deep Learning Approaches for Detecting Adversarial Cyberbullying and Hate Speech in Social Networks [0.0]
本稿では、ソーシャルネットワークサイトテキストデータ中の敵対的攻撃コンテンツにおけるサイバーいじめの検出、特にヘイトスピーチを強調することに焦点を当てる。
100の固定エポックを持つLSTMモデルは、高い精度、精度、リコール、F1スコア、AUC-ROCスコアが87.57%、88.73%、88.15%、91%の顕著な性能を示した。
論文 参考訳(メタデータ) (2024-05-30T21:44:15Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - Robust Trajectory Prediction against Adversarial Attacks [84.10405251683713]
ディープニューラルネットワーク(DNN)を用いた軌道予測は、自律運転システムにおいて不可欠な要素である。
これらの手法は敵の攻撃に対して脆弱であり、衝突などの重大な結果をもたらす。
本研究では,敵対的攻撃に対する軌道予測モデルを保護するための2つの重要な要素を同定する。
論文 参考訳(メタデータ) (2022-07-29T22:35:05Z) - DAPPER: Label-Free Performance Estimation after Personalization for
Heterogeneous Mobile Sensing [95.18236298557721]
DAPPER(Domain AdaPtation Performance EstimatoR)を提案する。
実世界の6つのベースラインと比較した4つのセンシングデータセットによる評価の結果,DAPPERの精度は39.8%向上した。
論文 参考訳(メタデータ) (2021-11-22T08:49:33Z) - Bayesian Active Learning for Wearable Stress and Affect Detection [0.7106986689736827]
デバイス上での深層学習アルゴリズムによるストレス検出は、広汎なコンピューティングの進歩により増加傾向にある。
本稿では,ベイズニューラルネットワークの近似によるモデル不確実性を表現可能なフレームワークを提案する。
提案手法は, 提案手法により, 推定時の効率を著しく向上し, 獲得したプール点数がかなり少なくなる。
論文 参考訳(メタデータ) (2020-12-04T16:19:37Z) - Multi-Stage Optimized Machine Learning Framework for Network Intrusion
Detection [8.26773636337474]
本稿では,MLに基づく新しい多段階最適化NIDSフレームワークを提案する。
検出性能を維持しながら計算複雑性を低減する。
提案したフレームワークは、必要なトレーニングサンプルサイズ(最大74%)と機能セットサイズ(最大50%)を著しく削減する。
論文 参考訳(メタデータ) (2020-08-09T03:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。