論文の概要: Comparative Performance of Machine Learning Algorithms in Cyberbullying
Detection: Using Turkish Language Preprocessing Techniques
- arxiv url: http://arxiv.org/abs/2101.12718v1
- Date: Fri, 29 Jan 2021 18:28:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 08:53:37.837822
- Title: Comparative Performance of Machine Learning Algorithms in Cyberbullying
Detection: Using Turkish Language Preprocessing Techniques
- Title(参考訳): サイバーバブル検出における機械学習アルゴリズムの比較性能:トルコ語前処理技術を用いて
- Authors: Emre Cihan Ates, Erkan Bostanci, Mehmet Serdar Guzel
- Abstract要約: 本研究の目的は,サイバーブロッキングを含むトルコ語メッセージの検出において,異なる機械学習アルゴリズムの性能を比較することである。
Light Gradient Boosting Model (LGBM)アルゴリズムは90.788%の精度と90.949%のF1スコアで最高の性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increasing use of the internet and social media, it is obvious that
cyberbullying has become a major problem. The most basic way for protection
against the dangerous consequences of cyberbullying is to actively detect and
control the contents containing cyberbullying. When we look at today's internet
and social media statistics, it is impossible to detect cyberbullying contents
only by human power. Effective cyberbullying detection methods are necessary in
order to make social media a safe communication space. Current research efforts
focus on using machine learning for detecting and eliminating cyberbullying.
Although most of the studies have been conducted on English texts for the
detection of cyberbullying, there are few studies in Turkish. Limited methods
and algorithms were also used in studies conducted on the Turkish language. In
addition, the scope and performance of the algorithms used to classify the
texts containing cyberbullying is different, and this reveals the importance of
using an appropriate algorithm. The aim of this study is to compare the
performance of different machine learning algorithms in detecting Turkish
messages containing cyberbullying. In this study, nineteen different
classification algorithms were used to identify texts containing cyberbullying
using Turkish natural language processing techniques. Precision, recall,
accuracy and F1 score values were used to evaluate the performance of
classifiers. It was determined that the Light Gradient Boosting Model (LGBM)
algorithm showed the best performance with 90.788% accuracy and 90.949% F1
Score value.
- Abstract(参考訳): インターネットやソーシャルメディアの利用が増えるにつれ、サイバーいじめが大きな問題になっていることは明らかだ。
サイバーいじめの危険な結果から保護するための最も基本的な方法は、サイバーいじめを含むコンテンツを積極的に検出し制御することである。
今日のインターネットとソーシャルメディアの統計を見ると、人間の力だけでサイバーいじめの内容を検出することは不可能です。
ソーシャルメディアを安全な通信空間にするためには,効果的なサイバーいじめ検出手法が必要である。
現在の研究は、サイバーバブルの検出と排除に機械学習を使うことに焦点を当てている。
ほとんどの研究は、サイバーいじめの検出のために英語のテキストで行われているが、トルコ語での研究はほとんどない。
限定的な方法とアルゴリズムは、トルコ語の研究にも用いられた。
さらに、サイバーいじめを含むテキストの分類に使用されるアルゴリズムの範囲と性能が異なるため、適切なアルゴリズムを使用することの重要性が明らかになる。
本研究の目的は,サイバーいじめを含むトルコのメッセージの検出における,異なる機械学習アルゴリズムの性能を比較することである。
本研究では,トルコの自然言語処理技術を用いて,サイバーいじめを含むテキストを識別するために,19種類の分類アルゴリズムを用いた。
分類器の性能評価には,精度,リコール,精度,F1スコア値が用いられた。
Light Gradient Boosting Model (LGBM)アルゴリズムは90.788%の精度と90.949%のF1スコアで最高の性能を示した。
関連論文リスト
- Deep Learning Approaches for Detecting Adversarial Cyberbullying and Hate Speech in Social Networks [0.0]
本稿では、ソーシャルネットワークサイトテキストデータ中の敵対的攻撃コンテンツにおけるサイバーいじめの検出、特にヘイトスピーチを強調することに焦点を当てる。
100の固定エポックを持つLSTMモデルは、高い精度、精度、リコール、F1スコア、AUC-ROCスコアが87.57%、88.73%、88.15%、91%の顕著な性能を示した。
論文 参考訳(メタデータ) (2024-05-30T21:44:15Z) - Securing Social Spaces: Harnessing Deep Learning to Eradicate Cyberbullying [1.8749305679160366]
サイバーいじめは ソーシャルメディアを使う人の心身の健康を害する深刻な問題だ
本稿は、サイバーいじめがいかに深刻か、そしてそれが被曝した個人にどのように影響するかを説明する。
オンライン空間の安全性を高めるために、より優れたサイバーいじめ検出方法を見つけることがいかに重要かを強調している。
論文 参考訳(メタデータ) (2024-04-01T20:41:28Z) - Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - DEMASQ: Unmasking the ChatGPT Wordsmith [63.8746084667206]
そこで本研究では,ChatGPT生成内容を正確に識別する効果的なChatGPT検出器DEMASQを提案する。
提案手法は, 人為的, 機械的, 人為的, 人為的, 機械的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人為的, 人
論文 参考訳(メタデータ) (2023-11-08T21:13:05Z) - Cyberbullying Detection for Low-resource Languages and Dialects: Review
of the State of the Art [0.9831489366502298]
この論文では、バングラ語、ヒンディー語、ドラヴィダ語など、23の低資源言語と方言がカバーされている。
本調査では,サイバーいじめの信頼性定義の欠如を含む,過去の研究における研究ギャップのいくつかを明らかにした。
これらの提案に基づき,バングラのチタゴニア方言におけるサイバーいじめデータセットを収集,公開する。
論文 参考訳(メタデータ) (2023-08-30T03:52:28Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - In the Service of Online Order: Tackling Cyber-Bullying with Machine
Learning and Affect Analysis [13.092135222168324]
PTA(Parent-Teacher Association)のメンバーは、Webフォーラムやブログ内で悪意のあるコンテンツを見つけるためにオンラインパトロールを開始した。
実践において、オンライン・パトロールは、手作業で行うのが困難な作業であるWebコンテンツ全体を読み取ることを前提としている。
我々は、悪意のあるエントリを自動的に検出し、それらをPTAメンバーに報告できるツールセットを開発することを目指している。
論文 参考訳(メタデータ) (2022-03-04T03:13:45Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Enhancing the Identification of Cyberbullying through Participant Roles [1.399948157377307]
本稿では,ロールモデリングによるサイバーバブル検出の高度化に向けた新しいアプローチを提案する。
我々は、ASKfmからのデータセットを利用してマルチクラス分類を行い、参加者の役割を検出する。
論文 参考訳(メタデータ) (2020-10-13T19:13:07Z) - TextHide: Tackling Data Privacy in Language Understanding Tasks [54.11691303032022]
TextHideは、トレーニングを遅くしたり、精度を下げることなく、プライバシー上のリスクを軽減する。
すべての参加者は、盗聴攻撃者がプライベートテキストデータを復元するのを防ぐために、簡単な暗号化ステップを追加する必要がある。
我々は、GLUEベンチマーク上でTextHideを評価し、TextHideが共有勾配や表現に対する攻撃を効果的に防御できることを示す。
論文 参考訳(メタデータ) (2020-10-12T22:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。