論文の概要: Chinese Cyberbullying Detection: Dataset, Method, and Validation
- arxiv url: http://arxiv.org/abs/2505.20654v1
- Date: Tue, 27 May 2025 03:03:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.370486
- Title: Chinese Cyberbullying Detection: Dataset, Method, and Validation
- Title(参考訳): 中国のサイバーいじめ検出:データセット、方法、検証
- Authors: Yi Zhu, Xin Zou, Xindong Wu,
- Abstract要約: 本稿では,インシデントによって編成されたサイバーいじめデータセットを構築するための新しいアノテーション手法を提案する。
構築されたCHNCIは、91件のインシデントで220,676件のコメントからなる、最初の中国のサイバーいじめインシデント検出データセットである。
実験の結果,構築したデータセットは,サイバーバブル検出とインシデント予測のタスクのベンチマークとなることが示された。
- 参考スコア(独自算出の注目度): 19.261209838897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing cyberbullying detection benchmarks were organized by the polarity of speech, such as "offensive" and "non-offensive", which were essentially hate speech detection. However, in the real world, cyberbullying often attracted widespread social attention through incidents. To address this problem, we propose a novel annotation method to construct a cyberbullying dataset that organized by incidents. The constructed CHNCI is the first Chinese cyberbullying incident detection dataset, which consists of 220,676 comments in 91 incidents. Specifically, we first combine three cyberbullying detection methods based on explanations generation as an ensemble method to generate the pseudo labels, and then let human annotators judge these labels. Then we propose the evaluation criteria for validating whether it constitutes a cyberbullying incident. Experimental results demonstrate that the constructed dataset can be a benchmark for the tasks of cyberbullying detection and incident prediction. To the best of our knowledge, this is the first study for the Chinese cyberbullying incident detection task.
- Abstract(参考訳): 既存のサイバーいじめ検出ベンチマークは、基本的には音声検出を嫌う「攻撃的」や「非攻撃的」のような音声の極性によって組織された。
しかし、現実の世界では、サイバーいじめは事件を通じて広く社会の注目を集めた。
この問題に対処するために,インシデントによって編成されたサイバーいじめデータセットを構築するための新しいアノテーション手法を提案する。
構築されたCHNCIは、91件のインシデントで220,676件のコメントからなる、最初の中国のサイバーいじめインシデント検出データセットである。
具体的には、まず、説明生成に基づく3つのサイバーブロッキング検出手法をアンサンブル法として組み合わせて擬似ラベルを生成し、そのラベルを人間のアノテータに判断させる。
次に,サイバーいじめ事件を構成するかどうかを検証するための評価基準を提案する。
実験の結果,構築したデータセットは,サイバーバブル検出とインシデント予測のタスクのベンチマークとなることが示された。
私たちの知る限りでは、これは中国のサイバーいじめインシデント検出タスクの最初の研究だ。
関連論文リスト
- Detecting harassment and defamation in cyberbullying with emotion-adaptive training [10.769252194833625]
サイバーいじめはデニグレーションやハラスメントなどの様々な形態を含み、有名人がしばしば直面する。
まず、ハラスメントと非難という2つの異なるタイプのインシデントを含む有名人のサイバーいじめデータセットを開発する。
本稿では,感情検出領域からサイバーいじめ検出領域への知識伝達を支援する感情適応トレーニングフレームワーク(EAT)を提案する。
論文 参考訳(メタデータ) (2025-01-28T13:15:07Z) - Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - Fact-Saboteurs: A Taxonomy of Evidence Manipulation Attacks against
Fact-Verification Systems [80.3811072650087]
証拠のクレームサレントスニペットを微調整し,多様かつクレームアラインな証拠を生成することが可能であることを示す。
この攻撃は、主張のポストホックな修正に対しても堅牢である。
これらの攻撃は、インスペクタブルとヒューマン・イン・ザ・ループの使用シナリオに有害な影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2022-09-07T13:39:24Z) - DISARM: Detecting the Victims Targeted by Harmful Memes [49.12165815990115]
DISARMは、有害なミームを検出するために名前付きエンティティ認識と個人識別を使用するフレームワークである。
DISARMは10の単一モーダル・マルチモーダルシステムより著しく優れていることを示す。
複数の強力なマルチモーダルライバルに対して、有害なターゲット識別の相対誤差率を最大9ポイントまで下げることができる。
論文 参考訳(メタデータ) (2022-05-11T19:14:26Z) - Zero-Query Transfer Attacks on Context-Aware Object Detectors [95.18656036716972]
敵は、ディープニューラルネットワークが誤った分類結果を生成するような摂動画像を攻撃する。
自然の多目的シーンに対する敵対的攻撃を防御するための有望なアプローチは、文脈整合性チェックを課すことである。
本稿では,コンテキスト整合性チェックを回避可能な,コンテキスト整合性攻撃を生成するための最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-29T04:33:06Z) - In the Service of Online Order: Tackling Cyber-Bullying with Machine
Learning and Affect Analysis [13.092135222168324]
PTA(Parent-Teacher Association)のメンバーは、Webフォーラムやブログ内で悪意のあるコンテンツを見つけるためにオンラインパトロールを開始した。
実践において、オンライン・パトロールは、手作業で行うのが困難な作業であるWebコンテンツ全体を読み取ることを前提としている。
我々は、悪意のあるエントリを自動的に検出し、それらをPTAメンバーに報告できるツールセットを開発することを目指している。
論文 参考訳(メタデータ) (2022-03-04T03:13:45Z) - Comparative Performance of Machine Learning Algorithms in Cyberbullying
Detection: Using Turkish Language Preprocessing Techniques [0.0]
本研究の目的は,サイバーブロッキングを含むトルコ語メッセージの検出において,異なる機械学習アルゴリズムの性能を比較することである。
Light Gradient Boosting Model (LGBM)アルゴリズムは90.788%の精度と90.949%のF1スコアで最高の性能を示した。
論文 参考訳(メタデータ) (2021-01-29T18:28:44Z) - Enhancing the Identification of Cyberbullying through Participant Roles [1.399948157377307]
本稿では,ロールモデリングによるサイバーバブル検出の高度化に向けた新しいアプローチを提案する。
我々は、ASKfmからのデータセットを利用してマルチクラス分類を行い、参加者の役割を検出する。
論文 参考訳(メタデータ) (2020-10-13T19:13:07Z) - Witches' Brew: Industrial Scale Data Poisoning via Gradient Matching [56.280018325419896]
Data Poisoning攻撃は、トレーニングデータを変更して、そのようなデータでトレーニングされたモデルを悪意を持って制御する。
我々は「スクラッチから」と「クリーンラベルから」の両方である特に悪意のある毒物攻撃を分析します。
フルサイズで有毒なImageNetデータセットをスクラッチからトレーニングした現代のディープネットワークにおいて、ターゲットの誤分類を引き起こすのは、これが初めてであることを示す。
論文 参考訳(メタデータ) (2020-09-04T16:17:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。