論文の概要: SCCD: A Session-based Dataset for Chinese Cyberbullying Detection
- arxiv url: http://arxiv.org/abs/2501.15042v1
- Date: Sat, 25 Jan 2025 02:56:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:57:28.803403
- Title: SCCD: A Session-based Dataset for Chinese Cyberbullying Detection
- Title(参考訳): SCCD:中国のサイバーいじめ検出のためのセッションベースデータセット
- Authors: Qingpo Yang, Yakai Chen, Zihui Xu, Yu-ming Shang, Sanchuan Guo, Xi Zhang,
- Abstract要約: 我々は,主要なソーシャルメディアプラットフォームであるWeiboから得られたセッションレベルの677のサンプルからなる,SCCDと呼ばれる,中国の新しいサイバーいじめデータセットを提示する。
セッション内の各コメントは、従来のバイナリクラスラベルではなく、きめ細かいラベルで注釈付けされている。
SCCDにおける各種ベースライン法の性能評価を行い,中国における効果的なサイバーバブル検出の課題を浮き彫りにした。
- 参考スコア(独自算出の注目度): 8.142559562070554
- License:
- Abstract: The rampant spread of cyberbullying content poses a growing threat to societal well-being. However, research on cyberbullying detection in Chinese remains underdeveloped, primarily due to the lack of comprehensive and reliable datasets. Notably, no existing Chinese dataset is specifically tailored for cyberbullying detection. Moreover, while comments play a crucial role within sessions, current session-based datasets often lack detailed, fine-grained annotations at the comment level. To address these limitations, we present a novel Chinese cyber-bullying dataset, termed SCCD, which consists of 677 session-level samples sourced from a major social media platform Weibo. Moreover, each comment within the sessions is annotated with fine-grained labels rather than conventional binary class labels. Empirically, we evaluate the performance of various baseline methods on SCCD, highlighting the challenges for effective Chinese cyberbullying detection.
- Abstract(参考訳): サイバーいじめコンテンツの普及は、社会的幸福への脅威を増大させる。
しかし、中国におけるサイバーバブル検出の研究は、主に包括的で信頼性の高いデータセットが欠如しているため、未発達のままである。
特に、既存の中国のデータセットは、サイバーバブル検出用に特別に調整されていない。
さらに、セッション内でコメントが重要な役割を果たす一方で、現在のセッションベースのデータセットには、コメントレベルで詳細な詳細なアノテーションが欠如していることが多い。
これらの制限に対処するため,主要なソーシャルメディアプラットフォームであるWeiboから得られた677のセッションレベルサンプルからなる,SCCDと呼ばれる,中国の新たなサイバー膨らみデータセットを提案する。
さらに、セッション内の各コメントは、従来のバイナリクラスラベルではなく、きめ細かいラベルで注釈付けされている。
SCCDにおける各種ベースライン法の性能を実証的に評価し,中国における効果的なサイバーバブル検出の課題を浮き彫りにした。
関連論文リスト
- ASVspoof 5: Crowdsourced Speech Data, Deepfakes, and Adversarial Attacks at Scale [59.25180900687571]
ASVspoof 5は、音声スプーフとディープフェイク攻撃の研究を促進する一連の課題の第5版である。
本稿では,2つの課題トラック,新しいデータベース,評価指標,評価プラットフォームについて述べる。
論文 参考訳(メタデータ) (2024-08-16T13:37:20Z) - A Multi-faceted Semi-Synthetic Dataset for Automated Cyberbullying
Detection [0.0]
本稿では,広範な半合成サイバーバブルデータセットについて述べる。
攻撃性、反復性、対人関係、害の意図など、サイバーいじめの本質的な側面をすべて取り入れている。
この付随するデータ記事では、データセットを詳細に見て、透明性を高め、レプリケーションを可能にする。
論文 参考訳(メタデータ) (2024-02-09T16:53:19Z) - Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - When a Language Question Is at Stake. A Revisited Approach to Label
Sensitive Content [0.0]
記事では、ロシアとウクライナの戦争を取り上げたウクライナのツイートの例について、疑似ラベル付き機密データのアプローチを再検討する。
得られたデータを統計的に解析し、擬似ラベリングに使用するモデルの評価を行い、さらにそのコーパスの活用方法についてのガイドラインを定めている。
論文 参考訳(メタデータ) (2023-11-17T13:35:10Z) - Cyberbullying Detection for Low-resource Languages and Dialects: Review
of the State of the Art [0.9831489366502298]
この論文では、バングラ語、ヒンディー語、ドラヴィダ語など、23の低資源言語と方言がカバーされている。
本調査では,サイバーいじめの信頼性定義の欠如を含む,過去の研究における研究ギャップのいくつかを明らかにした。
これらの提案に基づき,バングラのチタゴニア方言におけるサイバーいじめデータセットを収集,公開する。
論文 参考訳(メタデータ) (2023-08-30T03:52:28Z) - Session-based Cyberbullying Detection in Social Media: A Survey [16.39344929765961]
問題のさまざまなステップと課題をカプセル化したセッションベースのサイバーバブル検出フレームワークを定義します。
我々は,セッションベースのサイバーいじめデータセットを作成するための一連のベストプラクティスのエビデンスベースの基準を提案する。
論文 参考訳(メタデータ) (2022-07-14T18:56:54Z) - Learning-based Hybrid Local Search for the Hard-label Textual Attack [53.92227690452377]
我々は,攻撃者が予測ラベルにのみアクセス可能な,滅多に調査されていないが厳格な設定,すなわちハードラベル攻撃を考える。
そこで本研究では,Learning-based Hybrid Local Search (LHLS)アルゴリズムという,新たなハードラベル攻撃を提案する。
我々のLHLSは、攻撃性能と敵の品質に関する既存のハードラベル攻撃を著しく上回っている。
論文 参考訳(メタデータ) (2022-01-20T14:16:07Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z) - HENIN: Learning Heterogeneous Neural Interaction Networks for
Explainable Cyberbullying Detection on Social Media [11.443698975923176]
本稿では,サイバーバブル検出のための新しいディープモデルであるヘテロジニアス・ニューラル・インタラクション・ネットワーク(HENIN)を提案する。
HENINには、コメントエンコーダ、コミット後のコアテンションサブネットワーク、セッションセッションとポストのインタラクション抽出器が含まれる。
論文 参考訳(メタデータ) (2020-10-09T13:44:34Z) - Cross-ethnicity Face Anti-spoofing Recognition Challenge: A Review [79.49390241265337]
Chalearn Face Anti-Spoofing Detection Challengeは、シングルモーダル(例えば、RGB)とマルチモーダル(例えば、RGB、Depth、赤外線(IR))のトラックで構成されている。
本稿では,その設計,評価プロトコル,結果の概要など,課題の概要について述べる。
論文 参考訳(メタデータ) (2020-04-23T06:43:08Z) - Leveraging Multi-Source Weak Social Supervision for Early Detection of
Fake News [67.53424807783414]
ソーシャルメディアは、人々が前例のない速度でオンライン活動に参加することを可能にする。
この制限のないアクセスは、誤情報や偽ニュースの拡散を悪化させ、その緩和のために早期に検出されない限り混乱と混乱を引き起こす可能性がある。
ソーシャルエンゲージメントからの弱い信号とともに、限られた量のクリーンデータを活用して、メタラーニングフレームワークでディープニューラルネットワークをトレーニングし、さまざまな弱いインスタンスの品質を推定します。
実世界のデータセットの実験では、提案されたフレームワークは、予測時にユーザーエンゲージメントを使わずに、フェイクニュースを早期に検出するための最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-04-03T18:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。