論文の概要: Multiclass Hate Speech Detection with RoBERTa-OTA: Integrating Transformer Attention and Graph Convolutional Networks
- arxiv url: http://arxiv.org/abs/2603.04414v1
- Date: Tue, 03 Feb 2026 23:14:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.191336
- Title: Multiclass Hate Speech Detection with RoBERTa-OTA: Integrating Transformer Attention and Graph Convolutional Networks
- Title(参考訳): RoBERTa-OTAを用いたマルチクラスヘイト音声検出:変圧器の注意とグラフ畳み込みネットワークの統合
- Authors: Mahmoud Abusaqer, Jamil Saquer,
- Abstract要約: 文脈言語理解とドメイン固有の意味知識を統合したRoBERTa-OTAを提案する。
RoBERTa-OTAの精度は96.04%、標準のRoBERTaは95.02%である。
ジェンダーベースのヘイトスピーチ検出は2.36ポイント改善され、他のヘイトスピーチカテゴリーは2.38ポイント改善されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiclass hate speech detection across demographic categories remains computationally challenging due to implicit targeting strategies and linguistic variability in social media content. Existing approaches rely solely on learned representations from training data, without explicitly incorporating structured ontological frameworks that can enhance classification through formal domain knowledge integration. We propose RoBERTa-OTA, which introduces ontology-guided attention mechanisms that process textual features alongside structured knowledge representations through enhanced Graph Convolutional Networks. The architecture combines RoBERTa embeddings with scaled attention layers and graph neural networks to integrate contextual language understanding with domain-specific semantic knowledge. Evaluation across 39,747 balanced samples using 5-fold cross-validation demonstrates significant performance gains over baseline RoBERTa implementations and existing state-of-the-art methods. RoBERTa-OTA achieves 96.04\% accuracy compared to 95.02\% for standard RoBERTa, with substantial improvements for challenging categories: gender-based hate speech detection improves by 2.36 percentage points while other hate speech categories improve by 2.38 percentage points. The enhanced architecture maintains computational efficiency with only 0.33\% parameter overhead, providing practical advantages for large-scale content moderation applications requiring fine-grained demographic hate speech classification.
- Abstract(参考訳): 階層的カテゴリーにわたるマルチクラスヘイトスピーチの検出は、暗黙的なターゲティング戦略とソーシャルメディアコンテンツにおける言語的多様性のために、計算的に困難である。
既存のアプローチは、形式的なドメイン知識の統合を通じて分類を強化することができる構造化オントロジフレームワークを明示的に組み込むことなく、トレーニングデータから学んだ表現にのみ依存する。
グラフ畳み込みネットワークを拡張して構造化知識表現とともにテキスト特徴を処理するオントロジー誘導型アテンション機構を導入したRoBERTa-OTAを提案する。
このアーキテクチャはRoBERTa埋め込みとスケールした注意層とグラフニューラルネットワークを組み合わせて、コンテキスト言語理解とドメイン固有の意味知識を統合する。
5倍のクロスバリデーションを用いた39,747個のバランスの取れたサンプルの評価は,RoBERTa実装や既存の最先端手法よりも顕著な性能向上を示した。
RoBERTa-OTA は標準のRoBERTa の 95.02\% と比較して96.04\% の精度を達成し、難解なカテゴリーでは、ジェンダーベースのヘイトスピーチ検出が 2.36 ポイント改善され、他のヘイトスピーチカテゴリは 2.38 ポイント改善されている。
拡張されたアーキテクチャはパラメータオーバーヘッドがわずか 0.33 % の計算効率を維持しており、人口統計学的ヘイトスピーチの分類を必要とする大規模コンテンツモデレーションアプリケーションに実用的な利点を提供する。
関連論文リスト
- Improving Hate Speech Classification with Cross-Taxonomy Dataset Integration [0.0]
この研究は、単一のフレームワーク内で幅広い定義を検出することができる普遍的な分類法とヘイトスピーチ分類法を導入している。
我々のアプローチは、2つの広く使われているが異なる注釈付きデータセットを組み合わせることで検証される。
この研究は、ヘイトスピーチの検出を推進し、効率を向上し、コンテキスト間の広範な適用性を確保する上で、データセットと分類学の統合の可能性を強調している。
論文 参考訳(メタデータ) (2025-03-07T12:01:02Z) - A Unified Multi-Task Learning Architecture for Hate Detection Leveraging User-Based Information [23.017068553977982]
ヘイトスピーチ、攻撃的言語、攻撃性、人種差別、性差別、その他の虐待的言語は、ソーシャルメディアでよく見られる現象である。
ヘイトコンテンツを大規模にフィルタリングする人工知能(AI)ベースの介入が必要である。
本稿では,ユーザ内およびユーザ間情報を活用することで,英語のヘイトスピーチ識別を改善するユニークなモデルを提案する。
論文 参考訳(メタデータ) (2024-11-11T10:37:11Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - On Guiding Visual Attention with Language Specification [76.08326100891571]
注意をそらすのではなく,タスク関連機能に分類証拠を限定するためのアドバイスとして,ハイレベルな言語仕様を用いる。
この方法で空間的注意を監督することは、偏りのあるノイズのあるデータを用いた分類タスクの性能を向上させる。
論文 参考訳(メタデータ) (2022-02-17T22:40:19Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Spatio-temporal Relation Modeling for Few-shot Action Recognition [100.3999454780478]
本稿では,高次時間表現を同時に学習しながら,クラス固有の特徴の識別性を向上する数ショットアクション認識フレームワークSTRMを提案する。
本手法は,本研究でもっとも優れた手法に比べて,分類精度が3.5%向上した。
論文 参考訳(メタデータ) (2021-12-09T18:59:14Z) - Learning Efficient Representations for Keyword Spotting with Triplet
Loss [0.0]
3重項損失に基づく埋め込みと分類のためのkNNの変種の組み合わせにより、LibriSpeech由来データセット上の畳み込みネットワークの分類精度が大幅に向上することを示した。
また、現在のGoogle Speech CommandsデータセットV2 10+2クラスの分類と、約6倍のコンパクトなアーキテクチャを一致させ、Google Speech CommandsデータセットV2の35クラスの分類で現在の最高のSOTAを改善します。
論文 参考訳(メタデータ) (2021-01-12T22:55:17Z) - Handling Class Imbalance in Low-Resource Dialogue Systems by Combining
Few-Shot Classification and Interpolation [19.988400064884825]
低リソース対話システムにおける発話分類性能は、クラスラベルにおける必然的に高いデータ不均衡によって制約される。
本稿では,発話表現に数発の分類機能を導入し,発話表現を非依存にすることでデータを増強する,エンドツーエンドのペアワイズ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-28T17:05:24Z) - Constructing interval variables via faceted Rasch measurement and
multitask deep learning: a hate speech application [63.10266319378212]
本稿では,教師付き深層学習と多面的ラッシュアイテム応答理論(IRT)構築手法を組み合わせることで,連続区間スペクトル上の複素変数を測定する手法を提案する。
われわれは、YouTube、Twitter、Redditから5万件のソーシャルメディアコメントを収集し、1万1000人の米国拠点のAmazon Mechanical Turkの労働者によってラベル付けされたデータセット上で、この新しい手法を実証した。
論文 参考訳(メタデータ) (2020-09-22T02:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。