論文の概要: Multilingual Hate Speech Detection and Counterspeech Generation: A Comprehensive Survey and Practical Guide
- arxiv url: http://arxiv.org/abs/2603.19279v1
- Date: Sun, 01 Mar 2026 21:26:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.829481
- Title: Multilingual Hate Speech Detection and Counterspeech Generation: A Comprehensive Survey and Practical Guide
- Title(参考訳): 多言語ヘイト音声検出と対音声生成:包括的調査と実践的指針
- Authors: Zahra Safdari Fesaghandis, Suman Kalyan Maity,
- Abstract要約: 本稿では,多言語ヘイトスピーチ検出と対音声生成のための包括的調査と実践的ガイドを提案する。
非英語とコード混在の文脈でモノリンガルシステムが失敗する理由を分析し、暗黙の憎しみと文化的に特有の表現を欠いている。
- 参考スコア(独自算出の注目度): 0.07646713951724012
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Combating online hate speech in multilingual settings requires approaches that go beyond English-centric models and capture the cultural and linguistic diversity of global online discourse. This paper presents a comprehensive survey and practical guide to multilingual hate speech detection and counterspeech generation, integrating recent advances in natural language processing. We analyze why monolingual systems often fail in non-English and code-mixed contexts, missing implicit hate and culturally specific expressions. To address these challenges, we outline a structured three-phase framework - task design, data curation, and evaluation - drawing on state-of-the-art datasets, models, and metrics. The survey consolidates progress in multilingual resources and techniques while highlighting persistent obstacles, including data scarcity in low-resource languages, fairness and bias in system development, and the need for multimodal solutions. By bridging technical progress with ethical and cultural considerations, we provide researchers, practitioners, and policymakers with scalable guidelines for building context-aware, inclusive systems. Our roadmap contributes to advancing online safety through fairer, more effective detection and counterspeech generation across diverse linguistic environments.
- Abstract(参考訳): オンラインヘイトスピーチを多言語で会話するには、英語中心のモデルを超えて、グローバルなオンライン談話の文化的・言語的な多様性を捉えなければならない。
本稿では,多言語ヘイトスピーチの検出と対音声生成に関する包括的調査と実践的ガイドを行い,近年の自然言語処理の進歩を統合する。
非英語とコード混在の文脈でモノリンガルシステムが失敗する理由を分析し、暗黙の憎しみと文化的に特有の表現を欠いている。
これらの課題に対処するために、構造化された3段階のフレームワーク - タスク設計、データキュレーション、評価 - を、最先端のデータセット、モデル、メトリクスに描画する。
この調査は、低リソース言語におけるデータの不足、システム開発における公正性とバイアス、マルチモーダルソリューションの必要性など、永続的な障害を強調しながら、多言語リソースとテクニックの進歩を集約する。
倫理的・文化的考察で技術的進歩をブリッジすることで、研究者、実践者、政策立案者に、文脈に配慮した包括的システムを構築するためのスケーラブルなガイドラインを提供する。
我々のロードマップは、多様な言語環境におけるより公平で効果的な検出と対音声生成によるオンライン安全性の向上に寄与する。
関連論文リスト
- From No to Know: Taxonomy, Challenges, and Opportunities for Negation Understanding in Multimodal Foundation Models [48.68342037881584]
否定は、欠如、否定、矛盾を含む言語構造であり、多言語多モーダル基盤モデルにとって重要な課題である。
本稿では, 否定構造を包括的に分類し, 構造的, 意味的, 文化的要因がマルチモーダル基盤モデルにどのように影響するかを考察する。
我々は、特別なベンチマーク、言語固有のトークン化、きめ細かい注意機構、高度なマルチモーダルアーキテクチャを提唱する。
論文 参考訳(メタデータ) (2025-02-10T16:55:13Z) - Monolingual and Multilingual Misinformation Detection for Low-Resource Languages: A Comprehensive Survey [2.5459710368096586]
誤報は言語境界を超越し、モデレーションシステムに挑戦する。
誤情報検出に対するほとんどのアプローチはモノリンガルであり、高リソース言語に焦点を当てている。
この調査は、低リソース言語における誤情報検出に関する現在の研究の概要を概観する。
論文 参考訳(メタデータ) (2024-10-24T03:02:03Z) - A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers [51.8203871494146]
LLM(Large Language Models)の急速な開発は、自然言語処理における顕著な多言語機能を示している。
LLMのブレークスルーにもかかわらず、多言語シナリオの研究は依然として不十分である。
本調査は,多言語問題に対する研究コミュニティの取り組みを支援することを目的としており,LLMに基づく多言語自然言語処理における中核概念,鍵技術,最新の発展の包括的理解を提供する。
論文 参考訳(メタデータ) (2024-05-17T17:47:39Z) - Chinese Offensive Language Detection:Current Status and Future Directions [2.1357786131968637]
本稿では,中国語における攻撃的言語検出について概観し,現在のベンチマークとアプローチについて検討する。
本調査の主な目的は,既存の技術を探究し,今後の研究の道筋を明らかにすることである。
論文 参考訳(メタデータ) (2024-03-27T07:34:44Z) - Overcoming Language Disparity in Online Content Classification with
Multimodal Learning [22.73281502531998]
大規模言語モデルは、テキスト検出と分類タスクのための最先端のソリューションを開発するための標準となっている。
高度な計算技術と資源の開発は、英語に不相応に焦点が当てられている。
マルチモーダル機械学習を用いて画像に含まれる情報を統合するという約束を探求する。
論文 参考訳(メタデータ) (2022-05-19T17:56:02Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。