論文の概要: Beating Harmful Stereotypes Through Facts: RAG-based Counter-speech Generation
- arxiv url: http://arxiv.org/abs/2510.12316v1
- Date: Tue, 14 Oct 2025 09:20:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.267576
- Title: Beating Harmful Stereotypes Through Facts: RAG-based Counter-speech Generation
- Title(参考訳): ファクトによる有害ステレオタイプを打つ:RAGに基づく対音声生成
- Authors: Greta Damo, Elena Cabrio, Serena Villata,
- Abstract要約: 本稿では,音声対音声生成を知識ワイドテキスト生成プロセスとしてモデル化する新しいフレームワークを提案する。
我々のフレームワークは、先進的なレトリーバル拡張生成(RAG)パイプラインを統合し、8つの主要なターゲットグループに対する信頼性の高い対音声の生成を保証する。
我々は、MultiTarget-CONANデータセットを使用して、標準メトリクスと人的評価の両方を通して、生成した反音声の品質を実証的に評価する。
- 参考スコア(独自算出の注目度): 10.488285141408253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counter-speech generation is at the core of many expert activities, such as fact-checking and hate speech, to counter harmful content. Yet, existing work treats counter-speech generation as pure text generation task, mainly based on Large Language Models or NGO experts. These approaches show severe drawbacks due to the limited reliability and coherence in the generated countering text, and in scalability, respectively. To close this gap, we introduce a novel framework to model counter-speech generation as knowledge-wise text generation process. Our framework integrates advanced Retrieval-Augmented Generation (RAG) pipelines to ensure the generation of trustworthy counter-speech for 8 main target groups identified in the hate speech literature, including women, people of colour, persons with disabilities, migrants, Muslims, Jews, LGBT persons, and other. We built a knowledge base over the United Nations Digital Library, EUR-Lex and the EU Agency for Fundamental Rights, comprising a total of 32,792 texts. We use the MultiTarget-CONAN dataset to empirically assess the quality of the generated counter-speech, both through standard metrics (i.e., JudgeLM) and a human evaluation. Results show that our framework outperforms standard LLM baselines and competitive approach, on both assessments. The resulting framework and the knowledge base pave the way for studying trustworthy and sound counter-speech generation, in hate speech and beyond.
- Abstract(参考訳): カウンター音声生成は、有害なコンテンツに対抗するために、ファクトチェックやヘイトスピーチなどの多くの専門家活動の中核にある。
しかし,既存の研究は,大言語モデルやNGOの専門家を中心に,反音声生成を純粋テキスト生成タスクとして扱う。
これらの手法は、生成した対向テキストの信頼性とコヒーレンスに制限があるため、それぞれスケーラビリティに深刻な欠点を示す。
このギャップを埋めるために、我々は対音声生成を知識ワイドテキスト生成プロセスとしてモデル化する新しいフレームワークを導入する。
本枠組みは,女性,有色人種,障害者,移民,ムスリム,ユダヤ人,LGBTなど,ヘイトスピーチ文学で特定される8つの主要なターゲットグループに対して,信頼に値する対音声の生成を確保するために,先進的検索・拡張世代(RAG)パイプラインを統合している。
我々は、国連デジタルライブラリー、EUR-Lex、EU基本権庁に知識基盤を構築し、合計32,792通のテキストを作成した。
我々は、MultiTarget-CONANデータセットを使用して、標準メトリクス(ジャッジLM)と人間の評価の両方を通じて、生成した対音声の品質を実証的に評価する。
その結果,本フレームワークは両評価において,標準LLMベースラインと競争的アプローチよりも優れていた。
得られた枠組みと知識基盤は、ヘイトスピーチなどにおいて、信頼に値する、健全な反音声生成を研究するための道を開く。
関連論文リスト
- Speech-IFEval: Evaluating Instruction-Following and Quantifying Catastrophic Forgetting in Speech-Aware Language Models [49.1574468325115]
本稿では,命令追従能力を評価するための評価フレームワークであるSpeech-IFevalを紹介する。
近年のSLMは,音声認識を大規模言語モデル (LLM) と統合し,音声中心の訓練によるテキスト能力の低下を招いている。
以上の結果から, SLM はテキストベースの LLM よりもはるかに高い性能を示し, 基本命令にも耐え難いことが示唆された。
論文 参考訳(メタデータ) (2025-05-25T08:37:55Z) - PANDA -- Paired Anti-hate Narratives Dataset from Asia: Using an LLM-as-a-Judge to Create the First Chinese Counterspeech Dataset [3.8227015675440192]
現代標準中国語の流行にもかかわらず、中国語の対訳資源は事実上存在しない。
中国本土でヘイトスピーチと戦うことに焦点を当てたコーパスを紹介する。
論文 参考訳(メタデータ) (2025-01-01T01:56:32Z) - Towards Unsupervised Speech Recognition Without Pronunciation Models [57.222729245842054]
本稿では,ペア音声とテキストコーパスを使わずにASRシステムを開発するという課題に取り組む。
音声合成とテキスト・テキスト・マスクによるトークン埋込から教師なし音声認識が実現可能であることを実験的に実証した。
この革新的なモデルは、レキシコンフリー環境下での以前の教師なしASRモデルの性能を上回る。
論文 参考訳(メタデータ) (2024-06-12T16:30:58Z) - Outcome-Constrained Large Language Models for Countering Hate Speech [10.434435022492723]
本研究は,会話結果に制約された反音声を生成する手法を開発することを目的とする。
我々は,大言語モデル(LLM)を用いて,テキスト生成プロセスに2つの望ましい会話結果を導入する実験を行った。
評価結果から,提案手法が望まれる結果に対して効果的に対応できることが示唆された。
論文 参考訳(メタデータ) (2024-03-25T19:44:06Z) - Intent-conditioned and Non-toxic Counterspeech Generation using Multi-Task Instruction Tuning with RLAIF [14.2594830589926]
オンラインヘイトスピーチに対する反応として定義されているCounterspeechは、非センセーショナルソリューションとしてますます利用されている。
ヘイトフルステートメントにおける社会的バイアスの背景にある実践的意味をモデル化し,反音声生成を促進させる新しいフレームワークであるCoARLを紹介した。
CoARLの最初の2つのフェーズは、連続的なマルチインストラクションチューニング、インテント、反応、攻撃的ステートメントの害を理解するためのモデルを教えること、そしてインテント条件付き逆音声を生成するためのタスク固有の低ランクアダプタ重みを学習することである。
論文 参考訳(メタデータ) (2024-03-15T08:03:49Z) - PROXYQA: An Alternative Framework for Evaluating Long-Form Text Generation with Large Language Models [72.57329554067195]
ProxyQAは、長文生成を評価するための革新的なフレームワークである。
さまざまなドメインにまたがる詳細なヒューマンキュレートされたメタクエストで構成されており、それぞれに事前にアノテートされた回答を持つ特定のプロキシクエストが伴っている。
プロキシクエリに対処する際の評価器の精度を通じて、生成されたコンテンツの品質を評価する。
論文 参考訳(メタデータ) (2024-01-26T18:12:25Z) - Adversarial GLUE: A Multi-Task Benchmark for Robustness Evaluation of
Language Models [86.02610674750345]
AdvGLUE(Adversarial GLUE)は、様々な種類の敵攻撃の下で、現代の大規模言語モデルの脆弱性を調査し評価するための新しいマルチタスクベンチマークである。
GLUEタスクに14の逆攻撃手法を適用してAdvGLUEを構築する。
テストしたすべての言語モデルとロバストなトレーニングメソッドは、AdvGLUEではパフォーマンスが悪く、スコアは明確な精度よりもはるかに遅れています。
論文 参考訳(メタデータ) (2021-11-04T12:59:55Z) - Towards Language Modelling in the Speech Domain Using Sub-word
Linguistic Units [56.52704348773307]
音節や音素を含む言語単位に基づくLSTMに基づく新しい生成音声LMを提案する。
限られたデータセットでは、現代の生成モデルで要求されるものよりも桁違いに小さいので、我々のモデルはバブリング音声を近似する。
補助的なテキストLM,マルチタスク学習目標,補助的な調音特徴を用いた訓練の効果を示す。
論文 参考訳(メタデータ) (2021-10-31T22:48:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。