Fugu-MT 論文翻訳(概要): Assisted Counterspeech Writing at the Crossroads of Hate Speech and Misinformation

論文の概要: Assisted Counterspeech Writing at the Crossroads of Hate Speech and Misinformation

arxiv url: http://arxiv.org/abs/2605.22435v1
Date: Thu, 21 May 2026 13:02:08 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-22 16:35:42.262813
Title: Assisted Counterspeech Writing at the Crossroads of Hate Speech and Misinformation
Title（参考訳）: ヘイトスピーチと誤報のクロスロードにおける対音声文字の合成支援
Authors: Genoveffa Martone, Helena Bonaldi, Marco Guerini,
Abstract要約: ヘイトスピーチと誤報はオンラインでしばしば共起し、偏見と偏見を増幅する。規模を考えると、専門家の反撃を支援するためにLarge Language Modelsを使用していることが注目されている。我々は、憎悪と誤情報の両方が共起する文脈でCS生成を研究することによって、このギャップを埋める。
参考スコア（独自算出の注目度）: 9.965670989893267
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Hate speech and misinformation frequently co-occur online, amplifying prejudice and polarization. Given their scale, using Large Language Models (LLMs) to assist expert counterspeech (CS) writing has gained interest, yet prior work has addressed these phenomena separately. We bridge this gap by studying CS generation in contexts where both hate and misinformation co-occur. We test three knowledge-driven generation strategies: first we prompt an LLM with fact-checkers' guidelines and fact-checking articles; secondly, with NGOs' guidelines and reports; thirdly, we create a mixed strategy that combines guidelines and documents from both. 23 experts revise the generated CS, which are assessed via human and automatic metrics. While LLMs produce adequate CS in 40% of cases, expert edits substantially improve naturalness, exhaustiveness, and adherence to guidelines. Based on the post-edited CS, the mixed strategy proves to be the most effective in crowdsourcing evaluation, pairing strong factual correction with stereotype mitigation and empathetic engagement. We release a dataset of hateful and misinformed claims with expert-verified CS and supporting knowledge.
Abstract（参考訳）: ヘイトスピーチと誤報はオンラインでしばしば共起し、偏見と偏見を増幅する。大規模言語モデル (LLMs) を用いて専門家の対音声(CS) 作成を支援する手法が注目されているが、先行研究ではこれらの現象に別々に対処している。我々は、憎悪と誤情報の両方が共起する文脈でCS生成を研究することによって、このギャップを埋める。まず、ファクトチェッカーのガイドラインとファクトチェッカーの記事、次にNGOのガイドラインとレポート、そして第3に、ガイドラインと文書を組み合わせた混合戦略を作成します。 23人の専門家が生成されたCSを改訂し、人間と自動メトリクスで評価する。 LLMは40%のケースで適切なCSを生成するが、専門家による編集は自然性、徹底性、ガイドラインの遵守性を著しく改善する。この混合戦略は, クラウドソーシング評価において最も有効であることが証明され, ステレオタイプ緩和と共感的エンゲージメントとを組み合わせた。我々は、専門家が検証したCSと知識のサポートを備えた、憎悪と誤記のクレームのデータセットをリリースする。

関連論文リスト

When AI reviews science: Can we trust the referee? [73.47745294608072]
私たちは、トレーニングとデータ検索、デスクレビュー、深いレビュー、反論、システムレベルといった、レビューライフサイクル全体のアタックをマップします。評価スコアに高名度フレーミング, 断定力, 反抗薬効, 文脈中毒の因果効果を分離するために, 2つの高度なLCMベースの審判を用いた。
論文参考訳（メタデータ） (2026-04-26T08:03:32Z)
Passing the Turing Test in Political Discourse: Fine-Tuning LLMs to Mimic Polarized Social Media Comments [0.0]
本研究では、微調整された大言語モデル(LLM)が、偏光言説を再現し増幅できる範囲について検討する。 Redditから抽出された政治的に課金された議論のキュレートされたデータセットを使用して、オープンソースのLCMを微調整して、コンテキスト認識とイデオロギー的に整合した応答を生成します。結果は、パルチザンのデータに基づいてトレーニングすると、LLMは高い信頼性と挑発的なコメントを生成でき、しばしば人間によって書かれたものと区別できないことを示唆している。
論文参考訳（メタデータ） (2025-06-17T15:41:26Z)
Profiling News Media for Factuality and Bias Using LLMs and the Fact-Checking Methodology of Human Experts [29.95198868148809]
本稿では,プロのファクトチェッカーがアウトレット全体の事実と政治的偏見を評価するために使用する基準をエミュレートする新しい手法を提案する。メディアの人気と地域がモデル性能に与える影響を詳細に分析する。
論文参考訳（メタデータ） (2025-06-14T15:49:20Z)
ThinkEval: Practical Evaluation of Knowledge Leakage in LLM Editing using Thought-based Knowledge Graphs [3.9295613363026174]
モデル編集における間接的知識漏洩とリップル効果を定量化するフレームワークであるThinkEvalを提案する。 ThinkEvalは、編集前後の事実の因果構造を分析するために、専門知識グラフを構築し、採用する。我々はAlphaEdit, RECT, ROME, MEMIT, PRUNEの5つの編集技術を評価する。
論文参考訳（メタデータ） (2025-06-02T07:24:12Z)
Evaluating Implicit Bias in Large Language Models by Attacking From a Psychometric Perspective [66.34066553400108]
我々は、ある人口層に対する大きな言語モデルの暗黙の偏見を厳格に評価する。心理測定の原則にインスパイアされた我々は,3つの攻撃的アプローチ,すなわち,軽視,軽視,指導を提案する。提案手法は,LLMの内部バイアスを競合ベースラインよりも効果的に引き出すことができる。
論文参考訳（メタデータ） (2024-06-20T06:42:08Z)
Countering Misinformation via Emotional Response Generation [15.383062216223971]
ソーシャルメディアプラットフォーム(SMP)における誤情報拡散は、公衆衛生、社会的結束、民主主義に重大な危険をもたらす。これまでの研究では、社会的訂正が誤情報を抑制する効果的な方法であることが示された。約1万のクレーム応答対からなる最初の大規模データセットであるVerMouthを提案する。
論文参考訳（メタデータ） (2023-11-17T15:37:18Z)
Context-faithful Prompting for Large Language Models [51.194410884263135]
大言語モデル(LLM)は世界事実に関するパラメトリック知識を符号化する。パラメトリック知識への依存は、文脈的手がかりを見落とし、文脈に敏感なNLPタスクにおいて誤った予測をもたらす可能性がある。我々は, LLMの文脈的忠実度を, 知識の衝突と, 棄権による予測の2つの側面で評価し, 向上する。
論文参考訳（メタデータ） (2023-03-20T17:54:58Z)
Generating Counter Narratives against Online Hate Speech: Data and Strategies [21.098614110697184]
本稿では,憎悪に対する回答を効果的に収集する方法について検討する。銀データ生成には GPT-2 などの大規模教師なし言語モデルを用いる。最高のアノテーション戦略/神経アーキテクチャは、専門家のバリデーション/ポスト編集の前にデータフィルタリングに使用できる。
論文参考訳（メタデータ） (2020-04-08T19:35:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。