Fugu-MT 論文翻訳(概要): Assessing the Human Likeness of AI-Generated Counterspeech

論文の概要: Assessing the Human Likeness of AI-Generated Counterspeech

arxiv url: http://arxiv.org/abs/2410.11007v2
Date: Sun, 15 Dec 2024 21:07:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-17 15:49:59.044881
Title: Assessing the Human Likeness of AI-Generated Counterspeech
Title（参考訳）: AIによる対人音声の人間的類似性の評価
Authors: Xiaoying Song, Sujana Mamidisetty, Eduardo Blanco, Lingzi Hong,
Abstract要約: 本稿では,AI生成音声の人間的類似性について検討する。 LLMベースの生成戦略の実装と評価を行う。言語的特徴、丁寧さ、特異性の違いを明らかにする。
参考スコア（独自算出の注目度）: 10.434435022492723
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Counterspeech is a targeted response to counteract and challenge abusive or hateful content. It effectively curbs the spread of hatred and fosters constructive online communication. Previous studies have proposed different strategies for automatically generated counterspeech. Evaluations, however, focus on relevance, surface form, and other shallow linguistic characteristics. This paper investigates the human likeness of AI-generated counterspeech, a critical factor influencing effectiveness. We implement and evaluate several LLM-based generation strategies, and discover that AI-generated and human-written counterspeech can be easily distinguished by both simple classifiers and humans. Further, we reveal differences in linguistic characteristics, politeness, and specificity. The dataset used in this study is publicly available for further research.
Abstract（参考訳）: Counterspeechは、悪質なコンテンツやヘイトフルコンテンツに対する反則と挑戦に対するターゲット的反応である。憎しみの拡散を効果的に抑制し、建設的なオンラインコミュニケーションを促進する。従来の研究では、自動生成音声に対する様々な戦略が提案されている。しかし、評価は、関連性、表面形態、その他の浅い言語的特徴に焦点を当てている。本稿では,AI生成音声の人間的類似性,有効性に影響を与える重要な要因について検討する。我々は,LLMに基づく複数の生成戦略の実装と評価を行い,単純な分類器と人間の両方でAI生成と人書きの逆音声を容易に区別できることを発見した。さらに,言語的特徴,丁寧さ,特異性の違いも明らかにした。この研究で使用されるデータセットは、さらなる研究のために公開されている。

関連論文リスト

Algorithmic Fairness in NLP: Persona-Infused LLMs for Human-Centric Hate Speech Detection [0.0]
本研究では,多言語モデル(Persona-LLM)とアノテータペルソナのパーソナライズが,ヘイトスピーチに対する感受性にどのように影響するかを検討する。我々は,Google の Gemini と OpenAI の GPT-4.1-mini モデルと 2 つのペルソナプロンプト手法を採用している。社会デマトグラフィーの属性をLLMに組み込むことで、ヘイトスピーチの自動検出におけるバイアスに対処できることを示す。
論文参考訳（メタデータ） (2025-10-22T07:48:57Z)
SpeechRole: A Large-Scale Dataset and Benchmark for Evaluating Speech Role-Playing Agents [52.29009595100625]
ロールプレイングエージェントは、パーソナライズされた相互作用と感情共鳴を達成するための有望なパラダイムとして登場した。既存の研究は主にテキストのモダリティに焦点を当て、現実的な対話的なシナリオにおける音声の重要な次元を無視している。我々は,98の多様な役割と112kの音声ベースの1ターン・マルチターン会話からなる大規模かつ高品質なデータセットであるSpeechRole-Dataを構築した。
論文参考訳（メタデータ） (2025-08-04T03:18:36Z)
Hateful Person or Hateful Model? Investigating the Role of Personas in Hate Speech Detection by Large Language Models [47.110656690979695]
本稿では,ヘイトスピーチ分類におけるペルソナプロンプトの役割に関する総合的研究について紹介する。人間による注釈調査では、MBTIの寸法がラベル付け行動に大きく影響していることが確認されている。分析の結果,人間関係の相違,対人関係の相違,対人関係の偏り,対人関係の偏りなどが明らかとなった。
論文参考訳（メタデータ） (2025-06-10T09:02:55Z)
Who Writes What: Unveiling the Impact of Author Roles on AI-generated Text Detection [44.05134959039957]
本稿では,社会言語学的属性・ジェンダー,CEFR習熟度,学術分野,言語環境に影響を及ぼすAIテキスト検出装置について検討する。 CEFRの習熟度と言語環境は一貫して検出器の精度に影響を与え,性別や学術分野は検出器に依存した効果を示した。これらの発見は、特定の人口集団に不公平に罰を与えるのを避けるために、社会的に認識されたAIテキストの検出が不可欠であることを示している。
論文参考訳（メタデータ） (2025-02-18T07:49:31Z)
Contextualized Counterspeech: Strategies for Adaptation, Personalization, and Evaluation [2.1944577276732726]
本研究では,モデレーションコンテキストに適応し,適度なユーザ向けにパーソナライズされたコーディネート音声を生成するための戦略を提案し,評価する。以上の結果から, 文脈的反音声は, 精度と説得力において, 最先端の一般音声よりも有意に優れることが示された。コンテンツモデレーションにおける、文脈化されたAI生成の逆音声の有効性と、人間とアルゴリズムによる評価の相違は、人間とAIの協調の増大の重要性を浮き彫りにする。
論文参考訳（メタデータ） (2024-12-10T09:29:52Z)
Is Safer Better? The Impact of Guardrails on the Argumentative Strength of LLMs in Hate Speech Countering [22.594296353433855]
我々は、よりコジェントな応答を生成するために、対音声生成の2つの側面に焦点を当てる。まず、安全ガードレールの存在が世代の品質を損なうかどうかを検証する。第二に、ヘイトスピーチの特定の要素を攻撃することが、オンラインヘイトと戦うためのより効果的な議論戦略をもたらすかどうかを評価する。
論文参考訳（メタデータ） (2024-10-04T14:31:37Z)
SIFToM: Robust Spoken Instruction Following through Theory of Mind [51.326266354164716]
本稿では,認知にインスパイアされた音声指導モデルであるSIFToMを提案し,多様な音声条件下でロボットが人間の指示を実践的に追従できるようにする。結果から,SIFToMモデルは現状の音声モデルや言語モデルよりも優れており,課題に追従する音声命令に対する人間レベルの精度に近づいていることがわかった。
論文参考訳（メタデータ） (2024-09-17T02:36:10Z)
Self-Directed Turing Test for Large Language Models [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すことができるかどうかを調べる。従来のチューリングテストでは、各参加者が1回に1つのメッセージだけを送信する厳格な対話形式を採用している。本稿では,バーストダイアログ形式を用いた自己指示チューリングテストを提案する。
論文参考訳（メタデータ） (2024-08-19T09:57:28Z)
Differentiating between human-written and AI-generated texts using linguistic features automatically extracted from an online computational tool [0.0]
本研究の目的は,AIが人間の文章をエミュレートする能力を評価することにある。人間の発話を模倣したAI生成テキストが現れるにもかかわらず、結果は複数の言語的特徴に有意な差が認められた。
論文参考訳（メタデータ） (2024-07-04T05:37:09Z)
Outcome-Constrained Large Language Models for Countering Hate Speech [10.434435022492723]
本研究は,会話結果に制約された反音声を生成する手法を開発することを目的とする。我々は,大言語モデル(LLM)を用いて,テキスト生成プロセスに2つの望ましい会話結果を導入する実験を行った。評価結果から,提案手法が望まれる結果に対して効果的に対応できることが示唆された。
論文参考訳（メタデータ） (2024-03-25T19:44:06Z)
Consolidating Strategies for Countering Hate Speech Using Persuasive Dialogues [3.8979646385036175]
オンライン会話におけるヘイトフルコメントに対する反論を生み出すためのコントロール可能な戦略について検討する。自動評価と人的評価を用いて、流動的で議論的で論理的に健全な議論を生成する特徴の最適な組み合わせを決定する。我々は,このような特徴を持つテキストを自動的に注釈付けするための計算モデルと,既存のヘイトスピーチコーパスの銀標準アノテートバージョンを共有した。
論文参考訳（メタデータ） (2024-01-15T16:31:18Z)
Beyond Denouncing Hate: Strategies for Countering Implied Biases and Stereotypes in Language [18.560379338032558]
我々は、心理学と哲学文学から、ヘイトフル言語の基礎となるステレオタイプ的含意に挑戦するために、6つの心理的にインスパイアされた戦略を構築する。提案手法では,機械が生成する対音声はより具体的でない戦略を用いるのに対し,人間による対音声はインプリッドステレオタイプに特有な戦略を用いる。以上の結果から,音声の反音声発生におけるステレオタイプ的含意の考慮の重要性が示唆された。
論文参考訳（メタデータ） (2023-10-31T21:33:46Z)
Sensitivity, Performance, Robustness: Deconstructing the Effect of Sociodemographic Prompting [64.80538055623842]
社会デマトグラフィープロンプトは、特定の社会デマトグラフィープロファイルを持つ人間が与える答えに向けて、プロンプトベースのモデルの出力を操縦する技術である。ソシオデマトグラフィー情報はモデル予測に影響を及ぼし、主観的NLPタスクにおけるゼロショット学習を改善するのに有用であることを示す。
論文参考訳（メタデータ） (2023-09-13T15:42:06Z)
Understanding Counterspeech for Online Harm Mitigation [12.104301755723542]
Counterspeechは、憎悪の犯人に挑戦し、虐待の標的への支援を示すことによって、憎悪の言葉に対する直接の反論を提供する。コンテンツモデレーションやデプラットフォームといった、より論争的な手段に代わる、有望な代替手段を提供する。本稿では,社会科学における反音声研究を体系的にレビューし,自動対音声生成における方法論と知見をコンピュータ科学の取り組みと比較する。
論文参考訳（メタデータ） (2023-07-01T20:54:01Z)
Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文参考訳（メタデータ） (2022-05-21T16:52:57Z)
Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文参考訳（メタデータ） (2022-02-19T03:48:20Z)
Characterizing the adversarial vulnerability of speech self-supervised learning [95.03389072594243]
我々は,ゼロ知識とリミテッド知識の両方の敵からの攻撃の下で,そのようなパラダイムの敵対的脆弱性を調査するための最初の試みを行う。実験結果から, SUPERB が提案するパラダイムは, 限られた知識を持つ敵に対して脆弱であることが示唆された。
論文参考訳（メタデータ） (2021-11-08T08:44:04Z)
Adversarial GLUE: A Multi-Task Benchmark for Robustness Evaluation of Language Models [86.02610674750345]
AdvGLUE(Adversarial GLUE)は、様々な種類の敵攻撃の下で、現代の大規模言語モデルの脆弱性を調査し評価するための新しいマルチタスクベンチマークである。 GLUEタスクに14の逆攻撃手法を適用してAdvGLUEを構築する。テストしたすべての言語モデルとロバストなトレーニングメソッドは、AdvGLUEではパフォーマンスが悪く、スコアは明確な精度よりもはるかに遅れています。
論文参考訳（メタデータ） (2021-11-04T12:59:55Z)
An Attribute-Aligned Strategy for Learning Speech Representation [57.891727280493015]
属性選択機構によってこれらの問題に柔軟に対処できる音声表現を導出する属性整合学習戦略を提案する。具体的には、音声表現を属性依存ノードに分解する層式表現可変オートエンコーダ(LR-VAE)を提案する。提案手法は,IDのないSER上での競合性能と,無感情SV上でのより良い性能を実現する。
論文参考訳（メタデータ） (2021-06-05T06:19:14Z)
Reinforcement Learning for Emotional Text-to-Speech Synthesis with Improved Emotion Discriminability [82.39099867188547]
感情的テキスト音声合成(ETTS)は近年大きく進歩している。 i-ETTSと呼ばれるETTSの新しい対話型トレーニングパラダイムを提案する。 i-ETTSの最適化品質を確保するため、強化学習による反復トレーニング戦略を策定します。
論文参考訳（メタデータ） (2021-04-03T13:52:47Z)
You Impress Me: Dialogue Generation via Mutual Persona Perception [62.89449096369027]
認知科学の研究は、理解が高品質なチャット会話に不可欠なシグナルであることを示唆している。そこで我々は,P2 Botを提案する。このP2 Botは,理解を明示的にモデル化することを目的とした送信機受信者ベースのフレームワークである。
論文参考訳（メタデータ） (2020-04-11T12:51:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。