Fugu-MT 論文翻訳(概要): DisCGen: A Framework for Discourse-Informed Counterspeech Generation

論文の概要: DisCGen: A Framework for Discourse-Informed Counterspeech Generation

arxiv url: http://arxiv.org/abs/2311.18147v1
Date: Wed, 29 Nov 2023 23:20:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-01 18:25:35.946064
Title: DisCGen: A Framework for Discourse-Informed Counterspeech Generation
Title（参考訳）: DisCGen: 談話インフォームド音声生成のためのフレームワーク
Authors: Sabit Hassan, Malihe Alikhani
Abstract要約: 本稿では,言論理論に基づく枠組みを提案し,反声と憎しみのあるコメントを結びつける推論リンクについて検討する。本稿では,Reddit から現在地にある反音声のデータセットを収集するプロセスを提案する。提案するデータセットとフレームワークを用いて,大規模言語モデルを用いて,談話理論に基づいて文脈的に接地した対音声を生成することができることを示す。
参考スコア（独自算出の注目度）: 34.75404551612012
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Counterspeech can be an effective method for battling hateful content on social media. Automated counterspeech generation can aid in this process. Generated counterspeech, however, can be viable only when grounded in the context of topic, audience and sensitivity as these factors influence both the efficacy and appropriateness. In this work, we propose a novel framework based on theories of discourse to study the inferential links that connect counter speeches to the hateful comment. Within this framework, we propose: i) a taxonomy of counterspeech derived from discourse frameworks, and ii) discourse-informed prompting strategies for generating contextually-grounded counterspeech. To construct and validate this framework, we present a process for collecting an in-the-wild dataset of counterspeech from Reddit. Using this process, we manually annotate a dataset of 3.9k Reddit comment pairs for the presence of hatespeech and counterspeech. The positive pairs are annotated for 10 classes in our proposed taxonomy. We annotate these pairs with paraphrased counterparts to remove offensiveness and first-person references. We show that by using our dataset and framework, large language models can generate contextually-grounded counterspeech informed by theories of discourse. According to our human evaluation, our approaches can act as a safeguard against critical failures of discourse-agnostic models.
Abstract（参考訳）: counterspeechは、ソーシャルメディア上で憎しみのあるコンテンツと戦う効果的な方法である。自動対音声生成はこのプロセスに役立つ。しかし、これらの要因が有効性と適切性の両方に影響を与えるのは、トピック、オーディエンス、センシティブといった文脈においてのみである。本研究では,対談と憎しみのあるコメントを結びつける推論的リンクを研究するために,談話理論に基づく新しい枠組みを提案する。この枠組みの中で、我々は次のように提案する。一談話の枠組みから派生した対訳の分類、及び二文脈的接地音声を生成するための言論インフォームド・プロンプト戦略このフレームワークの構築と検証を行うため,Reddit から現在地にある対音声データセットを収集するプロセスを提案する。このプロセスを使用して、3.9kのredditコメントペアのデータセットにhatspeechとcounterspeechの存在を手動で注釈付けします。提案する分類法では, 正のペアは10クラスにアノテートされる。攻撃性や一人称参照を除去するために,これらのペアに言い換えて注釈を付ける。我々のデータセットとフレームワークを使用することで、大きな言語モデルが談話理論から情報を得た文脈的に接頭辞を生成することができることを示します。人間の評価によれば、我々のアプローチは言論非依存モデルの致命的な失敗に対する保護として機能する。

関連論文リスト

Latent Speech-Text Transformer [77.01648186958381]
本稿では,LST(Latent Speech-Text Transformer)を提案する。 LSTは、音声から音声へのバニラアプローチと、データと計算制御の両方の設定におけるテキストからテキストへのベンチマークに優れています。
論文参考訳（メタデータ） (2025-10-07T17:52:08Z)
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance [66.74042564585942]
MOSS-Speechは、テキストガイダンスに頼ることなく直接理解し、音声を生成する、真の音声音声合成大言語モデルである。我々の研究は、表現的かつ効率的なエンドツーエンドの音声対話のための新しいパラダイムを確立する。
論文参考訳（メタデータ） (2025-10-01T04:32:37Z)
Generative AI may backfire for counterspeech [20.57872238271025]
我々は、最先端AIが生み出す文脈化された逆音声が、オンラインヘイトスピーチを抑制するのに有効であるかどうかを分析する。その結果,非コンテクスチュアライズされた対応音声は,オンラインヘイトスピーチを著しく減少させることがわかった。しかし、LLMsによって生成される文脈化された反音声は効果が無く、バックファイアさえも生じうる。
論文参考訳（メタデータ） (2024-11-22T14:47:00Z)
CrowdCounter: A benchmark type-specific multi-target counterspeech dataset [10.133642589954192]
我々は3,425のヘイトスピーチ対を含む新しいデータセット、CrowdCounterを紹介した。アノテーションプラットフォーム自体の設計は、アノテーションに対して、タイプ固有の、非冗長で高品質なカウンター音声を書くことを奨励します。バニラとタイプ制御プロンプトという,対音声応答を生成する2つのフレームワークを評価する。
論文参考訳（メタデータ） (2024-10-02T10:24:51Z)
Moshi: a speech-text foundation model for real-time dialogue [78.88479749811376]
現在の音声対話システムは、パイプラインの独立した音声活動検出と音声合成に依存している。そこで本研究では,Moshi Moshiが音声認識と音声合成を実現する方法を紹介する。得られたモデルは、初めてリアルタイムな全音声大言語モデルモダリティである。
論文参考訳（メタデータ） (2024-09-17T17:55:39Z)
Towards Unsupervised Speech Recognition Without Pronunciation Models [57.222729245842054]
本稿では,ペア音声とテキストコーパスを使わずにASRシステムを開発するという課題に取り組む。音声合成とテキスト・テキスト・マスクによるトークン埋込から教師なし音声認識が実現可能であることを実験的に実証した。この革新的なモデルは、レキシコンフリー環境下での以前の教師なしASRモデルの性能を上回る。
論文参考訳（メタデータ） (2024-06-12T16:30:58Z)
Outcome-Constrained Large Language Models for Countering Hate Speech [10.434435022492723]
本研究は,会話結果に制約された反音声を生成する手法を開発することを目的とする。我々は,大言語モデル(LLM)を用いて,テキスト生成プロセスに2つの望ましい会話結果を導入する実験を行った。評価結果から,提案手法が望まれる結果に対して効果的に対応できることが示唆された。
論文参考訳（メタデータ） (2024-03-25T19:44:06Z)
Towards Interpretable Hate Speech Detection using Large Language Model-extracted Rationales [15.458557611029518]
ソーシャルメディアプラットフォームは、ユーザーが対人的な議論を行い、意見を述べるための重要な場である。ヘイトスピーチのインスタンスを自動的に識別し、フラグを付ける必要がある。本稿では,現在最先端の大規模言語モデル (LLM) を用いて,入力テキストから有理形の特徴を抽出することを提案する。
論文参考訳（メタデータ） (2024-03-19T03:22:35Z)
ContextSpeech: Expressive and Efficient Text-to-Speech for Paragraph Reading [65.88161811719353]
本研究は、軽量で効果的なテキスト音声合成システムであるContextSpeechを開発する。まず,グローバルテキストと音声コンテキストを文エンコーディングに組み込むメモリキャッシュ再帰機構を設計する。我々は,グローバルな文脈拡張の範囲を広げるため,階層的に構造化されたテキストセマンティクスを構築した。実験の結果,ContextSpeechは段落読解における音質と韻律を競争モデル効率で著しく改善することがわかった。
論文参考訳（メタデータ） (2023-07-03T06:55:03Z)
Understanding Counterspeech for Online Harm Mitigation [12.104301755723542]
Counterspeechは、憎悪の犯人に挑戦し、虐待の標的への支援を示すことによって、憎悪の言葉に対する直接の反論を提供する。コンテンツモデレーションやデプラットフォームといった、より論争的な手段に代わる、有望な代替手段を提供する。本稿では,社会科学における反音声研究を体系的にレビューし,自動対音声生成における方法論と知見をコンピュータ科学の取り組みと比較する。
論文参考訳（メタデータ） (2023-07-01T20:54:01Z)
CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文参考訳（メタデータ） (2023-03-02T17:30:43Z)
SpeechLM: Enhanced Speech Pre-Training with Unpaired Textual Data [100.46303484627045]
本稿では,事前定義した統一表現と音声とテキストの事前学習を協調させるクロスモーダル音声言語モデル(SpeechLM)を提案する。具体的には、音声とテキストのモダリティをブリッジするために、2つの別の離散トークン化器を導入する。音声認識, 音声翻訳, ユニバーサル表現評価フレームワーク SUPERB など, 様々な音声言語処理タスクにおける音声LM の評価を行った。
論文参考訳（メタデータ） (2022-09-30T09:12:10Z)
Unsupervised Text-to-Speech Synthesis by Unsupervised Automatic Speech Recognition [60.84668086976436]
教師なし音声合成システム(TTS)は、言語中の任意の文章に対応する音声波形を生成することを学習する。本稿では、教師なし自動音声認識(ASR)の最近の進歩を活用して、教師なしTSシステムを提案する。教師なしシステムでは、7つの言語で約10～20時間の音声で教師付きシステムに匹敵する性能を達成できる。
論文参考訳（メタデータ） (2022-03-29T17:57:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。