論文の概要: Counterspeech the ultimate shield! Multi-Conditioned Counterspeech Generation through Attributed Prefix Learning
- arxiv url: http://arxiv.org/abs/2505.11958v2
- Date: Tue, 20 May 2025 16:27:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 12:33:37.410906
- Title: Counterspeech the ultimate shield! Multi-Conditioned Counterspeech Generation through Attributed Prefix Learning
- Title(参考訳): 対訳 究極のシールド! 分散プレフィックス学習によるマルチコンディション対訳生成
- Authors: Aswini Kumar Padhi, Anil Bandhakavi, Tanmoy Chakraborty,
- Abstract要約: 建設的逆音声を生成するための新しいフレームワークであるPreference Optimizationを用いた階層型プレフィックス学習であるHiPPrOを紹介する。
IntentCONANv2は、13,973のカウンター音声インスタンスに5つのアノテータによる感情ラベルをアノテートすることで拡張する。
HiPPrOは意図整合性を38%改善し、ルージュ-1, ルージュ-2, ルージュ-Lを3%, 2%, 3%, 3%改善した。
- 参考スコア(独自算出の注目度): 20.199270923708042
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Counterspeech has proven to be a powerful tool to combat hate speech online. Previous studies have focused on generating counterspeech conditioned only on specific intents (single attributed). However, a holistic approach considering multiple attributes simultaneously can yield more nuanced and effective responses. Here, we introduce HiPPrO, Hierarchical Prefix learning with Preference Optimization, a novel two-stage framework that utilizes the effectiveness of attribute-specific prefix embedding spaces hierarchically optimized during the counterspeech generation process in the first phase. Thereafter, we incorporate both reference and reward-free preference optimization to generate more constructive counterspeech. Furthermore, we extend IntentCONANv2 by annotating all 13,973 counterspeech instances with emotion labels by five annotators. HiPPrO leverages hierarchical prefix optimization to integrate these dual attributes effectively. An extensive evaluation demonstrates that HiPPrO achieves a ~38 % improvement in intent conformity and a ~3 %, ~2 %, ~3 % improvement in Rouge-1, Rouge-2, and Rouge-L, respectively, compared to several baseline models. Human evaluations further substantiate the superiority of our approach, highlighting the enhanced relevance and appropriateness of the generated counterspeech. This work underscores the potential of multi-attribute conditioning in advancing the efficacy of counterspeech generation systems.
- Abstract(参考訳): Counterspeechは、ネット上のヘイトスピーチに対抗する強力なツールであることが証明されている。
これまでの研究は、特定の意図にのみ依存する反音声を生成することに重点を置いてきた。
しかし、複数の属性を同時に考える全体論的アプローチは、よりニュアンスで効果的な応答をもたらす。
本稿では,第1フェーズにおける反音声生成過程において階層的に最適化された属性固有接頭辞埋め込み空間の有効性を利用する,階層型プレフィックス学習と優先度最適化の2段階フレームワークであるHiPPrOを紹介する。
その後、よりコンストラクティブな対音声を生成するために、参照と報酬なしの選好最適化の両方を組み込んだ。
さらに,5つのアノテータによる感情ラベル付き13,973のカウンタ音声インスタンスをアノテートすることで,IntentCONANv2を拡張した。
HiPPrOは階層的なプレフィックス最適化を利用してこれらの二重属性を効果的に統合する。
HiPPrO は意図整合性の ~38 % と ~3 %, ~2 %, ~3 % をルージュ-1, ルージュ-2, ルージュ-L のベースラインモデルと比較した。
人間の評価は, 提案手法の優位性をさらに裏付けるものであり, 生成した逆音声の妥当性と適切性を高めるものである。
本研究は, 対音声生成システムの有効性を推し進める上で, 多属性コンディショニングの可能性を示すものである。
関連論文リスト
- Learning Adaptive Parallel Reasoning with Language Models [70.1745752819628]
本稿では,適応並列推論(Adaptive Parallel Reasoning, APR)を提案する。
APRは、spawn()とjoin()操作を使用して適応的なマルチスレッド推論を可能にすることで、既存の推論メソッドを一般化する。
鍵となる革新は、親と子の両方の推論スレッドを最適化して、事前に定義された推論構造を必要とせずにタスクの成功率を高める、エンドツーエンドの強化学習戦略である。
論文 参考訳(メタデータ) (2025-04-21T22:29:02Z) - Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback [50.84142264245052]
テキストレス音声言語モデル(SLM)のセマンティック理解を強化するためのAlign-SLMフレームワークを導入する。
提案手法は、与えられたプロンプトから複数の音声継続を生成し、意味的指標を用いて、直接選好最適化(DPO)のための選好データを生成する。
語彙および構文モデリングのためのZeroSpeech 2021ベンチマーク、意味的コヒーレンスのためのStoryClozeデータセットの音声バージョン、GPT4-oスコアや人間評価などの音声生成指標を用いて、フレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-11-04T06:07:53Z) - Optimizing Multi-Stuttered Speech Classification: Leveraging Whisper's Encoder for Efficient Parameter Reduction in Automated Assessment [2.1301560294088318]
本研究は, 発声音声における不一致の同定における最後のエンコーダ層の役割を明らかにするものである。
計算効率が良く、訓練のためのパラメータが83.7%少なくなり、提案されたアプローチは様々な方言や言語に適応できるようになった。
論文 参考訳(メタデータ) (2024-06-09T13:42:51Z) - Intent-conditioned and Non-toxic Counterspeech Generation using Multi-Task Instruction Tuning with RLAIF [14.2594830589926]
オンラインヘイトスピーチに対する反応として定義されているCounterspeechは、非センセーショナルソリューションとしてますます利用されている。
ヘイトフルステートメントにおける社会的バイアスの背景にある実践的意味をモデル化し,反音声生成を促進させる新しいフレームワークであるCoARLを紹介した。
CoARLの最初の2つのフェーズは、連続的なマルチインストラクションチューニング、インテント、反応、攻撃的ステートメントの害を理解するためのモデルを教えること、そしてインテント条件付き逆音声を生成するためのタスク固有の低ランクアダプタ重みを学習することである。
論文 参考訳(メタデータ) (2024-03-15T08:03:49Z) - DDTSE: Discriminative Diffusion Model for Target Speech Extraction [62.422291953387955]
ターゲット音声抽出(DDTSE)のための識別拡散モデルを提案する。
拡散モデルと同じ前方プロセスを適用し, 判別法と同様の復元損失を利用する。
モデルトレーニング中に推論過程をエミュレートするための2段階のトレーニング戦略を考案する。
論文 参考訳(メタデータ) (2023-09-25T04:58:38Z) - CounterGeDi: A controllable approach to generate polite, detoxified and
emotional counterspeech [7.300229659237878]
我々は,ダイアロGPTモデルの生成を,より丁寧で,解毒され,感情に満ちた反音声へと導くために,CounterGeDiを提案する。
3つのデータセットを用いて反音声を生成し、異なる属性スコア間で顕著な改善を観察する。
論文 参考訳(メタデータ) (2022-05-09T14:10:57Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - High Fidelity Speech Regeneration with Application to Speech Enhancement [96.34618212590301]
本稿では,24khz音声をリアルタイムに生成できる音声のwav-to-wav生成モデルを提案する。
音声変換法に着想を得て,音源の同一性を保ちながら音声特性を増強する訓練を行った。
論文 参考訳(メタデータ) (2021-01-31T10:54:27Z) - HABERTOR: An Efficient and Effective Deep Hatespeech Detector [14.315255338162283]
ユーザ生成コンテンツ中のヘイトスピーチを検出するためのHABERTORモデルを提案する。
HABERTORは15の最先端のヘイトスピーチ検出方法よりも優れていることを示す。
我々の一般化可能性分析は、HABERTORが他の目に見えないヘイトスピーチデータセットにうまく転送することを示している。
論文 参考訳(メタデータ) (2020-10-17T21:10:08Z) - You Do Not Need More Data: Improving End-To-End Speech Recognition by
Text-To-Speech Data Augmentation [59.31769998728787]
我々は、ASRトレーニングデータベース上にTSシステムを構築し、合成音声でデータを拡張し、認識モデルを訓練する。
テストクリーンはWER 4.3%,他のテストクリーンは13.5%で、このシステムはLibriSpeechトレインクリーン100で訓練されたエンドツーエンドASRの競争結果を確立している。
論文 参考訳(メタデータ) (2020-05-14T17:24:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。