論文の概要: Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study
- arxiv url: http://arxiv.org/abs/2506.11919v1
- Date: Fri, 13 Jun 2025 16:11:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.871315
- Title: Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study
- Title(参考訳): 乱用コンテンツに対するカウンター音声の有効性:多次元注釈と分類による検討
- Authors: Greta Damo, Elena Cabrio, Serena Villata,
- Abstract要約: 本稿では,社会科学の概念に基づくCSの有効性分類のための新しい計算フレームワークを提案する。
我々のフレームワークは、明瞭さ、エビデンス、感情的魅力、反感、オーディエンス適応、フェアネスの6つの中核的な次元を定義しています。
さらに,マルチタスクと依存性ベースの2つの分類戦略を提案し,高い結果を得た。
- 参考スコア(独自算出の注目度): 18.442235469997232
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counter-speech (CS) is a key strategy for mitigating online Hate Speech (HS), yet defining the criteria to assess its effectiveness remains an open challenge. We propose a novel computational framework for CS effectiveness classification, grounded in social science concepts. Our framework defines six core dimensions - Clarity, Evidence, Emotional Appeal, Rebuttal, Audience Adaptation, and Fairness - which we use to annotate 4,214 CS instances from two benchmark datasets, resulting in a novel linguistic resource released to the community. In addition, we propose two classification strategies, multi-task and dependency-based, achieving strong results (0.94 and 0.96 average F1 respectively on both expert- and user-written CS), outperforming standard baselines, and revealing strong interdependence among dimensions.
- Abstract(参考訳): Counter-Speech(CS)は、オンラインのHate Speech(HS)を緩和するための重要な戦略であるが、その効果を評価するための基準を定義することは、依然としてオープンな課題である。
本稿では,社会科学の概念に基づくCSの有効性分類のための新しい計算フレームワークを提案する。
私たちのフレームワークは,Clarity, Evidence, Emotional Appeal, Rebuttal, Audience Adaptation, Fairnessという,2つのベンチマークデータセットから4,214のCSインスタンスを注釈付けするために使用する6つのコアディメンションを定義しています。
さらに、マルチタスクと依存性ベースの2つの分類戦略を提案し、それぞれエキスパートとユーザによるCSで0.94と0.96の平均F1を達成し、標準ベースラインを上回り、次元間の強い相互依存を明らかにする。
関連論文リスト
- A Survey of Machine Learning Models and Datasets for the Multi-label Classification of Textual Hate Speech in English [3.216132991084434]
この研究は、英語におけるこの新たな研究の展望について、科学文献の体系的および包括的調査を行った最初のものである。
マルチラベル分類モデルのトレーニングに適した28のデータセットを簡潔に概説する。
不均衡なトレーニングデータ、クラウドソーシングプラットフォームへの依存、小規模でスパースなデータセット、方法論的アライメントの欠如を識別する。
論文 参考訳(メタデータ) (2025-04-11T15:16:31Z) - Who Can Withstand Chat-Audio Attacks? An Evaluation Benchmark for Large Audio-Language Models [60.72029578488467]
アドリラルオーディオ攻撃は、人間と機械の相互作用における大きなオーディオ言語モデル(LALM)の利用の増加に重大な脅威をもたらす。
本稿では,4種類の音声攻撃を含むChat-Audio Attacksベンチマークを紹介する。
Gemini-1.5-Pro, GPT-4oなど, 音声対話機能を有する6つの最先端LALMの評価を行った。
論文 参考訳(メタデータ) (2024-11-22T10:30:48Z) - An Effective, Robust and Fairness-aware Hate Speech Detection Framework [2.9927562390637394]
既存のヘイトスピーチ検出手法には、いくつかの面で制限がある。
我々は,データ拡張,公平性,不確実性を考慮した新しいフレームワークを設計する。
本モデルは,攻撃シナリオと攻撃シナリオの両方で,最先端の8つの手法より優れている。
論文 参考訳(メタデータ) (2024-09-25T07:01:51Z) - Intent-conditioned and Non-toxic Counterspeech Generation using Multi-Task Instruction Tuning with RLAIF [14.2594830589926]
オンラインヘイトスピーチに対する反応として定義されているCounterspeechは、非センセーショナルソリューションとしてますます利用されている。
ヘイトフルステートメントにおける社会的バイアスの背景にある実践的意味をモデル化し,反音声生成を促進させる新しいフレームワークであるCoARLを紹介した。
CoARLの最初の2つのフェーズは、連続的なマルチインストラクションチューニング、インテント、反応、攻撃的ステートメントの害を理解するためのモデルを教えること、そしてインテント条件付き逆音声を生成するためのタスク固有の低ランクアダプタ重みを学習することである。
論文 参考訳(メタデータ) (2024-03-15T08:03:49Z) - "Define Your Terms" : Enhancing Efficient Offensive Speech
Classification with Definition [12.641396816499162]
本稿では,入力のラベルと,プロトタイプネットワークによる分類のための定義を組み込んだ統合埋め込みアーキテクチャを提案する。
我々のモデルは、4つのデータセットで利用可能なトレーニングデータの10%未満を使用しながら、最大F1スコアの少なくとも75%を達成する。
論文 参考訳(メタデータ) (2024-02-05T17:33:22Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - KPEval: Towards Fine-Grained Semantic-Based Keyphrase Evaluation [69.57018875757622]
KPEvalは、参照合意、忠実性、多様性、有用性という4つの重要な側面からなる総合的な評価フレームワークである。
KPEvalを用いて、23のキーフレーズシステムを再評価し、確立されたモデル比較結果に盲点があることを発見した。
論文 参考訳(メタデータ) (2023-03-27T17:45:38Z) - Improved two-stage hate speech classification for twitter based on Deep
Neural Networks [0.0]
ヘイトスピーチ(Hate speech)は、虐待的な言葉の使用を含む、オンラインハラスメントの一種である。
この研究で提案するモデルは、LSTMニューラルネットワークアーキテクチャに基づく既存のアプローチの拡張である。
本研究は,16kツイートの公開コーパスで評価された2段階目の提案手法の性能比較を含む。
論文 参考訳(メタデータ) (2022-06-08T20:57:41Z) - Speaker-Conditioned Hierarchical Modeling for Automated Speech Scoring [60.55025339250815]
本研究では、話者条件付き階層型モデリングと呼ばれる非ネイティブASSのための新しいディープラーニング手法を提案する。
本手法では, 口腔熟練度テストが候補に対して複数の応答を評価できるという事実を生かして, 候補に対して複数の応答を評価できる。これらの応答からコンテキストを抽出し, ネットワークに付加的な話者固有のコンテキストとして与えて, 特定の応答をスコアする。
論文 参考訳(メタデータ) (2021-08-30T07:00:28Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Characterizing Speech Adversarial Examples Using Self-Attention U-Net
Enhancement [102.48582597586233]
本稿では,U-Net$_At$という,U-Netに基づくアテンションモデルを提案する。
対戦型音声アタックを用いた自動音声認識(ASR)タスクの実験を行った。
論文 参考訳(メタデータ) (2020-03-31T02:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。