論文の概要: Why Is It Hate Speech? Masked Rationale Prediction for Explainable Hate
Speech Detection
- arxiv url: http://arxiv.org/abs/2211.00243v1
- Date: Tue, 1 Nov 2022 03:16:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:07:00.354346
- Title: Why Is It Hate Speech? Masked Rationale Prediction for Explainable Hate
Speech Detection
- Title(参考訳): なぜスピーチを嫌うのか?
説明可能なヘイト音声検出のためのマスケラゲール予測
- Authors: Jiyun Kim, Byounghan Lee, Kyung-Ah Sohn
- Abstract要約: 中間課題としてMasked Rationale Prediction (MRP)を提案する。
MRP(英語: MRP)とは、人間の判断の根拠となる文の、マスクされた人間の合理性・スニペットを予測するタスクである。
モデルがMDPの合理性に基づいて推論能力を学ぶと、バイアスや説明可能性の観点からヘイトスピーチ検出を頑健に行う。
- 参考スコア(独自算出の注目度): 6.33432537740479
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In a hate speech detection model, we should consider two critical aspects in
addition to detection performance-bias and explainability. Hate speech cannot
be identified based solely on the presence of specific words: the model should
be able to reason like humans and be explainable. To improve the performance
concerning the two aspects, we propose Masked Rationale Prediction (MRP) as an
intermediate task. MRP is a task to predict the masked human
rationales-snippets of a sentence that are grounds for human judgment-by
referring to surrounding tokens combined with their unmasked rationales. As the
model learns its reasoning ability based on rationales by MRP, it performs hate
speech detection robustly in terms of bias and explainability. The proposed
method generally achieves state-of-the-art performance in various metrics,
demonstrating its effectiveness for hate speech detection.
- Abstract(参考訳): ヘイトスピーチ検出モデルでは,検出性能のバイアスと説明可能性に加えて,二つの重要な側面を考慮すべきである。
ヘイトスピーチは、特定の単語の存在だけでは特定できない:モデルは人間のように推論でき、説明できる。
この2つの側面に関する性能を改善するために,中間課題としてMasked Rationale Prediction (MRP)を提案する。
MRP(英語: MRP)は、人間の判断の根拠である文のマスクされた人間の有理数-スニペットを予測するタスクである。
モデルがMDPの合理性に基づいて推論能力を学ぶと、バイアスや説明可能性の観点からヘイトスピーチ検出を頑健に行う。
提案手法は,様々な指標の最先端性能を実現し,ヘイトスピーチ検出の有効性を実証する。
関連論文リスト
- SIFToM: Robust Spoken Instruction Following through Theory of Mind [51.326266354164716]
本稿では,認知にインスパイアされた音声指導モデルであるSIFToMを提案し,多様な音声条件下でロボットが人間の指示を実践的に追従できるようにする。
結果から,SIFToMモデルは現状の音声モデルや言語モデルよりも優れており,課題に追従する音声命令に対する人間レベルの精度に近づいていることがわかった。
論文 参考訳(メタデータ) (2024-09-17T02:36:10Z) - Towards Interpretable Hate Speech Detection using Large Language Model-extracted Rationales [15.458557611029518]
ソーシャルメディアプラットフォームは、ユーザーが対人的な議論を行い、意見を述べるための重要な場である。
ヘイトスピーチのインスタンスを自動的に識別し、フラグを付ける必要がある。
本稿では,現在最先端の大規模言語モデル (LLM) を用いて,入力テキストから有理形の特徴を抽出することを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:22:35Z) - Subjective $\textit{Isms}$? On the Danger of Conflating Hate and Offence
in Abusive Language Detection [5.351398116822836]
我々はヘイトスピーチの発見を無効にすることができると論じる。
我々は、将来の研究が理論上あることを求め、その概念や犯罪から憎悪を遠ざけている。
論文 参考訳(メタデータ) (2024-03-04T17:56:28Z) - An Investigation of Large Language Models for Real-World Hate Speech
Detection [46.15140831710683]
既存の手法の大きな制限は、ヘイトスピーチ検出がコンテキストの問題である点である。
近年,大規模言語モデル (LLM) はいくつかの自然言語処理において最先端の性能を示した。
本研究は, ヘイトスピーチの文脈を効果的に把握する上で, 巧妙な推論プロンプトが有効であることを明らかにする。
論文 参考訳(メタデータ) (2024-01-07T00:39:33Z) - HARE: Explainable Hate Speech Detection with Step-by-Step Reasoning [29.519687405350304]
本稿では,大規模言語モデル(LLM)の推論能力を利用して,ヘイトスピーチの説明のギャップを埋めるヘイトスピーチ検出フレームワークHAREを紹介する。
SBICとImplicit Hateベンチマークの実験では、モデル生成データを用いた手法がベースラインを一貫して上回ることを示した。
提案手法は,訓練されたモデルの説明品質を高め,未知のデータセットへの一般化を改善する。
論文 参考訳(メタデータ) (2023-11-01T06:09:54Z) - Hate Speech Detection via Dual Contrastive Learning [25.878271501274245]
本稿では,ヘイトスピーチ検出のための新しい双方向コントラスト学習フレームワークを提案する。
本フレームワークは,自己教師型学習と教師型学習の損失を協調的に最適化し,スパンレベルの情報を取得する。
公開可能な2つの英語データセットの実験を行い、実験結果から、提案モデルが最先端のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2023-07-10T13:23:36Z) - Leveraging World Knowledge in Implicit Hate Speech Detection [5.5536024561229205]
テキスト中のエンティティの言及に関する現実的な知識は、モデルがヘイトスピーチをよりよく検出するのに役立ちます。
また,実世界の知識がヘイトスピーチ検出に価値を与えない事例についても論じる。
論文 参考訳(メタデータ) (2022-12-28T21:23:55Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Speaker Identity Preservation in Dysarthric Speech Reconstruction by
Adversarial Speaker Adaptation [59.41186714127256]
変形性音声再建(DSR)は,変形性音声の品質向上を目的としている。
話者識別に最適化された話者エンコーダ (SE) について検討した。
我々は,新しいマルチタスク学習戦略,すなわち対人話者適応(ASA)を提案する。
論文 参考訳(メタデータ) (2022-02-18T08:59:36Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Characterizing the adversarial vulnerability of speech self-supervised
learning [95.03389072594243]
我々は,ゼロ知識とリミテッド知識の両方の敵からの攻撃の下で,そのようなパラダイムの敵対的脆弱性を調査するための最初の試みを行う。
実験結果から, SUPERB が提案するパラダイムは, 限られた知識を持つ敵に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2021-11-08T08:44:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。