論文の概要: Focal Inferential Infusion Coupled with Tractable Density Discrimination
for Implicit Hate Speech Detection
- arxiv url: http://arxiv.org/abs/2309.11896v1
- Date: Thu, 21 Sep 2023 08:59:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 16:12:10.884028
- Title: Focal Inferential Infusion Coupled with Tractable Density Discrimination
for Implicit Hate Speech Detection
- Title(参考訳): 突発的Hate音声検出のためのトラクタブル密度判別法を併用したフーカルインファーデンシャル注入法
- Authors: Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty
- Abstract要約: 本稿では,Focused Inferential Adaptive Density DiscriminationフレームワークであるFiADDを紹介する。
FiADDは暗黙のヘイトスピーチの表面形状をその暗黙の形式に近づけることで、PLM微調整パイプラインを強化する。
3つの暗黙のヘイトデータセット上でFiADDをテストし、双方向と三方向のヘイト分類タスクにおいて顕著な改善を観察する。
- 参考スコア(独自算出の注目度): 24.24777586739795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although pre-trained large language models (PLMs) have achieved
state-of-the-art on many NLP tasks, they lack understanding of subtle
expressions of implicit hate speech. Such nuanced and implicit hate is often
misclassified as non-hate. Various attempts have been made to enhance the
detection of (implicit) hate content by augmenting external context or
enforcing label separation via distance-based metrics. We combine these two
approaches and introduce FiADD, a novel Focused Inferential Adaptive Density
Discrimination framework. FiADD enhances the PLM finetuning pipeline by
bringing the surface form of an implicit hate speech closer to its implied form
while increasing the inter-cluster distance among various class labels. We test
FiADD on three implicit hate datasets and observe significant improvement in
the two-way and three-way hate classification tasks. We further experiment on
the generalizability of FiADD on three other tasks, namely detecting sarcasm,
irony, and stance, in which surface and implied forms differ, and observe
similar performance improvement. We analyze the generated latent space to
understand its evolution under FiADD, which corroborates the advantage of
employing FiADD for implicit hate speech detection.
- Abstract(参考訳): 事前訓練された大規模言語モデル(PLM)は、多くのNLPタスクにおいて最先端を達成しているが、暗黙のヘイトスピーチの微妙な表現を理解できていない。
このようなニュアンスで暗黙の憎悪は、しばしば非憎悪として分類される。
外部コンテキストの強化や,距離ベースのメトリクスによるラベル分離の実施などにより,ヘイトコンテンツの検出(簡易)を促進するために,さまざまな試みがなされている。
この2つのアプローチを組み合わせて、Focused Inferential Adaptive Density DiscriminationフレームワークであるFiADDを導入する。
fiaddは、様々なクラスラベル間のクラスタ間距離を増加させながら、暗黙的なヘイトスピーチの表面形態をその暗黙の形式に近づけることで、plmの微調整パイプラインを強化する。
3つの暗黙のヘイトデータセットでfiaddをテストし、双方向および3方向ヘイト分類タスクにおける大幅な改善を観察した。
さらに,表面と含意形状が異なるサーカズム,アイロニー,スタンスの検出と,同様の性能改善を観察する3つのタスクについて,fiaddの一般化可能性について実験を行った。
生成した潜在空間を解析し、その進化をFiADDで理解し、暗黙のヘイトスピーチ検出にFiADDを用いることの利点を裏付ける。
関連論文リスト
- DenoSent: A Denoising Objective for Self-Supervised Sentence
Representation Learning [59.4644086610381]
本稿では,他の視点,すなわち文内視点から継承する新たな認知的目的を提案する。
離散ノイズと連続ノイズの両方を導入することで、ノイズの多い文を生成し、モデルを元の形式に復元するように訓練する。
我々の経験的評価は,本手法が意味的テキスト類似性(STS)と幅広い伝達タスクの両面で競合する結果をもたらすことを示した。
論文 参考訳(メタデータ) (2024-01-24T17:48:45Z) - On the Challenges of Building Datasets for Hate Speech Detection [0.0]
我々はまず,データ中心のレンズを用いてヘイトスピーチ検出を取り巻く問題を分析する。
次に、データ生成パイプラインを7つの広範囲にわたってカプセル化する、包括的なフレームワークの概要を示します。
論文 参考訳(メタデータ) (2023-09-06T11:15:47Z) - Hate Speech Detection via Dual Contrastive Learning [25.878271501274245]
本稿では,ヘイトスピーチ検出のための新しい双方向コントラスト学習フレームワークを提案する。
本フレームワークは,自己教師型学習と教師型学習の損失を協調的に最適化し,スパンレベルの情報を取得する。
公開可能な2つの英語データセットの実験を行い、実験結果から、提案モデルが最先端のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2023-07-10T13:23:36Z) - Anticipating the Unseen Discrepancy for Vision and Language Navigation [63.399180481818405]
視覚言語ナビゲーションでは、エージェントは特定のターゲットに到達するために自然言語命令に従う必要がある。
目に見える環境と目に見えない環境の間に大きな違いがあるため、エージェントがうまく一般化することは困難である。
本研究では,テストタイムの視覚的整合性を促進することによって,未知の環境への一般化を学習する,未知の離散性予測ビジョンと言語ナビゲーション(DAVIS)を提案する。
論文 参考訳(メタデータ) (2022-09-10T19:04:40Z) - Combating high variance in Data-Scarce Implicit Hate Speech
Classification [0.0]
我々は,最先端の性能を実現する新しいRoBERTaモデルを開発した。
本稿では,様々な最適化手法と正規化手法を探求し,最先端性能を実現するRoBERTaベースの新しいモデルを開発する。
論文 参考訳(メタデータ) (2022-08-29T13:45:21Z) - ToKen: Task Decomposition and Knowledge Infusion for Few-Shot Hate
Speech Detection [85.68684067031909]
この問題を数ショットの学習タスクとみなし、タスクを「構成」部分に分解することで大きな成果を上げている。
さらに、推論データセット(例えばAtomic 2020)から知識を注入することで、パフォーマンスはさらに向上する。
論文 参考訳(メタデータ) (2022-05-25T05:10:08Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Latent Hatred: A Benchmark for Understanding Implicit Hate Speech [22.420275418616242]
この研究は、暗黙のヘイトスピーチの理論的に正当化された分類法と、各メッセージにきめ細かいラベルを付けたベンチマークコーパスを導入している。
本稿では、同時代のベースラインを用いて、暗黙のヘイトスピーチを検出し、説明するためにデータセットを体系的に分析する。
論文 参考訳(メタデータ) (2021-09-11T16:52:56Z) - Unsupervised Domain Adaptation for Hate Speech Detection Using a Data
Augmentation Approach [6.497816402045099]
ヘイトスピーチ検出のためのラベル付きデータを拡張するための教師なし領域適応手法を提案する。
精度/リコール曲線の領域を最大42%改善し,278%改善した。
論文 参考訳(メタデータ) (2021-07-27T15:01:22Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。