論文の概要: Using LLMs to discover emerging coded antisemitic hate-speech in
extremist social media
- arxiv url: http://arxiv.org/abs/2401.10841v2
- Date: Tue, 23 Jan 2024 20:05:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-25 16:28:21.746164
- Title: Using LLMs to discover emerging coded antisemitic hate-speech in
extremist social media
- Title(参考訳): LLMを用いた過激派ソーシャルメディアにおける反ユダヤ的ヘイトスピーチの発見
- Authors: Dhanush Kikkisetti, Raza Ul Mustafa, Wendy Melillo, Roberto Corizzo,
Zois Boukouvalas, Jeff Gill and Nathalie Japkowicz
- Abstract要約: 本稿では,新たに出現するヘイトレイデン用語を検出する手法を提案する。
この方法論は、オンラインの反ユダヤ的談話の文脈でテストされる。
- 参考スコア(独自算出の注目度): 4.104047892870216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online hate speech proliferation has created a difficult problem for social
media platforms. A particular challenge relates to the use of coded language by
groups interested in both creating a sense of belonging for its users and
evading detection. Coded language evolves quickly and its use varies over time.
This paper proposes a methodology for detecting emerging coded hate-laden
terminology. The methodology is tested in the context of online antisemitic
discourse. The approach considers posts scraped from social media platforms,
often used by extremist users. The posts are scraped using seed expressions
related to previously known discourse of hatred towards Jews. The method begins
by identifying the expressions most representative of each post and calculating
their frequency in the whole corpus. It filters out grammatically incoherent
expressions as well as previously encountered ones so as to focus on emergent
well-formed terminology. This is followed by an assessment of semantic
similarity to known antisemitic terminology using a fine-tuned large language
model, and subsequent filtering out of the expressions that are too distant
from known expressions of hatred. Emergent antisemitic expressions containing
terms clearly relating to Jewish topics are then removed to return only coded
expressions of hatred.
- Abstract(参考訳): オンラインヘイトスピーチの拡散は、ソーシャルメディアプラットフォームにとって難しい問題を生み出した。
特定の課題は、ユーザに対する所有意識の創造と検出の回避の両方に関心を持つグループによる符号化言語の使用に関連している。
コード言語は急速に進化し、その用途は時間とともに変化する。
本稿では,ヘイトレーデン用語の出現を検知する手法を提案する。
この方法論は、オンラインの反ユダヤ的談話の文脈でテストされる。
このアプローチでは、ソーシャルメディアプラットフォームから削除された投稿を考慮し、過激派ユーザーがしばしば使用する。
ポストは、以前知られていたユダヤ人に対する憎しみの談話に関連する種表現を使ってスクラップされる。
この方法は、各ポストの最も代表的な表現を識別し、コーパス全体の頻度を計算することから始まる。
文法的に一貫性のない表現や、以前に遭遇した表現をフィルターして、創発的なよく形づくられた用語に焦点を合わせる。
続いて、微調整された大言語モデルを用いて、既知の反ユダヤ的用語と意味的類似性を評価し、その後、既知の憎しみの表現から遠すぎる表現をフィルタリングする。
ユダヤ人の話題に関する明確な用語を含む創発的な反ユダヤ表現は、憎悪のコーディングされた表現のみを返すために削除される。
関連論文リスト
- Towards Interpretable Hate Speech Detection using Large Language Model-extracted Rationales [15.458557611029518]
ソーシャルメディアプラットフォームは、ユーザーが対人的な議論を行い、意見を述べるための重要な場である。
ヘイトスピーチのインスタンスを自動的に識別し、フラグを付ける必要がある。
本稿では,現在最先端の大規模言語モデル (LLM) を用いて,入力テキストから有理形の特徴を抽出することを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:22:35Z) - A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - Monitoring the evolution of antisemitic discourse on extremist social media using BERT [3.3037858066178662]
ソーシャルメディアに対する人種差別と不寛容は、悪質なオンライン環境に寄与する。
オンライン議論において、反ユダヤ主義のテーマとその関連する用語を追跡することは、参加者の感情を監視するのに役立つだろう。
論文 参考訳(メタデータ) (2024-02-06T20:34:49Z) - How toxic is antisemitism? Potentials and limitations of automated
toxicity scoring for antisemitic online content [0.0]
Perspective APIはGoogleとJigsawによるテキスト毒性評価サービスである。
我々は、有害な反ユダヤ主義のテキストがいかに評価され、また、有害性のスコアが、異なるアンチ・セミズムのサブフォームに関してどのように異なるかを示す。
基本レベルでは、パースペクティブAPIは、反ユダヤ主義的な内容が有毒であると認識するが、非明示的な反ユダヤ主義の形式に関して重大な弱点を示す。
論文 参考訳(メタデータ) (2023-10-05T15:23:04Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Codes, Patterns and Shapes of Contemporary Online Antisemitism and
Conspiracy Narratives -- an Annotation Guide and Labeled German-Language
Dataset in the Context of COVID-19 [0.0]
インターネット上の反ユダヤ的・陰謀論のコンテンツは、データ駆動型アルゴリズムアプローチを不可欠にしている。
我々は、新型コロナウイルスのパンデミックの文脈において、オンラインコンテンツにおける反ユダヤ的・陰謀的理論のためのアノテーションガイドを開発する。
我々は、コード化やホロコースト後のアンチ・セミズムのような特定の形のアンチ・セミズムを含む作業定義を提供する。
論文 参考訳(メタデータ) (2022-10-13T10:32:39Z) - Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable
Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。
不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文 参考訳(メタデータ) (2022-03-04T15:59:06Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Leveraging Transformers for Hate Speech Detection in Conversational
Code-Mixed Tweets [36.29939722039909]
本稿では,HASOC 2021サブタスク2のためのMIDAS-IIITDチームによって提案されたシステムについて述べる。
これは、Hindi- Englishのコードミキシングされた会話からヘイトスピーチを検出することに焦点を当てた最初の共有タスクの1つである。
Indic-BERT,XLM-RoBERTa,Multilingual BERTのハード投票アンサンブルがマクロF1スコア0.7253を達成した。
論文 参考訳(メタデータ) (2021-12-18T19:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。