論文の概要: Codes, Patterns and Shapes of Contemporary Online Antisemitism and
Conspiracy Narratives -- an Annotation Guide and Labeled German-Language
Dataset in the Context of COVID-19
- arxiv url: http://arxiv.org/abs/2210.07934v1
- Date: Thu, 13 Oct 2022 10:32:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 15:50:32.216528
- Title: Codes, Patterns and Shapes of Contemporary Online Antisemitism and
Conspiracy Narratives -- an Annotation Guide and Labeled German-Language
Dataset in the Context of COVID-19
- Title(参考訳): 現代のオンライン反ユダヤ主義と陰謀物語の符号、パターン、形--covid-19の文脈における注釈ガイドとラベル付きドイツ語データセット
- Authors: Elisabeth Steffen, Helena Mihaljevi\'c, Milena Pustet, Nyco Bischoff,
Mar\'ia do Mar Castro Varela, Yener Bayramo\u{g}lu, Bahar Oghalai
- Abstract要約: インターネット上の反ユダヤ的・陰謀論のコンテンツは、データ駆動型アルゴリズムアプローチを不可欠にしている。
我々は、新型コロナウイルスのパンデミックの文脈において、オンラインコンテンツにおける反ユダヤ的・陰謀的理論のためのアノテーションガイドを開発する。
我々は、コード化やホロコースト後のアンチ・セミズムのような特定の形のアンチ・セミズムを含む作業定義を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Over the course of the COVID-19 pandemic, existing conspiracy theories were
refreshed and new ones were created, often interwoven with antisemitic
narratives, stereotypes and codes. The sheer volume of antisemitic and
conspiracy theory content on the Internet makes data-driven algorithmic
approaches essential for anti-discrimination organizations and researchers
alike. However, the manifestation and dissemination of these two interrelated
phenomena is still quite under-researched in scholarly empirical research of
large text corpora. Algorithmic approaches for the detection and classification
of specific contents usually require labeled datasets, annotated based on
conceptually sound guidelines. While there is a growing number of datasets for
the more general phenomenon of hate speech, the development of corpora and
annotation guidelines for antisemitic and conspiracy content is still in its
infancy, especially for languages other than English. We contribute to closing
this gap by developing an annotation guide for antisemitic and conspiracy
theory online content in the context of the COVID-19 pandemic. We provide
working definitions, including specific forms of antisemitism such as encoded
and post-Holocaust antisemitism. We use these to annotate a German-language
dataset consisting of ~3,700 Telegram messages sent between 03/2020 and
12/2021.
- Abstract(参考訳): 新型コロナウイルス(covid-19)パンデミックの過程で、既存の陰謀説が更新され、反ユダヤ主義的な物語、ステレオタイプ、コードとしばしば織り交ぜられた新しい陰謀説が作られた。
インターネット上の反ユダヤ主義や陰謀論のコンテンツは、データ駆動アルゴリズムのアプローチを反差別組織や研究者にも不可欠なものにしている。
しかし、これら2つの相互関連現象の顕在化と普及は、大文字コーパスの学術的実証研究においてはまだ十分に研究されていない。
特定の内容の検出と分類のためのアルゴリズム的アプローチは通常、概念的音声ガイドラインに基づいて注釈付けされたラベル付きデータセットを必要とする。
ヘイトスピーチのより一般的な現象に関するデータセットは増えているが、反ユダヤ主義や陰謀的なコンテンツのためのコーパスや注釈ガイドラインの開発はまだ初期段階にあり、特に英語以外の言語ではそうである。
我々は、新型コロナウイルスのパンデミックの文脈において、オンラインコンテンツにおける反ユダヤ・陰謀論のアノテーションガイドを開発することで、このギャップを埋めることに貢献している。
我々は、エンコードやホロコースト後の反ユダヤ主義のような特定の形態の反ユダヤ主義を含む作業定義を提供する。
03/2020から12/2021の間に送信された約3,700のTelegramメッセージからなるドイツ語のデータセットに注釈を付けます。
関連論文リスト
- Using LLMs to discover emerging coded antisemitic hate-speech in
extremist social media [4.104047892870216]
本稿では,新たに出現するヘイトレイデン用語を検出する手法を提案する。
この方法論は、オンラインの反ユダヤ的談話の文脈でテストされる。
論文 参考訳(メタデータ) (2024-01-19T17:40:50Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - How toxic is antisemitism? Potentials and limitations of automated
toxicity scoring for antisemitic online content [0.0]
Perspective APIはGoogleとJigsawによるテキスト毒性評価サービスである。
我々は、有害な反ユダヤ主義のテキストがいかに評価され、また、有害性のスコアが、異なるアンチ・セミズムのサブフォームに関してどのように異なるかを示す。
基本レベルでは、パースペクティブAPIは、反ユダヤ主義的な内容が有毒であると認識するが、非明示的な反ユダヤ主義の形式に関して重大な弱点を示す。
論文 参考訳(メタデータ) (2023-10-05T15:23:04Z) - The Anatomy of Conspirators: Unveiling Traits using a Comprehensive
Twitter Dataset [0.0]
本稿では,2022年を通して共謀活動に従事しているアカウントを包含するTwitterデータセットを構築するための新しい手法を提案する。
この包括的な収集作業により、合計15万のアカウントと3700万のツイートがタイムラインから抽出された。
トピック,プロファイル,行動特性の3次元にわたる2つのグループの比較分析を行った。
論文 参考訳(メタデータ) (2023-08-29T09:35:23Z) - From Dogwhistles to Bullhorns: Unveiling Coded Rhetoric with Language
Models [73.25963871034858]
本研究は,イヌヒストルの大規模数値計算による研究である。
我々は、ドッグウィストルの類型学を開発し、300以上のドッグウィストルの過去最大の用語集をキュレートし、歴史的なアメリカの政治家の演説でそれらの使用法を分析した。
犬毛を含む有害なコンテンツは毒性の検出を回避し,このような符号化された言語のオンラインリスクを強調している。
論文 参考訳(メタデータ) (2023-05-26T18:00:57Z) - Antisemitic Messages? A Guide to High-Quality Annotation and a Labeled
Dataset of Tweets [0.0]
我々は、6,941ツイートのラベル付きデータセットを作成し、ユダヤ人、イスラエル、反ユダヤ主義に関する会話に共通する幅広いトピックをカバーしています。
このデータセットには、IHRA(International Holocaust Remembrance Alliance)による反ユダヤ主義の定義に基づく1,250のツイート(18%)が含まれている。
論文 参考訳(メタデータ) (2023-04-28T02:52:38Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - Latent Topology Induction for Understanding Contextualized
Representations [84.7918739062235]
本研究では,文脈的埋め込みの表現空間について検討し,大規模言語モデルの隠れトポロジについて考察する。
文脈化表現の言語特性を要約した潜在状態のネットワークが存在することを示す。
論文 参考訳(メタデータ) (2022-06-03T11:22:48Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - "Subverting the Jewtocracy": Online Antisemitism Detection Using
Multimodal Deep Learning [23.048101866010445]
オンラインの反ユダヤ主義の自動マルチモーダル検出の方向の最初の仕事を提示します。
TwitterとGabからの3,102と3,509のソーシャルメディア投稿で2つのデータセットをラベル付けしました。
本論文では, ポストからのテキストと画像を用いて, アンチセミズムコンテンツとその特定のアンチセミズムカテゴリの存在を検出するマルチモーダル深層学習システムを提案する。
論文 参考訳(メタデータ) (2021-04-13T05:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。