論文の概要: Codes, Patterns and Shapes of Contemporary Online Antisemitism and
Conspiracy Narratives -- an Annotation Guide and Labeled German-Language
Dataset in the Context of COVID-19
- arxiv url: http://arxiv.org/abs/2210.07934v1
- Date: Thu, 13 Oct 2022 10:32:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 15:50:32.216528
- Title: Codes, Patterns and Shapes of Contemporary Online Antisemitism and
Conspiracy Narratives -- an Annotation Guide and Labeled German-Language
Dataset in the Context of COVID-19
- Title(参考訳): 現代のオンライン反ユダヤ主義と陰謀物語の符号、パターン、形--covid-19の文脈における注釈ガイドとラベル付きドイツ語データセット
- Authors: Elisabeth Steffen, Helena Mihaljevi\'c, Milena Pustet, Nyco Bischoff,
Mar\'ia do Mar Castro Varela, Yener Bayramo\u{g}lu, Bahar Oghalai
- Abstract要約: インターネット上の反ユダヤ的・陰謀論のコンテンツは、データ駆動型アルゴリズムアプローチを不可欠にしている。
我々は、新型コロナウイルスのパンデミックの文脈において、オンラインコンテンツにおける反ユダヤ的・陰謀的理論のためのアノテーションガイドを開発する。
我々は、コード化やホロコースト後のアンチ・セミズムのような特定の形のアンチ・セミズムを含む作業定義を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Over the course of the COVID-19 pandemic, existing conspiracy theories were
refreshed and new ones were created, often interwoven with antisemitic
narratives, stereotypes and codes. The sheer volume of antisemitic and
conspiracy theory content on the Internet makes data-driven algorithmic
approaches essential for anti-discrimination organizations and researchers
alike. However, the manifestation and dissemination of these two interrelated
phenomena is still quite under-researched in scholarly empirical research of
large text corpora. Algorithmic approaches for the detection and classification
of specific contents usually require labeled datasets, annotated based on
conceptually sound guidelines. While there is a growing number of datasets for
the more general phenomenon of hate speech, the development of corpora and
annotation guidelines for antisemitic and conspiracy content is still in its
infancy, especially for languages other than English. We contribute to closing
this gap by developing an annotation guide for antisemitic and conspiracy
theory online content in the context of the COVID-19 pandemic. We provide
working definitions, including specific forms of antisemitism such as encoded
and post-Holocaust antisemitism. We use these to annotate a German-language
dataset consisting of ~3,700 Telegram messages sent between 03/2020 and
12/2021.
- Abstract(参考訳): 新型コロナウイルス(covid-19)パンデミックの過程で、既存の陰謀説が更新され、反ユダヤ主義的な物語、ステレオタイプ、コードとしばしば織り交ぜられた新しい陰謀説が作られた。
インターネット上の反ユダヤ主義や陰謀論のコンテンツは、データ駆動アルゴリズムのアプローチを反差別組織や研究者にも不可欠なものにしている。
しかし、これら2つの相互関連現象の顕在化と普及は、大文字コーパスの学術的実証研究においてはまだ十分に研究されていない。
特定の内容の検出と分類のためのアルゴリズム的アプローチは通常、概念的音声ガイドラインに基づいて注釈付けされたラベル付きデータセットを必要とする。
ヘイトスピーチのより一般的な現象に関するデータセットは増えているが、反ユダヤ主義や陰謀的なコンテンツのためのコーパスや注釈ガイドラインの開発はまだ初期段階にあり、特に英語以外の言語ではそうである。
我々は、新型コロナウイルスのパンデミックの文脈において、オンラインコンテンツにおける反ユダヤ・陰謀論のアノテーションガイドを開発することで、このギャップを埋めることに貢献している。
我々は、エンコードやホロコースト後の反ユダヤ主義のような特定の形態の反ユダヤ主義を含む作業定義を提供する。
03/2020から12/2021の間に送信された約3,700のTelegramメッセージからなるドイツ語のデータセットに注釈を付けます。
関連論文リスト
- What distinguishes conspiracy from critical narratives? A computational analysis of oppositional discourse [42.0918839418817]
本稿では,陰謀と批判的テキストを区別する,トピックに依存しない新しいアノテーション手法を提案する。
また、Telegramメッセージの高品質なアノテーションを含む多言語XAI-DisInfodemics corpus(英語とスペイン語)にも貢献する。
論文 参考訳(メタデータ) (2024-07-15T14:18:47Z) - Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.64412090339044]
音声から4つの言語アノテーションを自動抽出するタスクであるWav2Glossを提案する。
音声からのインターリニア・グロッシド・テキスト・ジェネレーションの今後の研究の基盤となる基盤となるものについて述べる。
論文 参考訳(メタデータ) (2024-03-19T21:45:29Z) - Monitoring the evolution of antisemitic discourse on extremist social media using BERT [3.3037858066178662]
ソーシャルメディアに対する人種差別と不寛容は、悪質なオンライン環境に寄与する。
オンライン議論において、反ユダヤ主義のテーマとその関連する用語を追跡することは、参加者の感情を監視するのに役立つだろう。
論文 参考訳(メタデータ) (2024-02-06T20:34:49Z) - Using LLMs to discover emerging coded antisemitic hate-speech in
extremist social media [4.104047892870216]
本稿では,新たに出現するヘイトレイデン用語を検出する手法を提案する。
この方法論は、オンラインの反ユダヤ的談話の文脈でテストされる。
論文 参考訳(メタデータ) (2024-01-19T17:40:50Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - How toxic is antisemitism? Potentials and limitations of automated
toxicity scoring for antisemitic online content [0.0]
Perspective APIはGoogleとJigsawによるテキスト毒性評価サービスである。
我々は、有害な反ユダヤ主義のテキストがいかに評価され、また、有害性のスコアが、異なるアンチ・セミズムのサブフォームに関してどのように異なるかを示す。
基本レベルでは、パースペクティブAPIは、反ユダヤ主義的な内容が有毒であると認識するが、非明示的な反ユダヤ主義の形式に関して重大な弱点を示す。
論文 参考訳(メタデータ) (2023-10-05T15:23:04Z) - From Dogwhistles to Bullhorns: Unveiling Coded Rhetoric with Language
Models [73.25963871034858]
本研究は,イヌヒストルの大規模数値計算による研究である。
我々は、ドッグウィストルの類型学を開発し、300以上のドッグウィストルの過去最大の用語集をキュレートし、歴史的なアメリカの政治家の演説でそれらの使用法を分析した。
犬毛を含む有害なコンテンツは毒性の検出を回避し,このような符号化された言語のオンラインリスクを強調している。
論文 参考訳(メタデータ) (2023-05-26T18:00:57Z) - Antisemitic Messages? A Guide to High-Quality Annotation and a Labeled
Dataset of Tweets [0.0]
我々は、6,941ツイートのラベル付きデータセットを作成し、ユダヤ人、イスラエル、反ユダヤ主義に関する会話に共通する幅広いトピックをカバーしています。
このデータセットには、IHRA(International Holocaust Remembrance Alliance)による反ユダヤ主義の定義に基づく1,250のツイート(18%)が含まれている。
論文 参考訳(メタデータ) (2023-04-28T02:52:38Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - Latent Topology Induction for Understanding Contextualized
Representations [84.7918739062235]
本研究では,文脈的埋め込みの表現空間について検討し,大規模言語モデルの隠れトポロジについて考察する。
文脈化表現の言語特性を要約した潜在状態のネットワークが存在することを示す。
論文 参考訳(メタデータ) (2022-06-03T11:22:48Z) - "Subverting the Jewtocracy": Online Antisemitism Detection Using
Multimodal Deep Learning [23.048101866010445]
オンラインの反ユダヤ主義の自動マルチモーダル検出の方向の最初の仕事を提示します。
TwitterとGabからの3,102と3,509のソーシャルメディア投稿で2つのデータセットをラベル付けしました。
本論文では, ポストからのテキストと画像を用いて, アンチセミズムコンテンツとその特定のアンチセミズムカテゴリの存在を検出するマルチモーダル深層学習システムを提案する。
論文 参考訳(メタデータ) (2021-04-13T05:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。