Fugu-MT 論文翻訳(概要): Cultural Targets, Structural Frames, Binding Morals: A Cross-Lingual Audit of Online Hate in Multicultural Singapore

論文の概要: Cultural Targets, Structural Frames, Binding Morals: A Cross-Lingual Audit of Online Hate in Multicultural Singapore

arxiv url: http://arxiv.org/abs/2606.21996v1
Date: Sat, 20 Jun 2026 11:21:05 GMT
ステータス: 情報取得中
システム内更新日: 2026-06-23 15:18:13.850499
Title: Cultural Targets, Structural Frames, Binding Morals: A Cross-Lingual Audit of Online Hate in Multicultural Singapore
Title（参考訳）: 文化目標, 構造枠, 結合モラル:多文化シンガポールにおけるオンラインHateの言語横断的監査
Authors: Emilio Ferrara,
Abstract要約: シンガポールを中心とする2025年のFacebook、Reddit、YouTubeのコーパス(31.0万項目; 1.76万コメントが11のアイデンティティーグループに言及)から、私たちは8つのオープンな大規模言語モデルを、人間による補償金セットに対するヘイトアノテーターとしてベンチマークした。コミュニティが嫌いなものから、それが嫌いな理由へと移行するにつれて、言語間の相違は単調に減少します。
参考スコア（独自算出の注目度）: 8.970269049715933
License:
Abstract: Multicultural Singapore hosts overlapping language publics (English, Chinese, and Malay) that discuss the same out-groups in parallel, a natural setting to ask whether online hate shares a structure across languages and whether what a community $\textit{produces}$ is what it $\textit{amplifies}$. From a Singapore-centric 2025 Facebook, Reddit, and YouTube corpus (31.0M items; 1.76M comments mentioning eleven identity groups), we benchmark eight open large language models as hate annotators against a human-adjudicated gold set, adopt the best (Phi-4: accuracy 0.95, Cohen's $κ$=0.91, recall 1.00 on an independent manual check), and replicate every finding under a second model. The results converge on one thesis, $\textit{layered cultural contingency}$: cross-lingual divergence falls monotonically as one moves from what a community hates to how and why it hates. Which out-groups are targeted is culturally specific (language $\times$ target $V$=0.25), but the threat frames and the binding moral grammar of hate (sanctity and loyalty, $55-75\%$, not fairness) are far more shared across languages, with divergence dropping to $V$=0.08 for moral foundations and 0.07 for emotion. Hate is contempt-driven and voices an out-group, anti-immigration grievance rather than an anti-system one. Reception is selectively nativist: hateful comments are amplified less than neutral mentions overall, yet anti-immigrant hate is preferentially amplified while religious and anti-LGBTQ hate is not, and volume does not track 2025 Singapore key events. We further show that absolute hate prevalence is not well defined at the LLM-annotator level, with agreement ceilings at $κ\approx0.42$ across models, so we report relative structure as primary. The findings bear directly on cross-lingual content moderation.
Abstract（参考訳）: 多文化のシンガポールでは、同じアウトグループを並行して議論する言語公開(英語、中国語、マレー語)が重複しており、オンラインヘイトが言語間で構造を共有しているかどうか、コミュニティが$\textit{produces}$が$\textit{amplify}$であるかどうかを問う自然な設定となっている。シンガポール中心の2025年のFacebook、Reddit、YouTubeコーパス(31.0万項目; 1.76万コメントが11のアイデンティティグループに言及)から、我々は8つのオープンな大規模言語モデルを、ヒトが指定した金セットに対するヘイトアノテータとしてベンチマークし、ベストを採用(Phi-4:精度0.95、Cohenの$κ$=0.91、独立したマニュアルチェックで1.00をリコール)し、2番目のモデルの下ですべての発見を再現する。コミュニティが嫌いなものから、それが嫌いな理由へと移行するにつれて、言語間の相違は単調に減少します。どちらのアウトグループを対象とするかは文化的に具体的である(言語$\times$ target $V$=0.25)が、脅威フレームとヘイト(正当性と忠誠、55-75\%$、フェアネスではない)の結合道徳的文法は言語間ではるかに共有されており、道徳的基礎についてはV$=0.08、感情については0.07となっている。ヘイトは軽蔑的であり、アンチ・システムではなく、集団外の反移民的欲求を訴えている。ヘイトフルコメントは全体的に中立的な言及よりも増幅されているが、反移民ヘイトは優先的に増幅されている。さらに、LLM-アノテータレベルで絶対憎悪の頻度が十分に定義されていないことを示し、契約天井はモデル全体でκ\approx0.42$であるので、相対構造をプライマリとして報告する。この結果は、言語間のコンテンツモデレーションに直接関係している。

関連論文リスト

Hate Speech and Offensive Content Detection in Indo-Aryan Languages: A Battle of LSTM and Transformers [0.0]
我々はベンガル語、アサメセ語、ボド語、シンハラ語、グジャラート語の5つの異なる言語でヘイトスピーチの分類を比較した。 Bert Base Multilingual Casedは、ベンガル語で0.67027得点、アサメ語で0.70525得点を達成した。シンハラではXLM-RはF1スコア0.83493で際立っているが、グジャラティではF1スコア0.76601で照らされたカスタムLSTMベースのモデルである。
論文参考訳（メタデータ） (2023-12-09T20:24:00Z)
Exploring Cross-Cultural Differences in English Hate Speech Annotations: From Dataset Construction to Analysis [44.17106903728264]
ほとんどのヘイトスピーチデータセットは、単一の言語における文化的多様性を無視している。そこで本研究では,CRoss文化の英語Hate音声データセットであるCREHateを紹介する。 CREHateのポストの56.2%のみが全国でコンセンサスを達成しており、ペアのラベル差が最も高いのは26%である。
論文参考訳（メタデータ） (2023-08-31T13:14:47Z)
Speaking Multiple Languages Affects the Moral Bias of Language Models [70.94372902010232]
事前訓練された多言語言語モデル(PMLM)は、複数の言語からのデータや言語間転送を扱う際に一般的に用いられる。モデルは英語から道徳的規範を捉え、他の言語に強制するか? 我々の実験は、事実、PMLMが道徳的バイアスを符号化していることを示しているが、これらは必ずしも人間の意見の文化的相違や共通点に対応しているわけではない。
論文参考訳（メタデータ） (2022-11-14T20:08:54Z)
Korean Online Hate Speech Dataset for Multilabel Classification: How Can Social Science Improve Dataset on Hate Speech? [0.4893345190925178]
韓国のネットヘイトスピーチデータセットに7つのカテゴリーのヘイトスピーチを分類することを提案する。私たちの35Kデータセットは、Krippendorff氏のAlphaレーベルによる24Kのオンラインコメントで構成されています。従来の二分的ヘイトや非ヘイト二分法とは異なり、文化と言語の両方の文脈を考慮したデータセットを設計した。
論文参考訳（メタデータ） (2022-04-07T07:29:06Z)
bitsa_nlp@LT-EDI-ACL2022: Leveraging Pretrained Language Models for Detecting Homophobia and Transphobia in Social Media Comments [0.9981479937152642]
ソーシャルメディアコメントにおけるホモフォビアとトランスフォビアを検出するためのLT-EDI共有タスクを提案する。我々はmBERTのようなモノリンガル・マルチリンガル・トランスフォーマーモデルを用いて実験を行った。私たちは、タミル語だけでなく、英語でYouTubeコメントの注意深い注釈付き実生活データセット上で、彼らのパフォーマンスを観察します。
論文参考訳（メタデータ） (2022-03-27T10:15:34Z)
Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文参考訳（メタデータ） (2022-01-15T20:48:14Z)
One to rule them all: Towards Joint Indic Language Hate Speech Detection [7.296361860015606]
本稿では、最先端のトランスフォーマー言語モデルを用いて、ヘイトや攻撃的な音声検出を共同で学習する多言語アーキテクチャを提案する。提案したテストコーパスでは,サブタスク1AのマクロF1スコアが0.7996,0.7748,0.8651,サブタスク1Bのきめ細かい分類において0.6268,0.5603となる。
論文参考訳（メタデータ） (2021-09-28T13:30:00Z)
Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文参考訳（メタデータ） (2020-05-25T21:58:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。