論文の概要: Semantic Gradients Interactions in SSD: A Case Study in Racial Identity and Hate Speech
- arxiv url: http://arxiv.org/abs/2605.27322v1
- Date: Tue, 26 May 2026 17:33:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.567182
- Title: Semantic Gradients Interactions in SSD: A Case Study in Racial Identity and Hate Speech
- Title(参考訳): SSDにおけるセマンティック・グラディエント相互作用--Racial IdentityとHate Speechを事例として
- Authors: Felix Ostrowicki, Hubert Plisiecki,
- Abstract要約: 本稿では,Supervised Semantic Differentialの拡張であるInteraction SSDを紹介する。
セマンティックな意味が、グループ、特徴、あるいはこのバリエーションをテスト可能で解釈可能にする条件など、モデレーター間でどのように変化するかをモデル化する。
カリフォルニア大学バークレー校のヘイトスピーチコーパスで、アノテーターの人種的アイデンティティがヘイトスピーチの判断を中和するかどうかを検証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce interaction SSD, an extension of Supervised Semantic Differential that models how semantic meaning varies across moderators such as groups, traits, or conditions making this variation testable and interpretable. The method estimates a main semantic gradient, an interaction gradient, and conditional gradients, all interpretable through standard SSD tools. We illustrate it on the UC Berkeley Measuring Hate Speech corpus, testing whether annotator racial identity moderates hate-speech judgments of comments targeting people of color. The interaction model detects a significant moderation effect: the shared gradient contrasts dehumanizing hostility with counter-speech, while the interaction gradient reveals smaller group-linked differences in which semantic cues predict hate-speech ratings. Interaction SSD makes moderated meaning-outcome relationships statistically testable and interpretable.
- Abstract(参考訳): グループや特徴,あるいはこのバリエーションを検証可能かつ解釈可能な条件など,モデレーター間で意味的意味がどう変化するかをモデル化する,Supervised Semantic Differentialの拡張であるInteraction SSDを導入する。
本手法は, 主意味勾配, 相互作用勾配, 条件勾配を推定し, すべて標準SSDツールで解釈可能である。
カリフォルニア大学バークレー校のヘイトスピーチコーパスで、アノテーターの人種的アイデンティティが、有色人種をターゲットにしたコメントのヘイトスピーチ判断を中和するかどうかをテストする。
共有勾配は、敵対性を反音声と非人間的に対比する一方、相互作用勾配は、セマンティック・キューがヘイト音声の評価を予測するグループリンクの差を小さくする。
インタラクションSSDは、統計的に検証可能で解釈可能である。
関連論文リスト
- A Multimodal Framework for Aligning Human Linguistic Descriptions with Visual Perceptual Data [0.0]
人間の参照解釈の中核的な側面をモデル化する計算フレームワークを提案する。
スタンフォード・リピート・レファレンス・ゲーム・コーパス(Stanford Repeated Reference Game corpus)のモデルを評価する。
その結果, 比較的単純な知覚言語的アライメント機構は, 人間の競争行動をもたらすことが示唆された。
論文 参考訳(メタデータ) (2026-02-23T07:20:11Z) - Boosting Accuracy and Interpretability in Multilingual Hate Speech Detection Through Layer Freezing and Explainable AI [0.0]
本研究では,感情分析とヘイトスピーチ検出のための3つのトランスフォーマーモデルの性能について検討した。
評価は英語、韓国語、日本語、中国語、フランス語の5言語で行われている。
モデル決定に対する個々の単語の寄与を強調するために、局所解釈型モデル非依存説明(LIME)フレームワークを統合する。
論文 参考訳(メタデータ) (2026-01-06T04:07:51Z) - Identifying and interpreting non-aligned human conceptual
representations using language modeling [0.0]
先天性失明は,a-モダル語と知覚関連言語ドメインの両方において概念的再編成を引き起こすことを示す。
視覚障害者は、より強く社会的・認知的な意味と、行動に関連する動詞を関連づける。
一部の動詞では、盲目と盲目の表現は非常に似ている。
論文 参考訳(メタデータ) (2024-03-10T13:02:27Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation [60.62039705180484]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Domain-level Pairwise Semantic Interaction for Aspect-Based Sentiment
Classification [3.1977819149534987]
Pairwise Semantic Interaction (PSI) モジュールを提案する。
各文のキーセマンティックな特徴を効果的に強調するために、異なるゲートが生成される。
最後に、ベクトル間の敵対的相互作用は、2つの文の意味表現をより区別しやすくするために用いられる。
論文 参考訳(メタデータ) (2022-02-21T07:59:17Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Improving Counterfactual Generation for Fair Hate Speech Detection [26.79268141793483]
バイアス緩和アプローチは、社会集団トークン(SGTs)のような、データの繊細な特徴に対するモデルの依存を減らす
しかし、ヘイトスピーチ検出においては、モデル予測の等化は、対象とする社会グループ間での重要な違いを無視する可能性がある。
ここでは,SGTの変更によって生じる,反事実の公平性に頼り,反事実間の予測を等化する。
論文 参考訳(メタデータ) (2021-08-03T19:47:27Z) - Constructing interval variables via faceted Rasch measurement and
multitask deep learning: a hate speech application [63.10266319378212]
本稿では,教師付き深層学習と多面的ラッシュアイテム応答理論(IRT)構築手法を組み合わせることで,連続区間スペクトル上の複素変数を測定する手法を提案する。
われわれは、YouTube、Twitter、Redditから5万件のソーシャルメディアコメントを収集し、1万1000人の米国拠点のAmazon Mechanical Turkの労働者によってラベル付けされたデータセット上で、この新しい手法を実証した。
論文 参考訳(メタデータ) (2020-09-22T02:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。