論文の概要: Beyond Denouncing Hate: Strategies for Countering Implied Biases and
Stereotypes in Language
- arxiv url: http://arxiv.org/abs/2311.00161v1
- Date: Tue, 31 Oct 2023 21:33:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 15:48:32.554663
- Title: Beyond Denouncing Hate: Strategies for Countering Implied Biases and
Stereotypes in Language
- Title(参考訳): 憎しみの否定を超えて: 言語における暗黙のバイアスとステレオタイプに対抗する戦略
- Authors: Jimin Mun, Emily Allaway, Akhila Yerukola, Laura Vianna, Sarah-Jane
Leslie, Maarten Sap
- Abstract要約: 我々は、心理学と哲学文学から、ヘイトフル言語の基礎となるステレオタイプ的含意に挑戦するために、6つの心理的にインスパイアされた戦略を構築する。
提案手法では,機械が生成する対音声はより具体的でない戦略を用いるのに対し,人間による対音声はインプリッドステレオタイプに特有な戦略を用いる。
以上の結果から,音声の反音声発生におけるステレオタイプ的含意の考慮の重要性が示唆された。
- 参考スコア(独自算出の注目度): 18.560379338032558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counterspeech, i.e., responses to counteract potential harms of hateful
speech, has become an increasingly popular solution to address online hate
speech without censorship. However, properly countering hateful language
requires countering and dispelling the underlying inaccurate stereotypes
implied by such language. In this work, we draw from psychology and philosophy
literature to craft six psychologically inspired strategies to challenge the
underlying stereotypical implications of hateful language. We first examine the
convincingness of each of these strategies through a user study, and then
compare their usages in both human- and machine-generated counterspeech
datasets. Our results show that human-written counterspeech uses countering
strategies that are more specific to the implied stereotype (e.g., counter
examples to the stereotype, external factors about the stereotype's origins),
whereas machine-generated counterspeech uses less specific strategies (e.g.,
generally denouncing the hatefulness of speech). Furthermore, machine-generated
counterspeech often employs strategies that humans deem less convincing
compared to human-produced counterspeech. Our findings point to the importance
of accounting for the underlying stereotypical implications of speech when
generating counterspeech and for better machine reasoning about
anti-stereotypical examples.
- Abstract(参考訳): counterspeech、すなわちヘイトスピーチの潜在的な害に対抗する反応は、検閲なしでオンラインヘイトスピーチに対処するための一般的なソリューションになりつつある。
しかし、憎しみに満ちた言語に適切に対応するためには、そのような言語に暗示される不正確なステレオタイプをカウンター・アンド・ディスペアリングする必要がある。
本研究は, 心理学と哲学の文献から, 憎悪言語の基礎的定型的意味に挑戦するために, 6つの心理的にインスパイアされた戦略を考案する。
まず,これらの戦略の妥当性をユーザスタディを通じて検証し,その利用状況を人文と機械生成の対音声データセットで比較する。
以上の結果から,人間によるカウンター音声は,指示されたステレオタイプ(例えば,ステレオタイプに対する反例,ステレオタイプの起源に関する外的要因)に比例したカウンター音声を利用するのに対し,機械生成のカウンター音声はより具体的でない戦略(例えば,音声の憎しみを否定する)を用いることがわかった。
さらに、機械生成の対音声は、人間が生成した対音声よりも説得力の低いと判断する戦略をしばしば採用している。
以上の結果から,反音声発生時の音声のステレオタイプ的含意と,反ステレオタイプ的事例に対する機械的推論の改善の重要性が示唆された。
関連論文リスト
- Generative AI may backfire for counterspeech [20.57872238271025]
我々は、最先端AIが生み出す文脈化された逆音声が、オンラインヘイトスピーチを抑制するのに有効であるかどうかを分析する。
その結果,非コンテクスチュアライズされた対応音声は,オンラインヘイトスピーチを著しく減少させることがわかった。
しかし、LLMsによって生成される文脈化された反音声は効果が無く、バックファイアさえも生じうる。
論文 参考訳(メタデータ) (2024-11-22T14:47:00Z) - Assessing the Human Likeness of AI-Generated Counterspeech [10.434435022492723]
Counterspeechは、悪質なコンテンツやヘイトフルコンテンツに対する反則と挑戦に対するターゲット的反応である。
従来の研究では、自動生成音声に対する様々な戦略が提案されている。
本稿では,AI生成音声の人間的類似性,有効性に影響を与える重要な要因について検討する。
論文 参考訳(メタデータ) (2024-10-14T18:48:47Z) - Hatred Stems from Ignorance! Distillation of the Persuasion Modes in Countering Conversational Hate Speech [0.0]
本研究は、説得モードを理性、感情、信頼性に蒸留する。
クローズド(複数ターン)とオープン(単ターン)の2つのタイプの会話において、人種差別、セクシズム、宗教的偏見に関する使用を評価している。
論文 参考訳(メタデータ) (2024-03-18T07:20:35Z) - An Investigation of Large Language Models for Real-World Hate Speech
Detection [46.15140831710683]
既存の手法の大きな制限は、ヘイトスピーチ検出がコンテキストの問題である点である。
近年,大規模言語モデル (LLM) はいくつかの自然言語処理において最先端の性能を示した。
本研究は, ヘイトスピーチの文脈を効果的に把握する上で, 巧妙な推論プロンプトが有効であることを明らかにする。
論文 参考訳(メタデータ) (2024-01-07T00:39:33Z) - ZET-Speech: Zero-shot adaptive Emotion-controllable Text-to-Speech
Synthesis with Diffusion and Style-based Models [83.07390037152963]
ZET-Speech はゼロショット適応型 TTS モデルである。
ユーザは、短い中性音声セグメントとターゲットの感情ラベルのみを使用して、任意の話者の感情音声を合成することができる。
実験の結果,ZET-Speechは自然音声と感情音声の合成に成功していることがわかった。
論文 参考訳(メタデータ) (2023-05-23T08:52:00Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Easily Accessible Text-to-Image Generation Amplifies Demographic
Stereotypes at Large Scale [61.555788332182395]
危険で複雑なステレオタイプを増幅する機械学習モデルの可能性を検討する。
さまざまな通常のプロンプトがステレオタイプを生成しており、それらは単に特性、記述子、職業、オブジェクトに言及するプロンプトを含む。
論文 参考訳(メタデータ) (2022-11-07T18:31:07Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Hate Speech Classifiers Learn Human-Like Social Stereotypes [4.132204773132937]
社会的ステレオタイプは、異なるグループについての個人の判断に悪影響を及ぼす。
社会的ステレオタイプは、人々が少数民族社会グループに向けられた言語をどのように理解するかにおいて重要な役割を担っている。
論文 参考訳(メタデータ) (2021-10-28T01:35:41Z) - Impact and dynamics of hate and counter speech online [0.0]
市民によるカウンタースピーチは、ヘイトスピーチと戦い、平和的で非分極的な言論を促進するための有望な方法だ。
われわれはドイツのTwitterで4年間に起きた180,000件の政治的会話を分析した。
論文 参考訳(メタデータ) (2020-09-16T01:43:28Z) - A Framework for the Computational Linguistic Analysis of Dehumanization [52.735780962665814]
我々は1986年から2015年にかけてニューヨーク・タイムズでLGBTQの人々に関する議論を分析した。
LGBTQの人々の人為的な記述は、時間とともにますます増えています。
大規模に非人間化言語を分析する能力は、メディアバイアスを自動的に検出し、理解するだけでなく、オンラインで乱用する言語にも影響を及ぼす。
論文 参考訳(メタデータ) (2020-03-06T03:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。