Fugu-MT 論文翻訳(概要): Hostile Counterspeech Drives Users From Hate Subreddits

論文の概要: Hostile Counterspeech Drives Users From Hate Subreddits

arxiv url: http://arxiv.org/abs/2405.18374v1
Date: Tue, 28 May 2024 17:12:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-29 17:30:42.154961
Title: Hostile Counterspeech Drives Users From Hate Subreddits
Title（参考訳）: ヘイト・サブレディット(Hate Subreddits)からユーザーを駆逐する敵対的カウンテルピー
Authors: Daniel Hickey, Matheus Schmitz, Daniel M. T. Fessler, Paul E. Smaldino, Kristina Lerman, Goran Murić, Keith Burghardt,
Abstract要約: 我々は、Redditにおけるヘイトサブレディット内の新参者に対する反音声の効果を分析した。非敵対的なカウンタースピーチは、ユーザーがこれらの憎悪のサブレディットから完全に切り離すのを防ぐのに効果がない。単一の敵対的な反論は、将来のエンゲージメントの可能性を大幅に減らす。
参考スコア（独自算出の注目度）: 1.5035331281822
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Counterspeech -- speech that opposes hate speech -- has gained significant attention recently as a strategy to reduce hate on social media. While previous studies suggest that counterspeech can somewhat reduce hate speech, little is known about its effects on participation in online hate communities, nor which counterspeech tactics reduce harmful behavior. We begin to address these gaps by identifying 25 large hate communities ("subreddits") within Reddit and analyzing the effect of counterspeech on newcomers within these communities. We first construct a new public dataset of carefully annotated counterspeech and non-counterspeech comments within these subreddits. We use this dataset to train a state-of-the-art counterspeech detection model. Next, we use matching to evaluate the causal effects of hostile and non-hostile counterspeech on the engagement of newcomers in hate subreddits. We find that, while non-hostile counterspeech is ineffective at keeping users from fully disengaging from these hate subreddits, a single hostile counterspeech comment substantially reduces both future likelihood of engagement. While offering nuance to the understanding of counterspeech efficacy, these results a) leave unanswered the question of whether hostile counterspeech dissuades newcomers from participation in online hate writ large, or merely drives them into less-moderated and more extreme hate communities, and b) raises ethical considerations about hostile counterspeech, which is both comparatively common and might exacerbate rather than mitigate the net level of antagonism in society. These findings underscore the importance of future work to improve counterspeech tactics and minimize unintended harm.
Abstract（参考訳）: ヘイトスピーチに反対する「カウンタースピーチ」は、ソーシャルメディアでのヘイトスピーチを減らす戦略として近年注目されている。以前の研究では、反音声はヘイトスピーチを幾らか減らす可能性があると示唆されていたが、オンラインヘイトコミュニティへの参加に対する効果についてはほとんど分かっていない。 Reddit内で25の大規模なヘイトコミュニティ(サブレディット)を特定し、これらのコミュニティ内の新参者に対する反音声の効果を分析することで、これらのギャップに対処し始めます。まず,これらのサブレディット内に,注意深い注釈付き対数音声コメントと非対数音声コメントのデータセットを構築した。このデータセットを使用して、最先端の音声検出モデルをトレーニングする。次に,憎悪のサブレディットにおける新参者のエンゲージメントに対する敵対的・非敵対的反響の因果効果を評価するためにマッチングを用いた。非敵対的なカウンタースピーチは、ユーザーがこれらの憎悪のサブレディットから完全に切り離されるのを防ぐには効果がないが、単一の敵対的なカウンタースピーチコメントは、将来のエンゲージメントの可能性を著しく減少させる。対音声効果の理解にニュアンスを与えながら, これらの結果が得られた。 a) 敵意の反弁論が、新参者に対して、ネットヘイトフルトへの参加を強要するか、あるいは単に、調整の少ない、より極端なヘイトコミュニティへと駆り立てるか、という疑問を未解決にしておくこと。 b) 相対的に一般的であり,社会における対立性の純レベルを緩和するよりも,さらに悪化する可能性のある敵対的対言に関する倫理的考察を提起すること。これらの知見は、対音声戦術を改善し、意図しない害を最小限に抑えるための今後の研究の重要性を浮き彫りにした。

関連論文リスト

Generative AI may backfire for counterspeech [20.57872238271025]
我々は、最先端AIが生み出す文脈化された逆音声が、オンラインヘイトスピーチを抑制するのに有効であるかどうかを分析する。その結果,非コンテクスチュアライズされた対応音声は,オンラインヘイトスピーチを著しく減少させることがわかった。しかし、LLMsによって生成される文脈化された反音声は効果が無く、バックファイアさえも生じうる。
論文参考訳（メタデータ） (2024-11-22T14:47:00Z)
NLP Systems That Can't Tell Use from Mention Censor Counterspeech, but Teaching the Distinction Helps [43.40965978436158]
問題のある内容に反論する対訳は、しばしば有害な言語に言及するが、それ自体は有害ではない。最近の言語モデルでさえ、言及と使用の区別に失敗していることを示す。この失敗は、誤報とヘイトスピーチ検出という2つの重要な下流タスクに伝播する。
論文参考訳（メタデータ） (2024-04-02T05:36:41Z)
An Investigation of Large Language Models for Real-World Hate Speech Detection [46.15140831710683]
既存の手法の大きな制限は、ヘイトスピーチ検出がコンテキストの問題である点である。近年,大規模言語モデル (LLM) はいくつかの自然言語処理において最先端の性能を示した。本研究は, ヘイトスピーチの文脈を効果的に把握する上で, 巧妙な推論プロンプトが有効であることを明らかにする。
論文参考訳（メタデータ） (2024-01-07T00:39:33Z)
Analyzing User Characteristics of Hate Speech Spreaders on Social Media [20.57872238271025]
ヘイトスピーチにおけるユーザ特性の役割を分析する。社会的影響の少ないユーザーは、ヘイトスピーチをシェアする傾向にある。政治的反トランプと反右派憎悪は、より大きな社会的影響力を持つユーザーによって再創造される。
論文参考訳（メタデータ） (2023-10-24T12:17:48Z)
CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文参考訳（メタデータ） (2023-03-02T17:30:43Z)
Quantifying How Hateful Communities Radicalize Online Users [2.378428291297535]
我々は、他のソーシャルネットワークに伝播するヘイトスピーチの観点から、フロンティアヘイトフルなコミュニティに参加することの影響を計測する。 Redditのデータを使って、1種類のエコーチャンバーに参加する効果を評価する。有害な言論はコミュニティに留まらないことを示す。
論文参考訳（メタデータ） (2022-09-19T01:13:29Z)
Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文参考訳（メタデータ） (2022-03-04T15:59:06Z)
Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文参考訳（メタデータ） (2022-01-15T20:48:14Z)
Nipping in the Bud: Detection, Diffusion and Mitigation of Hate Speech on Social Media [21.47216483704825]
本稿では,自動ヘイト緩和システムの構築を妨げる方法論的課題について述べる。ソーシャルメディア上でのヘイトスピーチの拡散を制限するための一連のソリューションについて論じる。
論文参考訳（メタデータ） (2022-01-04T03:44:46Z)
Countering Online Hate Speech: An NLP Perspective [34.19875714256597]
オンラインヘイトフル行動の傘語であるオンライン毒性は、オンラインヘイトスピーチのような形で現れている。ソーシャルメディアを通じた大量コミュニケーションの増加は、オンラインヘイトスピーチの有害な結果をさらに悪化させる。本稿では、ヘイトスピーチにおけるNLP対応手法に関する総合的な概念的枠組みと、オンラインヘイトスピーチ対策におけるNLPの現在の動向に関する徹底的な調査について述べる。
論文参考訳（メタデータ） (2021-09-07T08:48:13Z)
Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文参考訳（メタデータ） (2020-05-25T21:58:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。