論文の概要: A Taxonomy of Response Strategies to Toxic Online Content: Evaluating the Evidence
- arxiv url: http://arxiv.org/abs/2509.09921v1
- Date: Fri, 12 Sep 2025 02:02:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:07.957711
- Title: A Taxonomy of Response Strategies to Toxic Online Content: Evaluating the Evidence
- Title(参考訳): 有害オンラインコンテンツに対する反応戦略の分類--エビデンスの評価
- Authors: Lisa Schirch, Kristina Radivojevic, Cathy Buerger,
- Abstract要約: Toxic Online Content (TOC) には、有害で敵対的で、建設的な公開談話に害を与えるデジタルプラットフォーム上のメッセージが含まれている。
彼らの目標、用語、反応戦略、影響を評価する方法には幅広いバリエーションがある。
本稿では、より健全なオンライン公開談話を構築するために、あらゆる種類のオンラインスピーチを含むオンライン対応戦略の分類を同定する。
- 参考スコア(独自算出の注目度): 0.6372261626436676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Toxic Online Content (TOC) includes messages on digital platforms that are harmful, hostile, or damaging to constructive public discourse. Individuals, organizations, and LLMs respond to TOC through counterspeech or counternarrative initiatives. There is a wide variation in their goals, terminology, response strategies, and methods of evaluating impact. This paper identifies a taxonomy of online response strategies, which we call Online Discourse Engagement (ODE), to include any type of online speech to build healthier online public discourse. The literature on ODE makes contradictory assumptions about ODE goals and rarely distinguishes between them or rigorously evaluates their effectiveness. This paper categorizes 25 distinct ODE strategies, from humor and distraction to empathy, solidarity, and fact-based rebuttals, and groups these into a taxonomy of five response categories: defusing and distracting, engaging the speaker's perspective, identifying shared values, upstanding for victims, and information and fact-building. The paper then systematically reviews the evidence base for each of these categories. By clarifying definitions, cataloging response strategies, and providing a meta-analysis of research papers on these strategies, this article aims to bring coherence to the study of ODE and to strengthen evidence-informed approaches for fostering constructive ODE.
- Abstract(参考訳): Toxic Online Content (TOC) には、有害で敵対的で、建設的な公開談話に害を与えるデジタルプラットフォーム上のメッセージが含まれている。
個人、組織、LLMは、対言的または反ナラティブ的イニシアチブを通じてTOCに反応する。
彼らの目標、用語、反応戦略、影響を評価する方法には幅広いバリエーションがある。
本稿では、オンライン・ディスコース・エンゲージメント(ODE)と呼ばれるオンライン・ディスコース・ストラテジーの分類を特定し、より健全なオンライン・ディスコースを構築するためのあらゆる種類のオンライン・スピーチを含める。
ODEに関する文献は、ODEの目標について矛盾した仮定をしており、それらの区別や、その効果を厳格に評価することはめったにない。
本稿では, ユーモア, 気晴らし, 共感, 連帯性, 事実に基づく反感から25種類のODE戦略を分類し, これらを5つの応答カテゴリーの分類群に分類する。
論文はその後、それぞれのカテゴリのエビデンスベースを体系的にレビューする。
本稿では,これらの戦略に関する研究論文のメタ分析と定義を明確にすることにより,ODE研究にコヒーレンスをもたらすとともに,構築的ODEを育成するためのエビデンスインフォームドアプローチを強化することを目的とする。
関連論文リスト
- HatePRISM: Policies, Platforms, and Research Integration. Advancing NLP for Hate Speech Proactive Mitigation [67.69631485036665]
我々は3つの観点からヘイトスピーチ規制と戦略を総合的に検討する。
以上の結果から,ヘイトスピーチ定義や地域ごとのモデレーション慣行に重大な矛盾があることが判明した。
自動ヘイトスピーチモデレーションのための統合フレームワークのさらなる検討のためのアイデアと研究の方向性を提案する。
論文 参考訳(メタデータ) (2025-07-06T11:25:23Z) - Understanding and Analyzing Inappropriately Targeting Language in Online Discourse: A Comparative Annotation Study [1.0923877073891446]
本稿では,ChatGPTにクラウドとエキスパートアノテーションを統合することで,オンライン会話における不適切なターゲット言語を検出する手法を提案する。
Redditの英語の会話スレッドに注目し、個人やグループをターゲットにしたコメントを調べます。
我々は,人間の専門家,群衆アノテータ,ChatGPTのアノテーションの比較分析を行い,明示的なヘイトスピーチと微妙な差別言語の両方を認識する上で,それぞれの手法の長所と短所を明らかにした。
論文 参考訳(メタデータ) (2025-05-22T16:10:43Z) - Talking Point based Ideological Discourse Analysis in News Events [62.18747509565779]
本稿では,イデオロギー的談話分析理論をモチベーションとして,実世界の出来事に関するニュース記事を分析する枠組みを提案する。
我々のフレームワークは,話題のトピックとともに,エンティティ,役割,メディアフレーム間の相互作用を捉えた,会話ポイントという関係構造を用いたニュース記事を表現している。
我々は,人間の検証によって補足されたイデオロギーや分派的分類タスクを通じて,これらの視点を自動で生成するフレームワークの能力を評価する。
論文 参考訳(メタデータ) (2025-04-10T02:52:34Z) - Illusions of Relevance: Using Content Injection Attacks to Deceive Retrievers, Rerankers, and LLM Judges [52.96987928118327]
検索,リランカー,大型言語モデル(LLM)の埋め込みモデルは,コンテンツインジェクション攻撃に対して脆弱であることがわかった。
主な脅威は,(1) 意味不明な内容や有害な内容の挿入,(2) 関連性を高めるために,問合せ全体あるいはキークエリ用語の挿入,の2つである。
本研究は, 注射内容の配置や関連物質と非関連物質とのバランスなど, 攻撃の成功に影響を与える要因を系統的に検討した。
論文 参考訳(メタデータ) (2025-01-30T18:02:15Z) - Evaluating Copyright Takedown Methods for Language Models [100.38129820325497]
言語モデル(LM)は、潜在的に著作権のある資料を含む様々なデータに対する広範な訓練からその能力を引き出す。
本稿では,LMの著作権削除の可能性と副作用を初めて評価する。
システムプロンプトの追加、デコード時間フィルタリングの介入、未学習アプローチなど、いくつかの戦略を検討する。
論文 参考訳(メタデータ) (2024-06-26T18:09:46Z) - The Unappreciated Role of Intent in Algorithmic Moderation of Social Media Content [2.2618341648062477]
本稿では,コンテンツモデレーションシステムにおける意図の役割について考察する。
本研究は,意識と意図を捉える能力を評価するために,オンライン虐待に対するアート検出モデルとベンチマークトレーニングデータセットの現状をレビューする。
論文 参考訳(メタデータ) (2024-05-17T18:05:13Z) - Discursive objection strategies in online comments: Developing a classification schema and validating its training [2.6603898952678167]
多くのアメリカ人は、誤情報、ヘイトスピーチ、ハラスメントは有害であり、ソーシャルメディアに不適切であると同意している。
われわれは、YouTubeとTwitterのトレンドニュースビデオに対する6500件以上のコメント回答のコンテンツ分析を行った。
我々は7つの異なる非帰的反対戦略を特定した。
論文 参考訳(メタデータ) (2024-05-13T19:39:00Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Handling Bias in Toxic Speech Detection: A Survey [26.176340438312376]
本稿では,有毒な音声検出におけるバイアスの評価と緩和手法について検討する。
ケーススタディでは、知識に基づくバイアス緩和によるバイアスシフトの概念を紹介している。
調査は、重要な課題、研究のギャップ、今後の方向性の概要で締めくくっている。
論文 参考訳(メタデータ) (2022-01-26T10:38:36Z) - RESPER: Computationally Modelling Resisting Strategies in Persuasive
Conversations [0.7505101297221454]
説得的会話における抵抗戦略を識別するための一般化フレームワークを提案する。
実験では,非協調的目標指向会話におけるパワーロールの非対称性を明らかにする。
また,会話結果に対するさまざまな抵抗戦略の役割についても検討した。
論文 参考訳(メタデータ) (2021-01-26T03:44:17Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。