論文の概要: Cross-Platform Violence Detection on Social Media: A Dataset and Analysis
- arxiv url: http://arxiv.org/abs/2506.03312v1
- Date: Tue, 03 Jun 2025 18:54:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:14.01287
- Title: Cross-Platform Violence Detection on Social Media: A Dataset and Analysis
- Title(参考訳): ソーシャルメディア上でのクロスプラットフォームビオレンス検出:データセットと解析
- Authors: Celia Chen, Scotty Beland, Ingo Burghardt, Jill Byczek, William J. Conway, Eric Cotugno, Sadaf Davre, Megan Fletcher, Rajesh Kumar Gnanasekaran, Kristin Hamilton, Marilyn Harbert, Jordan Heustis, Tanaya Jha, Emily Klein, Hayden Kramer, Alex Leitch, Jessica Perkins, Casi Sherman, Celia Sterrn, Logan Stevens, Rebecca Zarrella, Jennifer Golbeck,
- Abstract要約: 暴力的な脅威やサブタイプの暴力に対して手書きの投稿3万件のクロスプラットフォームデータセットを導入します。
このデータセットに存在する信号を評価するために、既存のYouTubeからの暴力的なコメントのデータセットを用いて機械学習分析を行う。
- 参考スコア(独自算出の注目度): 1.3007535106461825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Violent threats remain a significant problem across social media platforms. Useful, high-quality data facilitates research into the understanding and detection of malicious content, including violence. In this paper, we introduce a cross-platform dataset of 30,000 posts hand-coded for violent threats and sub-types of violence, including political and sexual violence. To evaluate the signal present in this dataset, we perform a machine learning analysis with an existing dataset of violent comments from YouTube. We find that, despite originating from different platforms and using different coding criteria, we achieve high classification accuracy both by training on one dataset and testing on the other, and in a merged dataset condition. These results have implications for content-classification strategies and for understanding violent content across social media.
- Abstract(参考訳): 暴力的な脅威は、ソーシャルメディアプラットフォーム全体で大きな問題であり続けている。
有益で高品質なデータは、暴力を含む悪意のあるコンテンツの理解と検出を容易にする。
本稿では、暴力的脅威や、政治的・性的暴力を含むサブタイプの暴力に対して手書きされた3万件の投稿のクロスプラットフォームデータセットについて紹介する。
このデータセットに存在する信号を評価するために、既存のYouTubeからの暴力的なコメントのデータセットを用いて機械学習分析を行う。
異なるプラットフォームから派生し、異なるコーディング基準を用いているにも関わらず、1つのデータセットでトレーニングし、他方でテストし、統合されたデータセット条件で、高い分類精度を達成できることに気付きました。
これらの結果は、コンテンツ分類戦略やソーシャルメディア全体での暴力的コンテンツ理解に影響を及ぼす。
関連論文リスト
- Multi-Platform Aggregated Dataset of Online Communities (MADOC) [64.45797970830233]
MADOCはBluesky、Koo、Reddit、Voat(2012-2024)のデータを集め、標準化している。
このデータセットは、標準化されたインタラクション記録と感情分析を通じて、プラットフォーム間の有害な振る舞いの進化の比較研究を可能にする。
論文 参考訳(メタデータ) (2025-01-22T14:02:11Z) - Modeling offensive content detection for TikTok [0.0]
本研究では,攻撃内容を含むTikTokデータの収集と解析を行う。
攻撃的なコンテンツ検出のための一連の機械学習とディープラーニングモデルを構築している。
論文 参考訳(メタデータ) (2024-08-29T18:47:41Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Collective Obfuscation and Crowdsourcing [2.28438857884398]
レポートプラットフォームの普及には,ユニークなセキュリティとプライバシの影響が伴っていることを,私たちは示しています。
プラットフォームの正当性を阻害することを目的とした,協調的難読化戦略を同定する。
論文 参考訳(メタデータ) (2022-08-12T17:57:33Z) - Panning for gold: Lessons learned from the platform-agnostic automated
detection of political content in textual data [48.7576911714538]
異なるプラットフォーム間で政治的コンテンツを検出するために、これらの技術がどのように使用できるかについて議論する。
辞書,教師付き機械学習,ニューラルネットワークに依存する3つの検出手法のパフォーマンスを比較した。
この結果から,ニューラルネットワークと機械学習に基づくモデルによって達成されるノイズの少ないデータに対して,事前処理がモデル性能に与える影響が限定された。
論文 参考訳(メタデータ) (2022-07-01T15:23:23Z) - Data Expansion using Back Translation and Paraphrasing for Hate Speech
Detection [1.192436948211501]
本稿では,バック翻訳手法を融合した新しい深層学習手法と,データ拡張のためのパラフレージング手法を提案する。
AskFm corpus, Formspring データセット, Warner と Waseem データセット, Olid および Wikipedia の有毒なコメントデータセットである。
論文 参考訳(メタデータ) (2021-05-25T09:52:42Z) - Content-based Analysis of the Cultural Differences between TikTok and
Douyin [95.32409577885645]
ショートフォームのソーシャルメディアは、聴衆にダイナミックなストーリーを伝え、彼らの注意を引き付けることによって、伝統的なメディアパラダイムから遠ざかる。
特に、興味深く、理解しやすいユニークなシーンを表現するために、日常的なオブジェクトの異なる組み合わせを用いることができる。
同じ会社によって提供されたTikTokとDouyinは、近年人気になった新しいメディアの好例だ。
メディアファッションや社会的慣用性とともに文化的な違いを表現しているという仮説が,本研究の主目的である。
論文 参考訳(メタデータ) (2020-11-03T01:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。