論文の概要: Introducing an Abusive Language Classification Framework for Telegram to
Investigate the German Hater Community
- arxiv url: http://arxiv.org/abs/2109.07346v1
- Date: Wed, 15 Sep 2021 14:58:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 15:04:42.172658
- Title: Introducing an Abusive Language Classification Framework for Telegram to
Investigate the German Hater Community
- Title(参考訳): ドイツ憎悪者コミュニティ調査のためのtelegram用乱用言語分類フレームワークの導入
- Authors: Maximilian Wich, Adrian Gorniak, Tobias Eder, Daniel Bartmann, Burak
Enes \c{C}akici, Georg Groh
- Abstract要約: 我々は,(i)ドイツテレグラムのメッセージに対する虐待的言語分類モデルと,(ii)テレグラムチャンネルのヘイトフルネスに関する分類モデルからなるフレームワークを開発する。
チャネル分類モデルでは,トピックモデルから得られるチャネル固有のコンテンツ情報とソーシャルグラフを組み合わせて,チャネルのヘイトフルネスを予測する手法を開発した。
本研究のさらなるアウトプットとして,1,149件のTelegramメッセージを含むアノテート乱用言語データセットを作成した。
- 参考スコア(独自算出の注目度): 0.6459215652021234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since traditional social media platforms ban more and more actors that
distribute hate speech or other forms of abusive language (deplatforming),
these actors migrate to alternative platforms that do not moderate the users'
content. One known platform that is relevant for the German hater community is
Telegram, for which there have only been made limited research efforts so far.
The goal of this study is to develop a broad framework that consists of (i)
an abusive language classification model for German Telegram messages and (ii)
a classification model for the hatefulness of Telegram channels. For the first
part, we employ existing abusive language datasets containing posts from other
platforms to build our classification models. For the channel classification
model, we develop a method that combines channel specific content information
coming from a topic model with a social graph to predict the hatefulness of
channels. Furthermore, we complement these two approaches for hate speech
detection with insightful results on the evolution of the hater community on
Telegram in Germany. Moreover, we propose methods to the hate speech research
community for scalable network analyses for social media platforms. As an
additional output of the study, we release an annotated abusive language
dataset containing 1,149 annotated Telegram messages.
- Abstract(参考訳): 従来のソーシャルメディアプラットフォームでは、ヘイトスピーチやその他の乱用言語(デプラットフォーム)を配布するアクターが増えているため、これらのアクターは、ユーザーのコンテンツを穏健にしない代替プラットフォームに移行する。
ドイツの憎しみコミュニティに関係のあるプラットフォームとして、Telegramがある。
本研究の目的は,広義の枠組みを開発することである。
(i)ドイツの電文メッセージに対する乱用言語分類モデルと
(ii)テレグラムチャンネルの憎悪の分類モデル
まず、他のプラットフォームからの投稿を含む既存の乱用言語データセットを使用して分類モデルを構築します。
チャネル分類モデルのために,トピックモデルからのチャネル固有のコンテンツ情報をソーシャルグラフと組み合わせ,チャネルの憎悪度を予測する手法を開発した。
さらに,ドイツのテレグラムにおける憎悪コミュニティの発展に関する洞察に富んだ結果とともに,これら2つのヘイトスピーチ検出手法を補完する。
さらに,ソーシャルメディアプラットフォームのためのスケーラブルなネットワーク分析のためのヘイトスピーチ研究コミュニティに提案手法を提案する。
本研究のさらなるアウトプットとして,1,149件のTelegramメッセージを含むアノテート乱用言語データセットを作成した。
関連論文リスト
- Towards Interpretable Hate Speech Detection using Large Language Model-extracted Rationales [15.458557611029518]
ソーシャルメディアプラットフォームは、ユーザーが対人的な議論を行い、意見を述べるための重要な場である。
ヘイトスピーチのインスタンスを自動的に識別し、フラグを付ける必要がある。
本稿では,現在最先端の大規模言語モデル (LLM) を用いて,入力テキストから有理形の特徴を抽出することを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:22:35Z) - SADAS: A Dialogue Assistant System Towards Remediating Norm Violations
in Bilingual Socio-Cultural Conversations [56.31816995795216]
SADAS(Socially-Aware Dialogue Assistant System)は、会話が敬意と理解で広がることを保証するためのシステムである。
本システムの新しいアーキテクチャは,(1)対話に存在する規範のカテゴリを特定すること,(2)潜在的な規範違反を検出すること,(3)違反の深刻さを評価すること,(4)違反の是正を目的とした対策を実施すること,を含む。
論文 参考訳(メタデータ) (2024-01-29T08:54:21Z) - Analysis and Detection of Multilingual Hate Speech Using Transformer
Based Deep Learning [7.332311991395427]
ヘイトスピーチの普及に伴い,NLPタスクとしての自動検出の需要が高まっている。
本研究では、Twitter、Facebook、WhatsApp、Instagramなどのソーシャルメディアにおけるヘイトスピーチを検出するために、トランスフォーマーベースのモデルを提案する。
金の標準データセットは、著名な研究者Zeerak Talat、Sara Tonelli、Melanie Siegel、Rezaul Karimから収集された。
ヘイトスピーチ検出のための提案されたモデルの成功率は、ベンガルデータセットの精度の高い既存のベースラインや最先端モデルよりも高く、英語では89%、ドイツ語では91%である。
論文 参考訳(メタデータ) (2024-01-19T20:40:23Z) - Seamless: Multilingual Expressive and Streaming Speech Translation [71.12826355107889]
本稿では,エンドツーエンドの表現型および多言語翻訳をストリーミング形式で実現するモデル群を紹介する。
まず,多言語およびマルチモーダルのSeamlessM4Tモデル-SeamlessM4T v2の改良版をコントリビュートする。
SeamlessExpressiveとSeamlessStreamingの主なコンポーネントをまとめてSeamlessを作ります。
論文 参考訳(メタデータ) (2023-12-08T17:18:42Z) - TGDataset: a Collection of Over One Hundred Thousand Telegram Channels [69.22187804798162]
本稿では,120,979のTelegramチャネルと4億以上のメッセージを含む新しいデータセットであるTGDatasetを提案する。
我々は、データセット内で話される言語と、英語チャンネルでカバーされるトピックを分析した。
生のデータセットに加えて、データセットの分析に使用したスクリプトと、Sabmykと呼ばれる新しい陰謀論のネットワークに属するチャネルのリストもリリースしました。
論文 参考訳(メタデータ) (2023-03-09T15:42:38Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Role of Artificial Intelligence in Detection of Hateful Speech for
Hinglish Data on Social Media [1.8899300124593648]
ヒンディー語と英語のコードミックスデータ(Hinglish)の流行は、世界中の都市人口のほとんどで増加しています。
ほとんどのソーシャルネットワークプラットフォームが展開するヘイトスピーチ検出アルゴリズムは、これらのコード混合言語に投稿された不快で虐待的なコンテンツをフィルタリングできない。
非構造化コードミックスHinglish言語の効率的な検出方法を提案する。
論文 参考訳(メタデータ) (2021-05-11T10:02:28Z) - Leveraging cross-platform data to improve automated hate speech
detection [0.0]
ヘイトスピーチ検出のための既存のアプローチは、単一のソーシャルメディアプラットフォームを独立して重視している。
本稿では,異なるプラットフォームからの複数のデータセットと分類モデルを活用するヘイトスピーチを検出するための,クロスプラットフォームアプローチを提案する。
このアプローチが既存のモデルより優れていることを実証し、新しいソーシャルメディアプラットフォームからのメッセージでテストすると、優れたパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (2021-02-09T15:52:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。