論文の概要: Detecting Offensive Language on Social Networks: An End-to-end Detection
Method based on Graph Attention Networks
- arxiv url: http://arxiv.org/abs/2203.02123v1
- Date: Fri, 4 Mar 2022 03:57:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-07 22:44:58.776352
- Title: Detecting Offensive Language on Social Networks: An End-to-end Detection
Method based on Graph Attention Networks
- Title(参考訳): ソーシャルネットワーク上での攻撃的言語検出:グラフ注意ネットワークに基づくエンドツーエンド検出手法
- Authors: Zhenxiong Miao, Xingshu Chen, Haizhou Wang, Rui Tang, Zhou Yang, Wenyi
Tang
- Abstract要約: 攻撃的言語検出(CT-OLD)のためのコミュニティ構造とテキスト特徴に基づくエンドツーエンド手法を提案する。
ユーザの特徴を表現するために,コミュニティ構造にユーザ意見を追加する。ユーザ意見は,ユーザ履歴行動情報によって表現され,テキスト情報によって表現されるものよりも優れる。
- 参考スコア(独自算出の注目度): 7.723697303436006
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The pervasiveness of offensive language on the social network has caused
adverse effects on society, such as abusive behavior online. It is urgent to
detect offensive language and curb its spread. Existing research shows that
methods with community structure features effectively improve the performance
of offensive language detection. However, the existing models deal with
community structure independently, which seriously affects the effectiveness of
detection models. In this paper, we propose an end-to-end method based on
community structure and text features for offensive language detection
(CT-OLD). Specifically, the community structure features are directly captured
by the graph attention network layer, and the text embeddings are taken from
the last hidden layer of BERT. Attention mechanisms and position encoding are
used to fuse these features. Meanwhile, we add user opinion to the community
structure for representing user features. The user opinion is represented by
user historical behavior information, which outperforms that represented by
text information. Besides the above point, the distribution of users and tweets
is unbalanced in the popular datasets, which limits the generalization ability
of the model. To address this issue, we construct and release a dataset with
reasonable user distribution. Our method outperforms baselines with the F1
score of 89.94%. The results show that the end-to-end model effectively learns
the potential information of community structure and text, and user historical
behavior information is more suitable for user opinion representation.
- Abstract(参考訳): ソーシャルネットワーク上での攻撃的言語の普及は、虐待行動などの社会に悪影響を及ぼしている。
攻撃的な言語を検知し、その拡散を抑えることは急務である。
既存の研究によると、コミュニティ構造を持つ手法は攻撃的言語検出の性能を効果的に向上させる。
しかし、既存のモデルはコミュニティ構造を独立に扱うため、検出モデルの有効性に深刻な影響を及ぼす。
本稿では,攻撃的言語検出(CT-OLD)のためのコミュニティ構造とテキスト特徴に基づくエンドツーエンド手法を提案する。
具体的には、コミュニティ構造の特徴をグラフ注意ネットワーク層で直接キャプチャし、BERTの最後の隠蔽層からテキスト埋め込みを取り出す。
注意機構と位置符号化はこれらの特徴を融合するために使用される。
一方、ユーザの特徴を表現するために、コミュニティ構造にユーザ意見を追加する。
ユーザの意見は、ユーザの履歴行動情報で表現され、テキスト情報で表現される情報よりも優れています。
以上の点に加えて、ユーザとツイートの分布は一般的なデータセットでは不均衡であり、モデルの一般化能力を制限している。
この問題に対処するため、適切なユーザ分布を持つデータセットを構築し、リリースする。
F1スコア89.94%でベースラインを上回りました。
その結果, エンド・ツー・エンドのモデルでは, コミュニティ構造やテキストの潜在的な情報を効果的に学習し, ユーザの過去の行動情報は, ユーザの意見表現により適していることがわかった。
関連論文リスト
- LGB: Language Model and Graph Neural Network-Driven Social Bot Detection [43.92522451274129]
悪意のあるソーシャルボットは、誤った情報を広め、社会的世論を喚起することで、悪意ある目的を達成する。
言語モデル (LM) とグラフニューラルネットワーク (GNN) の2つの主要コンポーネントから構成される新しいソーシャルボット検出フレームワーク LGB を提案する。
2つの実世界のデータセットの実験では、LGBは最先端のベースラインモデルよりも最大10.95%向上している。
論文 参考訳(メタデータ) (2024-06-13T02:47:38Z) - Decoding the Silent Majority: Inducing Belief Augmented Social Graph
with Large Language Model for Response Forecasting [74.68371461260946]
SocialSenseは、既存のソーシャルネットワーク上に信念中心のグラフを誘導するフレームワークであり、グラフベースの伝播によって社会的ダイナミクスを捉える。
本手法は,ゼロショット設定と教師あり設定の両方に対する実験的な評価において,既存の最先端技術を超えている。
論文 参考訳(メタデータ) (2023-10-20T06:17:02Z) - Constructing Colloquial Dataset for Persian Sentiment Analysis of Social
Microblogs [0.0]
本稿ではまず,ITRC-Opinionというユーザ意見データセットを協調的かつインソース的に構築する。
私たちのデータセットには、TwitterやInstagramといったソーシャルなマイクロブログから、6万の非公式で口語的なペルシア語のテキストが含まれています。
次に,畳み込みニューラルネットワーク(CNN)モデルに基づく新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-22T05:51:22Z) - Cognitive Semantic Communication Systems Driven by Knowledge Graph:
Principle, Implementation, and Performance Evaluation [74.38561925376996]
単一ユーザと複数ユーザのコミュニケーションシナリオに対して,認知意味コミュニケーションフレームワークが2つ提案されている。
知識グラフから推論規則をマイニングすることにより,効果的な意味補正アルゴリズムを提案する。
マルチユーザ認知型セマンティックコミュニケーションシステムにおいて,異なるユーザのメッセージを識別するために,メッセージ復元アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-15T12:01:43Z) - Leveraging Dependency Grammar for Fine-Grained Offensive Language
Detection using Graph Convolutional Networks [0.5457150493905063]
我々はTwitterにおける攻撃的言語検出の問題に対処する。
文の係り受け解析木に構文的特徴を統合するSyLSTMという新しい手法を提案する。
その結果,提案手法は,パラメータの桁数を桁違いに減らして,最先端のBERTモデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-05-26T05:27:50Z) - Span Classification with Structured Information for Disfluency Detection
in Spoken Utterances [47.05113261111054]
本稿では,音声音声からテキスト中の不一致を検出する新しいアーキテクチャを提案する。
提案手法は, 広範に使われているイングリッシュスイッチボードを用いて, ディフルエンシ検出の最先端化を実現する。
論文 参考訳(メタデータ) (2022-03-30T03:22:29Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Relational Graph Neural Networks for Fraud Detection in a Super-App
environment [53.561797148529664]
スーパーアプリケーションの金融サービスにおける不正行為防止のための関係グラフ畳み込みネットワーク手法の枠組みを提案する。
我々は,グラフニューラルネットワークの解釈可能性アルゴリズムを用いて,ユーザの分類タスクに対する最も重要な関係を判定する。
以上の結果から,Super-Appの代替データと高接続性で得られるインタラクションを利用するモデルには,付加価値があることが示唆された。
論文 参考訳(メタデータ) (2021-07-29T00:02:06Z) - GraphFormers: GNN-nested Transformers for Representation Learning on
Textual Graph [53.70520466556453]
階層的にGNNコンポーネントを言語モデルのトランスフォーマーブロックと一緒にネストするGraphFormerを提案する。
提案したアーキテクチャでは、テキストエンコーディングとグラフ集約を反復的なワークフローに融合する。
さらに、プログレッシブ・ラーニング・ストラテジーを導入し、そのモデルが操作されたデータと元のデータに基づいて連続的に訓練され、グラフ上の情報を統合する能力を強化する。
論文 参考訳(メタデータ) (2021-05-06T12:20:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。