論文の概要: Leveraging Dependency Grammar for Fine-Grained Offensive Language
Detection using Graph Convolutional Networks
- arxiv url: http://arxiv.org/abs/2205.13164v1
- Date: Thu, 26 May 2022 05:27:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-27 13:23:48.393450
- Title: Leveraging Dependency Grammar for Fine-Grained Offensive Language
Detection using Graph Convolutional Networks
- Title(参考訳): グラフ畳み込みネットワークを用いた細粒度攻撃言語検出のための依存文法の活用
- Authors: Divyam Goel, Raksha Sharma
- Abstract要約: 我々はTwitterにおける攻撃的言語検出の問題に対処する。
文の係り受け解析木に構文的特徴を統合するSyLSTMという新しい手法を提案する。
その結果,提案手法は,パラメータの桁数を桁違いに減らして,最先端のBERTモデルよりも大幅に優れていた。
- 参考スコア(独自算出の注目度): 0.5457150493905063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The last few years have witnessed an exponential rise in the propagation of
offensive text on social media. Identification of this text with high precision
is crucial for the well-being of society. Most of the existing approaches tend
to give high toxicity scores to innocuous statements (e.g., "I am a gay man").
These false positives result from over-generalization on the training data
where specific terms in the statement may have been used in a pejorative sense
(e.g., "gay"). Emphasis on such words alone can lead to discrimination against
the classes these systems are designed to protect. In this paper, we address
the problem of offensive language detection on Twitter, while also detecting
the type and the target of the offence. We propose a novel approach called
SyLSTM, which integrates syntactic features in the form of the dependency parse
tree of a sentence and semantic features in the form of word embeddings into a
deep learning architecture using a Graph Convolutional Network. Results show
that the proposed approach significantly outperforms the state-of-the-art BERT
model with orders of magnitude fewer number of parameters.
- Abstract(参考訳): ここ数年、ソーシャルメディア上では、攻撃的なテキストの拡散が指数関数的に増加している。
この文章を高精度に識別することは社会の幸福に不可欠である。
既存のアプローチのほとんどは、無害な発言に対して高い毒性スコアを与える傾向がある(例えば、"i am a gay man")。
これらの偽陽性は、文中の特定の用語が悲観的な意味で使われたかもしれない訓練データ(例えば「ゲイ」)の過大な一般化から生じる。
このような単語のみに重きを置くことは、これらのシステムが保護するように設計されたクラスに対する差別につながる可能性がある。
本稿では,Twitterにおける攻撃的言語検出の問題に対処するとともに,攻撃のタイプとターゲットを検出する。
我々はSyLSTMと呼ばれる新しい手法を提案し、文の依存構文木という形で構文的特徴を統合し、単語埋め込みという形で意味的特徴をグラフ畳み込みネットワークを用いてディープラーニングアーキテクチャに組み込む。
その結果,提案手法は,パラメータの桁数を桁違いに減らして,最先端のBERTモデルよりも優れていた。
関連論文リスト
- LGB: Language Model and Graph Neural Network-Driven Social Bot Detection [43.92522451274129]
悪意のあるソーシャルボットは、誤った情報を広め、社会的世論を喚起することで、悪意ある目的を達成する。
言語モデル (LM) とグラフニューラルネットワーク (GNN) の2つの主要コンポーネントから構成される新しいソーシャルボット検出フレームワーク LGB を提案する。
2つの実世界のデータセットの実験では、LGBは最先端のベースラインモデルよりも最大10.95%向上している。
論文 参考訳(メタデータ) (2024-06-13T02:47:38Z) - ConGraT: Self-Supervised Contrastive Pretraining for Joint Graph and Text Embeddings [20.25180279903009]
テキスト分散グラフ(TAG)におけるテキストとノードの分離表現を共同学習するためのContrastive Graph-Text Pretraining(ConGraT)を提案する。
提案手法は言語モデル(LM)とグラフニューラルネットワーク(GNN)を訓練し,CLIPにインスパイアされたバッチワイドコントラスト学習目標を用いて,それらの表現を共通の潜在空間に整列させる。
実験により、ConGraTは、ノードとテキストのカテゴリ分類、リンク予測、言語モデリングなど、さまざまな下流タスクのベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-23T17:53:30Z) - Disentangling Learnable and Memorizable Data via Contrastive Learning
for Semantic Communications [81.10703519117465]
セマンティック・レディにするために、ソースデータをアンタングルする新しい機械推論フレームワークが提案されている。
特に、データ上でインスタンスとクラスタの識別を行う新しいコントラスト学習フレームワークが提案されている。
信頼度の高い深いセマンティッククラスタは、学習可能でセマンティックリッチなデータだと考えられている。
シミュレーションの結果は, セマンティック・インパクトとミニマリズムの観点から, コントラスト学習アプローチの優位性を示した。
論文 参考訳(メタデータ) (2022-12-18T12:00:12Z) - Detecting Offensive Language on Social Networks: An End-to-end Detection
Method based on Graph Attention Networks [7.723697303436006]
攻撃的言語検出(CT-OLD)のためのコミュニティ構造とテキスト特徴に基づくエンドツーエンド手法を提案する。
ユーザの特徴を表現するために,コミュニティ構造にユーザ意見を追加する。ユーザ意見は,ユーザ履歴行動情報によって表現され,テキスト情報によって表現されるものよりも優れる。
論文 参考訳(メタデータ) (2022-03-04T03:57:18Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - AES Systems Are Both Overstable And Oversensitive: Explaining Why And
Proposing Defenses [66.49753193098356]
スコアリングモデルの驚くべき逆方向の脆さの原因について検討する。
のモデルとして訓練されているにもかかわらず、単語の袋のように振る舞うことを示唆している。
高い精度で試料を発生させる過敏性と過敏性を検出できる検出ベース保護モデルを提案する。
論文 参考訳(メタデータ) (2021-09-24T03:49:38Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Visually Grounded Compound PCFGs [65.04669567781634]
言語理解のための視覚的基盤の爆発は、最近多くの注目を集めている。
本研究では,視覚的な文法誘導について検討し,未ラベルテキストとその視覚的キャプションから選挙区を学習する。
論文 参考訳(メタデータ) (2020-09-25T19:07:00Z) - Investigating Typed Syntactic Dependencies for Targeted Sentiment
Classification Using Graph Attention Neural Network [10.489983726592303]
型付き構文依存情報を統合する新しい関係グラフアテンションネットワークについて検討する。
その結果,本手法は目標感情分類性能を改善するためにラベル情報を効果的に活用できることが示唆された。
論文 参考訳(メタデータ) (2020-02-22T11:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。