論文の概要: Abuse is Contextual, What about NLP? The Role of Context in Abusive
Language Annotation and Detection
- arxiv url: http://arxiv.org/abs/2103.14916v1
- Date: Sat, 27 Mar 2021 14:31:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 10:00:55.718486
- Title: Abuse is Contextual, What about NLP? The Role of Context in Abusive
Language Annotation and Detection
- Title(参考訳): 乱用はコンテキストであり、NLPはどうか?
乱用言語アノテーションと検出における文脈の役割
- Authors: Stefano Menini, Alessio Palmero Aprosio, Sara Tonelli
- Abstract要約: 我々は、メッセージの憎しみのあるコンテンツが文脈に基づいて判断されたときに何が起こるかを調べる。
英語における乱用言語検出のための広範に使用されるデータセットの一部を,まず2つの条件で再注釈した。
文脈を伴わない。
- 参考スコア(独自算出の注目度): 2.793095554369281
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The datasets most widely used for abusive language detection contain lists of
messages, usually tweets, that have been manually judged as abusive or not by
one or more annotators, with the annotation performed at message level. In this
paper, we investigate what happens when the hateful content of a message is
judged also based on the context, given that messages are often ambiguous and
need to be interpreted in the context of occurrence. We first re-annotate part
of a widely used dataset for abusive language detection in English in two
conditions, i.e. with and without context. Then, we compare the performance of
three classification algorithms obtained on these two types of dataset, arguing
that a context-aware classification is more challenging but also more similar
to a real application scenario.
- Abstract(参考訳): 乱用言語検出に最も広く使用されているデータセットには、メッセージの一覧(通常、ツイート)が含まれており、1つ以上のアノテータによって手動で判断され、メッセージレベルでアノテーションが実行される。
本稿では,メッセージが曖昧であり,発生の文脈で解釈される必要があることを考慮し,メッセージの憎悪コンテンツも文脈に基づいて判断した場合に何が起こるかを検討する。
英語における乱用言語検出のための広範に使用されるデータセットの一部を,まず2つの条件で再注釈した。
文脈を伴わない。
次に,これら2種類のデータセットで得られた3つの分類アルゴリズムの性能を比較し,コンテキスト認識分類はより難しいが,実際のアプリケーションシナリオに類似していると主張する。
関連論文リスト
- Evaluating Text Classification Robustness to Part-of-Speech Adversarial Examples [0.6445605125467574]
逆の例は意思決定プロセスを騙すために設計された入力であり、人間には理解できないことを意図している。
テキストベースの分類システムでは、入力の変更(テキストの文字列)は常に認識可能である。
テキストベースの逆数例の質を向上させるためには、入力テキストのどの要素に注目する価値があるかを知る必要がある。
論文 参考訳(メタデータ) (2024-08-15T18:33:54Z) - Improving Long Context Document-Level Machine Translation [51.359400776242786]
翻訳の一貫性と凝集性を改善するために、ニューラルネットワーク翻訳(NMT)のための文書レベルのコンテキストが不可欠である。
文書レベルのNMTに関する多くの著作が出版されているが、ほとんどの作品では局所的な文脈に制限されている。
本稿では、メモリ消費を同時に低減しつつ、シーケンスの最も関連性の高い部分に注意を集中させる制約付注意変種を提案する。
論文 参考訳(メタデータ) (2023-06-08T13:28:48Z) - Enriching Abusive Language Detection with Community Context [0.3708656266586145]
叙述表現の使用は、良心的または活発な権限を与えることができる。
乱用検出のモデルは、これらの表現を軽蔑的で不注意に、疎外されたグループが持つ生産的な会話を検閲するものとして誤分類する。
本稿では,コミュニティの文脈が乱用言語検出における分類結果をどのように改善するかを強調した。
論文 参考訳(メタデータ) (2022-06-16T20:54:02Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Abusive Language Detection in Heterogeneous Contexts: Dataset Collection
and the Role of Supervised Attention [9.597481034467915]
乱用言語は、オンラインソーシャルプラットフォームにおいて大きな問題である。
YouTubeから11,000以上のコメントで、乱用言語の注釈付きデータセットを提供する。
本稿では,教師付きアテンション機構を用いて乱用コンテンツを検出し,分類するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-05-24T06:50:19Z) - Measuring and Increasing Context Usage in Context-Aware Machine
Translation [64.5726087590283]
機械翻訳モデルによるコンテキストの使用を定量的にするために、新しいメトリクス、条件付き相互情報を導入します。
次に,コンテキスト認識モデルによってコンテキストの使用量を増やすために,コンテキスト認識ワードドロップアウトという,新しい簡易なトレーニング手法を導入する。
論文 参考訳(メタデータ) (2021-05-07T19:55:35Z) - A Token-level Reference-free Hallucination Detection Benchmark for
Free-form Text Generation [50.55448707570669]
本稿ではトークンレベルの参照なし幻覚検出タスクとHaDesというアノテーション付きデータセットを提案する。
このデータセットを作成するために、まず英語のウィキペディアから抽出された大量のテキストセグメントを摂り込み、それからクラウドソースアノテーションで検証する。
論文 参考訳(メタデータ) (2021-04-18T04:09:48Z) - Wisdom of the Contexts: Active Ensemble Learning for Contextual Anomaly
Detection [7.87320844079302]
文脈異常検出(CAD)では、オブジェクトは特定のコンテキスト内でのみ異常と見なされる。
We propose a novel approach called WisCon, which generated contexts from the feature set。
提案手法は,すべての有用なコンテキストが同じではないという仮定に基づいて,異なる重要度スコアを持つ複数のコンテキストのアンサンブルを構築する。
論文 参考訳(メタデータ) (2021-01-27T17:34:13Z) - Improving Machine Reading Comprehension with Contextualized Commonsense
Knowledge [62.46091695615262]
我々は、機械読解の理解を改善するために、常識知識を抽出することを目指している。
構造化知識を文脈内に配置することで,関係を暗黙的に表現することを提案する。
我々は,教師の学習パラダイムを用いて,複数種類の文脈的知識を学生機械読取機に注入する。
論文 参考訳(メタデータ) (2020-09-12T17:20:01Z) - Don't Judge an Object by Its Context: Learning to Overcome Contextual
Bias [113.44471186752018]
既存のモデルは、認識精度を向上させるために、オブジェクトとそのコンテキスト間の共起を利用することが多い。
この研究は、学習した特徴表現の堅牢性を改善するために、そのような文脈バイアスに対処することに焦点を当てている。
論文 参考訳(メタデータ) (2020-01-09T18:31:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。