論文の概要: Identifying Offensive Expressions of Opinion in Context
- arxiv url: http://arxiv.org/abs/2104.12227v2
- Date: Tue, 27 Apr 2021 09:49:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-28 11:35:49.269340
- Title: Identifying Offensive Expressions of Opinion in Context
- Title(参考訳): 文脈における意見の不快表現の同定
- Authors: Francielle Alves Vargas, Isabelle Carvalho, Fabiana Rodrigues de
G\'oes
- Abstract要約: 文脈における意見や感情を識別する主観的情報抽出システムは依然として課題である。
感情に基づくNLPタスクでは、文脈における全ての攻撃的または憎悪的な意見よりも、情報抽出のリソースが少ない。
この論文は、明示的で暗黙的に攻撃的で、意見の表現を誓う新しいクロス言語的および文脈的攻撃的語彙を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classic information extraction techniques consist in building questions and
answers about the facts. Indeed, it is still a challenge to subjective
information extraction systems to identify opinions and feelings in context. In
sentiment-based NLP tasks, there are few resources to information extraction,
above all offensive or hateful opinions in context. To fill this important gap,
this short paper provides a new cross-lingual and contextual offensive lexicon,
which consists of explicit and implicit offensive and swearing expressions of
opinion, which were annotated in two different classes: context dependent and
context-independent offensive. In addition, we provide markers to identify hate
speech. Annotation approach was evaluated at the expression-level and achieves
high human inter-annotator agreement. The provided offensive lexicon is
available in Portuguese and English languages.
- Abstract(参考訳): 古典的な情報抽出技術は、事実に関する質問と回答を構築することで構成される。
実際、文脈における意見や感情を識別する主観的情報抽出システムは依然として課題である。
感情に基づくNLPタスクでは、文脈における全ての攻撃的または憎悪的な意見よりも、情報抽出のリソースが少ない。
この重要なギャップを埋めるために、本稿では、文脈依存と文脈非依存の2つのクラスで注釈付けされた、明示的で暗黙の攻撃的かつ誓約的な意見表現からなる、新たな言語的・文脈的攻撃的語彙を提供する。
また,ヘイトスピーチを識別するためのマーカーも提供する。
アノテーションを表現レベルで評価し,高い人間間アノテータ合意を達成した。
攻撃的辞書はポルトガル語と英語で提供されている。
関連論文リスト
- Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - COBRA Frames: Contextual Reasoning about Effects and Harms of Offensive
Statements [30.1056760312051]
攻撃的あるいは偏りのある文の意図,反応,害を説明するための,最初の文脈対応形式であるCOBRAフレームを紹介する。
私たちは、マシン生成コンテキストと組み合わせた33kの潜在的攻撃的ステートメントのデータセットであるCOBRACORPUSを作成します。
文脈非依存モデルによる説明は文脈認識モデルよりはるかに悪いことが判明した。
論文 参考訳(メタデータ) (2023-06-03T02:47:24Z) - Natural Language Decompositions of Implicit Content Enable Better Text
Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - Hate Speech Criteria: A Modular Approach to Task-Specific Hate Speech
Definitions [1.3274508420845537]
本稿では,法と社会科学の観点から展開したテキスト音声基準について述べる。
我々は、開発者が念頭に置いている目標と正確なタスクは、テキスト音声のスコープをどのように定義するかを決定するべきであると論じる。
論文 参考訳(メタデータ) (2022-06-30T17:50:16Z) - Rethinking Offensive Text Detection as a Multi-Hop Reasoning Problem [15.476899850339395]
対話における暗黙的な攻撃的テキスト検出の課題について紹介する。
我々は、このより広い種類の攻撃的発話を理解するためには、推論が不可欠であると主張する。
このタスクの研究を支援するデータセットであるSLIGHTをリリースする。
論文 参考訳(メタデータ) (2022-04-22T06:20:15Z) - Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable
Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。
不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文 参考訳(メタデータ) (2022-03-04T15:59:06Z) - Fine-Grained Opinion Summarization with Minimal Supervision [48.43506393052212]
FineSumは、複数のドキュメントから意見を抽出することでターゲットをプロファイルすることを目的としている。
FineSumは、生のコーパスから意見語句を自動的に識別し、異なる側面と感情に分類し、各アスペクト/感覚の下に複数のきめ細かい意見クラスタを構築する。
ベンチマークの自動評価と定量的人的評価の両方が,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-10-17T15:16:34Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z) - Contextual Lexicon-Based Approach for Hate Speech and Offensive Language
Detection [1.1744028458220426]
本稿では,ソーシャルメディア上での攻撃的言語とヘイトスピーチ検出の新しいアプローチを提案する。
我々のアプローチは、暗黙的で明示的な攻撃的および誓約的な表現をバイナリークラスで注釈付けした攻撃的語彙を取り入れている。
ブラジルにおけるヘイトスピーチの深刻さと、ポルトガル語における研究の欠如により、ブラジルポルトガル語は我々の方法を検証するために使用される言語である。
論文 参考訳(メタデータ) (2021-04-25T21:34:51Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A Unified Feature Representation for Lexical Connotations [13.153001795077227]
我々は、名詞や形容詞の意味を表す新しい語彙資源を作成するために、遠隔ラベリングを使用する。
我々の分析によると、それは人間の判断とよく一致している。
論文 参考訳(メタデータ) (2020-05-31T23:14:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。