論文の概要: Ghmerti at SemEval-2019 Task 6: A Deep Word- and Character-based
Approach to Offensive Language Identification
- arxiv url: http://arxiv.org/abs/2009.10792v1
- Date: Tue, 22 Sep 2020 20:13:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 22:23:39.370595
- Title: Ghmerti at SemEval-2019 Task 6: A Deep Word- and Character-based
Approach to Offensive Language Identification
- Title(参考訳): Ghmerti at SemEval-2019 Task 6: A Deep Word-based Approach to Offensive Language Identification (英語)
- Authors: Ehsan Doostmohammadi, Hossein Sameti, Ali Saffar
- Abstract要約: OffensEvalは、ソーシャルメディアにおける攻撃的言語を特定し分類する問題に対処する。
提案手法には、文字レベルの畳み込みニューラルネットワーク、単語レベルのリカレントニューラルネットワーク、いくつかの前処理が含まれる。
提案したサブタスクAモデルの性能は77.93%のマクロ平均F1スコアである。
- 参考スコア(独自算出の注目度): 1.192436948211501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the models submitted by Ghmerti team for subtasks A and B
of the OffensEval shared task at SemEval 2019. OffensEval addresses the problem
of identifying and categorizing offensive language in social media in three
subtasks; whether or not a content is offensive (subtask A), whether it is
targeted (subtask B) towards an individual, a group, or other entities (subtask
C). The proposed approach includes character-level Convolutional Neural
Network, word-level Recurrent Neural Network, and some preprocessing. The
performance achieved by the proposed model for subtask A is 77.93%
macro-averaged F1-score.
- Abstract(参考訳): 本稿では,SemEval 2019におけるOffensEval共有タスクのサブタスクAとBのためにGhmertiチームが提出したモデルについて述べる。
OffensEvalは、ソーシャルメディアにおける攻撃的言語を3つのサブタスクで識別し分類する問題に対処する:コンテンツが攻撃的であるか否か(サブタスクA)、個人、グループ、または他のエンティティ(サブタスクC)をターゲットにしているかどうか(サブタスクB)。
提案手法は、文字レベルの畳み込みニューラルネットワーク、単語レベルのリカレントニューラルネットワーク、いくつかの前処理を含む。
提案したサブタスクAモデルの性能は77.93%のマクロ平均F1スコアである。
関連論文リスト
- SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - Exploiting Contextual Target Attributes for Target Sentiment
Classification [53.30511968323911]
TSCの既存のPTLMベースモデルは、1)PTLMをコンテキストエンコーダとして採用した微調整ベースモデル、2)テキスト/単語生成タスクに分類タスクを転送するプロンプトベースモデル、の2つのグループに分類される。
我々は,PTLM を TSC に活用する新たな視点として,言語モデリングと文脈的ターゲット属性による明示的ターゲットコンテキスト相互作用の利点を同時に活用する。
論文 参考訳(メタデータ) (2023-12-21T11:45:28Z) - CL-UZH at SemEval-2023 Task 10: Sexism Detection through Incremental
Fine-Tuning and Multi-Task Learning with Label Descriptions [0.0]
SemEval shared task textitTowards Explainable Detection of Online Sexism (EDOS 2023)は、英語のソーシャルメディア投稿で性差別を検出することを目的としている。
本稿では,3つのサブタスクすべてに対して,関連するタスクを微調整したマルチタスクモデルに基づく提案システムを提案する。
我々は、各タスクをバイナリペアテキスト分類として定式化し、入力テキストとともにデータセットとラベル記述が与えられるマルチタスク学習を実装した。
論文 参考訳(メタデータ) (2023-06-06T17:59:49Z) - Subsidiary Prototype Alignment for Universal Domain Adaptation [58.431124236254]
Universal Domain Adaptation (UniDA)の大きな問題は、"known"クラスと"unknown"クラスの誤調整である。
ゴールタスクUniDAと協調して動作するクローズドセットSPAを実現するために,新しい単語ヒストグラム関連プレテキストタスクを提案する。
既存のUniDA技術上でのアプローチの有効性を実証し,3つの標準UniDAおよびOpen-Set DAオブジェクト認識ベンチマークの最先端性能を示す。
論文 参考訳(メタデータ) (2022-10-28T05:32:14Z) - Identifying and Categorizing Offensive Language in Social Media [0.0]
本研究は,SemEval 2019 Task 6: OffensEval用に構築された分類システムについて述べる。
私たちは、最良の結果を得るために、機械学習とディープラーニングモデルとデータ前処理とサンプリングテクニックをトレーニングしました。
論文 参考訳(メタデータ) (2021-04-10T22:53:43Z) - LRG at SemEval-2021 Task 4: Improving Reading Comprehension with
Abstract Words using Augmentation, Linguistic Features and Voting [0.6850683267295249]
フィリングインザブランクタイプの質問を考えると、タスクは5つのオプションのリストから最適な単語を予測することです。
マスク付き言語モデリング(MLM)タスクで事前訓練されたトランスフォーマーベースのモデルのエンコーダを使用して、Fill-in-the-Blank(FitB)モデルを構築します。
本稿では,BERT の入力長制限に対処するため,チャンク投票や Max Context という変種を提案する。
論文 参考訳(メタデータ) (2021-02-24T12:33:12Z) - PUM at SemEval-2020 Task 12: Aggregation of Transformer-based models'
features for offensive language recognition [0.0]
我々のチームは、サブタスクCで40中7位、64.727%のマクロF1スコア、85中64中64位、攻撃言語識別(89.726%のF1スコア)にランク付けされた。
論文 参考訳(メタデータ) (2020-10-05T10:25:29Z) - Meta-Learning with Context-Agnostic Initialisations [86.47040878540139]
メタ学習プロセスにコンテキスト・逆成分を導入する。
これにより、コンテキストに依存しないタスクを一般化したターゲットへの微調整の初期化が実現される。
我々は,3つのメタ学習アルゴリズムと2つの問題に対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-07-29T08:08:38Z) - GUIR at SemEval-2020 Task 12: Domain-Tuned Contextualized Models for
Offensive Language Detection [27.45642971636561]
OffensEval 2020タスクには、攻撃的言語(Sub-task A)の存在の特定、攻撃的言語(Sub-task B)のターゲットの存在の特定、ターゲットのカテゴリ(Sub-task C)の識別の3つのサブタスクが含まれている。
サブタスクAのF1スコアは91.7%、サブタスクBの66.5%、サブタスクCの63.2%である。
論文 参考訳(メタデータ) (2020-07-28T20:45:43Z) - Boundary-assisted Region Proposal Networks for Nucleus Segmentation [89.69059532088129]
大量の核が混在しているため、機械学習モデルはうまく機能しない。
我々は、堅牢なインスタンスレベルの核分割を実現する境界支援領域提案ネットワーク(BRP-Net)を考案する。
論文 参考訳(メタデータ) (2020-06-04T08:26:38Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。