論文の概要: CL-UZH at SemEval-2023 Task 10: Sexism Detection through Incremental
Fine-Tuning and Multi-Task Learning with Label Descriptions
- arxiv url: http://arxiv.org/abs/2306.03907v1
- Date: Tue, 6 Jun 2023 17:59:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 14:07:53.715476
- Title: CL-UZH at SemEval-2023 Task 10: Sexism Detection through Incremental
Fine-Tuning and Multi-Task Learning with Label Descriptions
- Title(参考訳): cl-uzh at semeval-2023 task 10: ラベル記述を用いたインクリメンタル微調整とマルチタスク学習による性差検出
- Authors: Janis Goldzycher
- Abstract要約: SemEval shared task textitTowards Explainable Detection of Online Sexism (EDOS 2023)は、英語のソーシャルメディア投稿で性差別を検出することを目的としている。
本稿では,3つのサブタスクすべてに対して,関連するタスクを微調整したマルチタスクモデルに基づく提案システムを提案する。
我々は、各タスクをバイナリペアテキスト分類として定式化し、入力テキストとともにデータセットとラベル記述が与えられるマルチタスク学習を実装した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread popularity of social media has led to an increase in hateful,
abusive, and sexist language, motivating methods for the automatic detection of
such phenomena. The goal of the SemEval shared task \textit{Towards Explainable
Detection of Online Sexism} (EDOS 2023) is to detect sexism in English social
media posts (subtask A), and to categorize such posts into four coarse-grained
sexism categories (subtask B), and eleven fine-grained subcategories (subtask
C). In this paper, we present our submitted systems for all three subtasks,
based on a multi-task model that has been fine-tuned on a range of related
tasks and datasets before being fine-tuned on the specific EDOS subtasks. We
implement multi-task learning by formulating each task as binary pairwise text
classification, where the dataset and label descriptions are given along with
the input text. The results show clear improvements over a fine-tuned
DeBERTa-V3 serving as a baseline leading to $F_1$-scores of 85.9\% in subtask A
(rank 13/84), 64.8\% in subtask B (rank 19/69), and 44.9\% in subtask C
(26/63).
- Abstract(参考訳): ソーシャルメディアの普及は、憎悪的、虐待的、セクシスト的言語の増加につながり、こうした現象を自動的に検出する手法を動機付けている。
SemEval 共有タスク \textit{Towards Explainable Detection of Online Sexism} (EDOS 2023) の目標は、英語のソーシャルメディア投稿(サブタスクA)で性差別を検知し、その投稿を4つの粗粒度(サブタスクB)と11の細粒度(サブタスクC)に分類することである。
本稿では,EDOSサブタスクを微調整する前に,関連するタスクやデータセットを微調整したマルチタスクモデルに基づく,3つのサブタスクすべてを対象とした提案システムを提案する。
各タスクを,入力テキストとともにデータセットとラベル記述が与えられるバイナリペアワイズテキスト分類として定式化することにより,マルチタスク学習を実現する。
その結果、f_1$-scoresはサブタスクaで85.9\%(ランク13/84)、サブタスクbで64.8\%(ランク19/69)、サブタスクcで44.9\%(26/63)となる。
関連論文リスト
- The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - SemEval 2024 -- Task 10: Emotion Discovery and Reasoning its Flip in
Conversation (EDiReF) [61.49972925493912]
SemEval-2024 Task 10は、コードミキシングされた対話における感情の識別に焦点を当てた共有タスクである。
このタスクは3つの異なるサブタスクから構成される - コードミックス対話のための会話における感情認識、コードミックス対話のための感情フリップ推論、および英語対話のための感情フリップ推論である。
このタスクには84人の参加者が参加し、各サブタスクのF1スコアは0.70、0.79、0.76に達した。
論文 参考訳(メタデータ) (2024-02-29T08:20:06Z) - LCT-1 at SemEval-2023 Task 10: Pre-training and Multi-task Learning for
Sexism Detection and Classification [0.0]
SemEval-2023 Task 10 on Explainable Detection of Online Sexismは、性差別の検出の説明可能性を高めることを目的としている。
我々のシステムは、さらなるドメイン適応型事前学習に基づいている。
実験では、マルチタスク学習は性差別検出のための標準的な微調整と同等に実行される。
論文 参考訳(メタデータ) (2023-06-08T09:56:57Z) - Multimodal Subtask Graph Generation from Instructional Videos [51.96856868195961]
実世界のタスクは複数の相互依存サブタスクから構成される。
本研究では,タスクを記述する指導ビデオから,そのようなサブタスク間の因果関係をモデル化することを目的とする。
マルチモーダルなサブタスクグラフ生成(MSG2)を提案する。これは、ノイズの多いWebビデオからタスクに関連するタスクのサブタスク間の依存性を定義するサブタスクグラフを構築するアプローチである。
論文 参考訳(メタデータ) (2023-02-17T03:41:38Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - Combating Hostility: Covid-19 Fake News and Hostile Post Detection in
Social Media [0.0]
本稿では,AAAI-2021におけるConSTRAINT共有タスクへの参加の一環として開発されたシステムとその成果について詳述する。
SVM, CNN, BiLSTM, CNN+BiLSTM など, tf-idf と Word2Vec を組み込んだ様々な手法を用いて分類処理を行う。
論文 参考訳(メタデータ) (2021-01-09T05:15:41Z) - Ghmerti at SemEval-2019 Task 6: A Deep Word- and Character-based
Approach to Offensive Language Identification [1.192436948211501]
OffensEvalは、ソーシャルメディアにおける攻撃的言語を特定し分類する問題に対処する。
提案手法には、文字レベルの畳み込みニューラルネットワーク、単語レベルのリカレントニューラルネットワーク、いくつかの前処理が含まれる。
提案したサブタスクAモデルの性能は77.93%のマクロ平均F1スコアである。
論文 参考訳(メタデータ) (2020-09-22T20:13:48Z) - GUIR at SemEval-2020 Task 12: Domain-Tuned Contextualized Models for
Offensive Language Detection [27.45642971636561]
OffensEval 2020タスクには、攻撃的言語(Sub-task A)の存在の特定、攻撃的言語(Sub-task B)のターゲットの存在の特定、ターゲットのカテゴリ(Sub-task C)の識別の3つのサブタスクが含まれている。
サブタスクAのF1スコアは91.7%、サブタスクBの66.5%、サブタスクCの63.2%である。
論文 参考訳(メタデータ) (2020-07-28T20:45:43Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。