論文の概要: Duluth at SemEval-2019 Task 6: Lexical Approaches to Identify and
Categorize Offensive Tweets
- arxiv url: http://arxiv.org/abs/2007.12949v1
- Date: Sat, 25 Jul 2020 14:56:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 01:10:39.862350
- Title: Duluth at SemEval-2019 Task 6: Lexical Approaches to Identify and
Categorize Offensive Tweets
- Title(参考訳): SemEval-2019 Task 6: 攻撃的なつぶやきを識別し分類するための語彙的アプローチ
- Authors: Ted Pedersen
- Abstract要約: 本稿では,SemEval-2019 Task 6, Identification and Categorizing Offensive Language in Social Media (OffensEval)に参加するシステムについて述べる。
これらのシステムのほとんどは、手動でラベル付けされたトレーニングデータに見られる語彙的特徴から分類器を構築する従来の機械学習アプローチを採用していた。
課題Aでは103位,課題Bでは39位,課題Cでは65位,課題Cでは44位であった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes the Duluth systems that participated in SemEval--2019
Task 6, Identifying and Categorizing Offensive Language in Social Media
(OffensEval). For the most part these systems took traditional Machine Learning
approaches that built classifiers from lexical features found in manually
labeled training data. However, our most successful system for classifying a
tweet as offensive (or not) was a rule-based black--list approach, and we also
experimented with combining the training data from two different but related
SemEval tasks. Our best systems in each of the three OffensEval tasks placed in
the middle of the comparative evaluation, ranking 57th of 103 in task A, 39th
of 75 in task B, and 44th of 65 in task C.
- Abstract(参考訳): 本稿では,SemEval-2019 Task 6, Identification and Categorizing Offensive Language in Social Media (OffensEval)に参加したDuluthシステムについて述べる。
これらのシステムのほとんどは、手動でラベル付けされたトレーニングデータに見られる語彙的特徴から分類器を構築する従来の機械学習アプローチを採用していた。
しかし、ツイートを攻撃的(あるいは非)に分類する最も成功したシステムは、ルールベースのブラックリストアプローチであり、また、2つの異なるが関連するSemEvalタスクのトレーニングデータを組み合わせる実験も行った。
比較評価の中間に位置する3つのオフセンバルタスクのベストシステムは,aタスク103の57位,bタスク75の39位,cタスク65の44位である。
関連論文リスト
- ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes [48.83290963506378]
本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文 参考訳(メタデータ) (2024-03-12T15:06:22Z) - MarsEclipse at SemEval-2023 Task 3: Multi-Lingual and Multi-Label
Framing Detection with Contrastive Learning [21.616089539381996]
本稿では,SemEval-2023 Task 3 Subtask 2 on Framing Detectionについて述べる。
我々は,多言語環境下での大規模事前学習言語モデルの微調整に,マルチラベルのコントラスト損失を用いた。
本システムは,6言語のうち5言語について,公式テストセットと共有タスクリーダーボードで第1位にランクインした。
論文 参考訳(メタデータ) (2023-04-20T18:42:23Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - CAiRE in DialDoc21: Data Augmentation for Information-Seeking Dialogue
System [55.43871578056878]
DialDoc21コンペティションでは,サブタスク1で74.95 F1スコア,60.74 Exact Matchスコア,サブタスク2で37.72 SacreBLEUスコアを達成した。
論文 参考訳(メタデータ) (2021-06-07T11:40:55Z) - Identifying and Categorizing Offensive Language in Social Media [0.0]
本研究は,SemEval 2019 Task 6: OffensEval用に構築された分類システムについて述べる。
私たちは、最良の結果を得るために、機械学習とディープラーニングモデルとデータ前処理とサンプリングテクニックをトレーニングしました。
論文 参考訳(メタデータ) (2021-04-10T22:53:43Z) - Garain at SemEval-2020 Task 12: Sequence based Deep Learning for
Categorizing Offensive Language in Social Media [3.236217153362305]
SemEval-2020 Task 12: OffenseEval: Multilingual Offensive Language Identification in Social Media (英語)
データセットマクロ全体の25%のトレーニングシステムでは,f1スコアが47.763%であった。
論文 参考訳(メタデータ) (2020-09-02T17:09:29Z) - Duluth at SemEval-2020 Task 12: Offensive Tweet Identification in
English with Logistic Regression [0.0]
本稿では,Duluth SemEval--2020 Task 12, Multilingual Offensive Language Identification in Social Media (OffensEval--2020)に参加するシステムについて述べる。
私たちは、タスクオーガナイザが利用可能な遠方の教師付きトレーニングデータに基づいてモデルをトレーニングし、他のリソースを使用しませんでした。
予想通り,タスクAでは85の79位,タスクBでは43の34位,タスクCでは39の24位であった。
論文 参考訳(メタデータ) (2020-07-25T14:49:31Z) - problemConquero at SemEval-2020 Task 12: Transformer and Soft
label-based approaches [2.434159858639793]
ソーシャルメディアにおけるSemEval-2020共有タスク12多言語攻撃言語識別のための各種システムについて述べる。
我々はOffensEval-2020の3つのサブタスクに参加したが、評価フェーズの最終提出にはトランスフォーマーベースのアプローチとソフトラベルベースのアプローチが含まれていた。
論文 参考訳(メタデータ) (2020-07-21T15:06:58Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。