論文の概要: Constraint 2021: Machine Learning Models for COVID-19 Fake News
Detection Shared Task
- arxiv url: http://arxiv.org/abs/2101.03717v2
- Date: Wed, 13 Jan 2021 00:06:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 20:26:44.429918
- Title: Constraint 2021: Machine Learning Models for COVID-19 Fake News
Detection Shared Task
- Title(参考訳): Constraint 2021: COVID-19フェイクニュース検出共有タスクのための機械学習モデル
- Authors: Thomas Felber
- Abstract要約: 私たちは、COVID-19関連のソーシャルメディア投稿を偽物または本物として分類するという課題に対処します。
本システムでは,従来の機械学習アルゴリズムといくつかの言語的特徴を併用することで,この問題に対処する。
テストデータの重み付き平均F1スコアが95.19%となる線形SVMをベースとした最良の性能システムを見出した。
- 参考スコア(独自算出の注目度): 0.7614628596146599
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this system paper we present our contribution to the Constraint 2021
COVID-19 Fake News Detection Shared Task, which poses the challenge of
classifying COVID-19 related social media posts as either fake or real. In our
system, we address this challenge by applying classical machine learning
algorithms together with several linguistic features, such as n-grams,
readability, emotional tone and punctuation. In terms of pre-processing, we
experiment with various steps like stop word removal, stemming/lemmatization,
link removal and more. We find our best performing system to be based on a
linear SVM, which obtains a weighted average F1 score of 95.19% on test data,
which lands a place in the middle of the leaderboard (place 80 of 167).
- Abstract(参考訳): 本稿では,新型コロナウイルス関連ソーシャルメディア投稿を偽か偽かのどちらかに分類する上での課題となる,2021年の「Fake News Detection Shared Task」への貢献について述べる。
本システムでは,古典的機械学習アルゴリズムと,n-gram,可読性,感情的トーン,句読点などの言語的特徴を組み合わせることで,この課題を解決する。
プリプロセッシングの観点からは,ストップワードの除去,ストーミング/レンマティゼーション,リンクの除去など,さまざまなステップを試す。
テストデータから平均95.19%の重み付け平均f1スコアを得られる線形svmをベースとし、リードボードの中央に位置する場所(167箇所中80箇所)に配置した。
関連論文リスト
- Mavericks at ArAIEval Shared Task: Towards a Safer Digital Space --
Transformer Ensemble Models Tackling Deception and Persuasion [0.0]
本稿では,各課題のタスク1-Aとタスク2-Aのアプローチについて述べる。
タスクは、与えられたバイナリ分類問題に対して、ツイートとニュース記事のマルチジャンルスニペットを使用する。
タスク1-A(8位)では0.742、タスク2-A(7位)では0.901のマイクロF1スコアを達成した。
論文 参考訳(メタデータ) (2023-11-30T17:26:57Z) - Unify word-level and span-level tasks: NJUNLP's Participation for the
WMT2023 Quality Estimation Shared Task [59.46906545506715]
我々は、WMT 2023 Quality Estimation (QE)共有タスクにNJUNLPチームを紹介する。
私たちのチームは2つのサブタスクすべてで英語とドイツ語のペアの予測を提出しました。
我々のモデルは、単語レベルと細粒度エラースパン検出サブタスクの両方において、英語とドイツ語で最高の結果を得た。
論文 参考訳(メタデータ) (2023-09-23T01:52:14Z) - BJTU-WeChat's Systems for the WMT22 Chat Translation Task [66.81525961469494]
本稿では,WMT'22チャット翻訳タスクに対して,北京地東大学とWeChat AIを共同で提案する。
Transformerに基づいて、いくつかの有効な変種を適用します。
本システムでは,0.810と0.946のCOMETスコアを達成している。
論文 参考訳(メタデータ) (2022-11-28T02:35:04Z) - BC-Z: Zero-Shot Task Generalization with Robotic Imitation Learning [108.41464483878683]
本稿では,視覚に基づくロボット操作システムにおいて,新しいタスクを一般化することの課題について検討する。
実演と介入の両方から学ぶことができるインタラクティブで柔軟な模倣学習システムを開発した。
実際のロボットにおけるデータ収集を100以上のタスクにスケールすると、このシステムは平均的な成功率44%で24の目に見えない操作タスクを実行できる。
論文 参考訳(メタデータ) (2022-02-04T07:30:48Z) - Sequence-level self-learning with multiple hypotheses [53.04725240411895]
我々は、自動音声認識(ASR)のためのアテンションベースシーケンス・ツー・シーケンス(seq2seq)モデルを用いた新しい自己学習手法を開発した。
従来の教師なし学習手法とは対照的に,我々はEmphmulti-task Learning(MTL)フレームワークを採用する。
実験の結果,本手法は,英語データのみを用いてトレーニングしたベースラインモデルと比較して,英文音声データのWERを14.55%から10.36%に削減できることがわかった。
論文 参考訳(メタデータ) (2021-12-10T20:47:58Z) - Checkovid: A COVID-19 misinformation detection system on Twitter using
network and content mining perspectives [9.69596041242667]
新型コロナウイルス(COVID-19)パンデミックの間、ソーシャルメディアプラットフォームは社会的孤立と隔離のためにコミュニケーションするのに理想的だった。
この問題に対処するため、Twitterに2つのCOVID-19関連誤情報データセットを提示する。
機械学習アルゴリズムとNLP技術に基づくネットワークベースおよびコンテンツベースプロセスからなる誤情報検出システムを提案する。
論文 参考訳(メタデータ) (2021-07-20T20:58:23Z) - Two-Stream Consensus Network: Submission to HACS Challenge 2021
Weakly-Supervised Learning Track [78.64815984927425]
弱い監督による時間的行動ローカライゼーションの目標は、ビデオの興味ある動作を時間的に特定し、分類することである。
この課題では,2ストリームコンセンサスネットワーク(TSCN)を主要なフレームワークとして採用しています。
この課題では,本手法が今後の学術研究のベースラインとなることを期待して,第2位にランクインした。
論文 参考訳(メタデータ) (2021-06-21T03:36:36Z) - A Heuristic-driven Ensemble Framework for COVID-19 Fake News Detection [5.979726271522835]
新型コロナウイルスに関連するツイートが「本物」か「フェイク」かを自動で識別するフェイクニュース検知システムについて述べる。
リーダーボードのジョイント8位を達成するためのトレーニング済みモデルで構成されたアンサンブルモデルを使用しています。
F1スコア0.9883のツイートにユーザ名ハンドルとリンクドメインに基づく新しいアルゴリズムを組み込むことで,システムを大幅に改善することができた。
論文 参考訳(メタデータ) (2021-01-10T13:21:08Z) - Exploring Text-transformers in AAAI 2021 Shared Task: COVID-19 Fake News
Detection in English [30.61407811064534]
本稿では,AAAI 2021の共用タスクである「Fake News Detection」を英語で記述する。
BERT、Roberta、Ernieなど、様々な学習済み言語モデルのアンサンブル法を提案しました。
また、正しく分類されていないサンプルの広範な分析も行います。
論文 参考訳(メタデータ) (2021-01-07T04:01:13Z) - Phonemer at WNUT-2020 Task 2: Sequence Classification Using COVID
Twitter BERT and Bagging Ensemble Technique based on Plurality Voting [0.0]
新型コロナウイルス(COVID-19)に関連する英語のつぶやきを自動的に識別するシステムを開発した。
最終アプローチでは0.9037のF1スコアを達成し,F1スコアを評価基準として総合6位にランク付けした。
論文 参考訳(メタデータ) (2020-10-01T10:54:54Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。