論文の概要: Fine-Tuning Transformers for Identifying Self-Reporting Potential Cases
and Symptoms of COVID-19 in Tweets
- arxiv url: http://arxiv.org/abs/2104.05501v1
- Date: Mon, 12 Apr 2021 14:31:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 22:00:51.936848
- Title: Fine-Tuning Transformers for Identifying Self-Reporting Potential Cases
and Symptoms of COVID-19 in Tweets
- Title(参考訳): ツイート中の自己申告可能性とCOVID-19症状を識別するための微調整トランスフォーマー
- Authors: Max Fleming, Priyanka Dondeti, Caitlin N. Dreisbach, Adam Poliak
- Abstract要約: 私たちは、2021年のソーシャルメディアマイニング for Health Applications(SMM4H)共有タスクのタスク5および6に対する当社のストレートフォワードアプローチについて説明します。
私たちのシステムは、各タスクの微調整Distill-BERT、および最初に他のタスクのモデルを微調整に基づいています。
- 参考スコア(独自算出の注目度): 5.425235965110337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe our straight-forward approach for Tasks 5 and 6 of 2021 Social
Media Mining for Health Applications (SMM4H) shared tasks. Our system is based
on fine-tuning Distill- BERT on each task, as well as first fine-tuning the
model on the other task. We explore how much fine-tuning is necessary for
accurately classifying tweets as containing self-reported COVID-19 symptoms
(Task 5) or whether a tweet related to COVID-19 is self-reporting, non-personal
reporting, or a literature/news mention of the virus (Task 6).
- Abstract(参考訳): 我々は2021年のソーシャルメディアマイニング・フォー・ヘルス・アプリケーション(smm4h)におけるタスク5と6の共有タスクに対するストレートフォワード・アプローチについて述べる。
本システムでは,各タスクの精細な精細調整と,他のタスクのモデルを精細に調整する。
新型コロナウイルスの症状を報告したツイート(第5章)や、COVID-19に関連するツイートが自己報告されているのか、非個人報告なのか、ウイルスに関する文献/ニュース言及なのか(第6章)。
関連論文リスト
- ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - Shayona@SMM4H23: COVID-19 Self diagnosis classification using BERT and
LightGBM models [1.5566524830295307]
本稿では,Team Shayona による SMMH4-23 のタスク 1 と 4 の共有に対するアプローチと結果について述べる。
私たちのチームは、すべての参加者の中で、Task-1のf1スコア0.94を達成しました。
論文 参考訳(メタデータ) (2024-01-04T09:13:18Z) - tmn at #SMM4H 2023: Comparing Text Preprocessing Techniques for
Detecting Tweets Self-reporting a COVID-19 Diagnosis [1.8492669447784602]
本稿では,SMM4H 2023におけるタスク1のために開発されたシステムについて述べる。
このタスクの目的は、新型コロナウイルス(COVID-19)の診断を自己報告するツイートと、そうでないツイートを自動的に区別することだ。
論文 参考訳(メタデータ) (2023-11-01T07:41:23Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - STraTA: Self-Training with Task Augmentation for Better Few-shot
Learning [77.04780470527432]
タスク拡張による自己学習のためのSTraTAを提案する。
実験の結果,STraTAは12個のベンチマークでサンプル効率を大幅に向上できることがわかった。
分析の結果,タスク強化と自己学習は相補的かつ独立的に有効であることが判明した。
論文 参考訳(メタデータ) (2021-09-13T19:14:01Z) - BERT based Transformers lead the way in Extraction of Health Information
from Social Media [0.0]
英語ツイートにおける有害薬物効果(ade)の分類・抽出・正規化(task-1)と症状を含むcovid-19ツイートの分類(task-6)の2つの課題に参加した。
サブタスク-1(a)は61%のF1スコアで1位にランクインしました。
サブタスク-1(b)では50%のF1スコアを獲得し、すべての提出物の平均スコアに対して最大で+8%のF1を向上しました。
BERTweetモデルはSMM4H 2021 Task-6で94%のF1スコアを達成しました。
論文 参考訳(メタデータ) (2021-04-15T10:50:21Z) - Learning Invariant Representations across Domains and Tasks [81.30046935430791]
本稿では,この教師なしタスク転送問題を解決するための新しいタスク適応ネットワーク(tan)を提案する。
ドメイン・アドバーサル・トレーニングによる伝達可能な機能を学習することに加えて、学習から学習への戦略を用いてタスクの意味を適応させる新しいタスク・セマンティクス・アダプタを提案する。
TANは最近の強いベースラインに比べてリコールとF1スコアを5.0%と7.8%大きく向上させた。
論文 参考訳(メタデータ) (2021-03-03T11:18:43Z) - NIT COVID-19 at WNUT-2020 Task 2: Deep Learning Model RoBERTa for
Identify Informative COVID-19 English Tweets [0.0]
本稿では,WNUT-2020 Task2 において,NIT_COVID-19 チームによって提出された WNUT-2020 Task2 における COVID-19 英語のつぶやきを識別するためのモデルを提案する。
共用タスクWNUT 2020 Task2のモデルによる性能はF1スコアの89.14%である。
論文 参考訳(メタデータ) (2020-11-11T05:20:39Z) - Characterizing drug mentions in COVID-19 Twitter Chatter [1.2400116527089997]
そこでわれわれは、新型コロナウイルス(COVID-19)のツイート4億2400万件のTwitterデータセットを発掘し、薬物の言及に関する話題を特定した。
一見単純なタスクのように見えるが、Twitterにおける言語使用の非公式な性質のため、このタスクを支援するために、従来の自動メソッドと並行して機械学習の必要性を実証する。
ソーシャルメディアデータを扱う際には,処理前ステップとして必要なタスクをミススペル処理することで,約15%の追加データを復元することが可能です。
論文 参考訳(メタデータ) (2020-07-20T16:56:46Z) - The NTT DCASE2020 Challenge Task 6 system: Automated Audio Captioning
with Keywords and Sentence Length Estimation [49.41766997393417]
本報告では, 音響シーン・イベントの検出・分類に関わるシステムについて述べる。
本論文は,音声の自動字幕化における2つの不確定性,すなわち,単語選択不確定性と文長不確定性に焦点をあてる。
マルチタスク学習によりキーワードと文長を推定することにより,主字幕生成と部分不確定化を同時に解決する。
論文 参考訳(メタデータ) (2020-07-01T04:26:27Z) - On the Generation of Medical Dialogues for COVID-19 [60.63485429268256]
新型コロナウイルス関連の症状を患ったり、危険因子に晒されたりする人は、医師に相談する必要がある。
医療専門家が不足しているため、多くの人がオンライン相談を受けることができない。
本研究の目的は、新型コロナウイルス関連の相談を提供する医療対話システムの構築である。
論文 参考訳(メタデータ) (2020-05-11T21:23:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。