論文の概要: BCH-NLP at BioCreative VII Track 3: medications detection in tweets
using transformer networks and multi-task learning
- arxiv url: http://arxiv.org/abs/2111.13726v1
- Date: Fri, 26 Nov 2021 19:22:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 15:19:58.220185
- Title: BCH-NLP at BioCreative VII Track 3: medications detection in tweets
using transformer networks and multi-task learning
- Title(参考訳): BCH-NLP at BioCreative VII Track 3: トランスフォーマーネットワークとマルチタスク学習を用いたツイート中の薬物検出
- Authors: Dongfang Xu, Shan Chen, Timothy Miller
- Abstract要約: テキスト分類とシーケンスラベリングを併用したマルチタスク学習モデルを実装した。
私たちのベストシステムは80.4の厳格なF1を達成し、全参加者の平均スコアよりも1位と10ポイント以上高くランク付けしました。
- 参考スコア(独自算出の注目度): 9.176393163624002
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we present our work participating in the BioCreative VII Track
3 - automatic extraction of medication names in tweets, where we implemented a
multi-task learning model that is jointly trained on text classification and
sequence labelling. Our best system run achieved a strict F1 of 80.4, ranking
first and more than 10 points higher than the average score of all
participants. Our analyses show that the ensemble technique, multi-task
learning, and data augmentation are all beneficial for medication detection in
tweets.
- Abstract(参考訳): 本稿では,bicreative vii track 3 - automatic extraction of drug names in tweets(ツイート中の薬名の自動抽出)に参加し,テキスト分類とシーケンスラベリングを共同で学習するマルチタスク学習モデルを実装した。
我々のベストシステムは80.4の厳格なF1を達成し、全参加者の平均スコアよりも1位と10ポイント以上高かった。
分析の結果,アンサンブル手法,マルチタスク学習,データ拡張がすべて,ツイート中の薬物検出に有用であることが判明した。
関連論文リスト
- Advacheck at GenAI Detection Task 1: AI Detection Powered by Domain-Aware Multi-Tasking [0.0]
本稿では,GenAI検出タスク1コンペティションのモノリンガルサブタスクにおいて,機械生成テキストと人文テキストを認識できるようにAdvacheckチームが設計したシステムについて述べる。
開発したシステムはマルチタスクアーキテクチャであり,複数の分類ヘッド間で共用トランスフォーマーを備える。
論文 参考訳(メタデータ) (2024-11-18T17:03:30Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - Automatic Extraction of Medication Names in Tweets as Named Entity
Recognition [3.7462395049372894]
バイオクリエイティヴVIIタスク3は、ツイート中の医薬品や栄養補助薬の言及を認識することで、この情報をマイニングすることに焦点を当てている。
トークンレベルの分類を行うために,複数のBERTスタイルの言語モデルを微調整することで,この問題に対処する。
我々の最良のシステムは、5つのメガトロン-BERT-345Mモデルで構成され、未知のテストデータに対して厳密なF1スコア0.764を達成する。
論文 参考訳(メタデータ) (2021-11-30T18:25:32Z) - Extraction of Medication Names from Twitter Using Augmentation and an
Ensemble of Language Models [55.44979919361194]
BioCreative VII Track 3の課題は、Twitterのユーザータイムラインで薬物名を特定することである。
この課題への回答として、いくつかのデータ拡張技術を用いて、利用可能なトレーニングデータを拡張しました。
その後、拡張されたデータは、一般ドメインのTwitterコンテンツで事前トレーニングされた言語モデルのアンサンブルを微調整するために使用された。
論文 参考訳(メタデータ) (2021-11-12T11:18:46Z) - A PubMedBERT-based Classifier with Data Augmentation Strategy for
Detecting Medication Mentions in Tweets [2.539568419434224]
Twitterは毎日大量のユーザー生成テキスト(ツイート)を公開している。
エンティティ認識(NER)は、ツイートデータにいくつかの特別な課題を提示します。
本稿では,複数のデータ拡張手法を組み合わせたPubMedBERTベースの分類器について検討する。
提案手法はF1スコアが0.762であり, 平均値よりもかなり高い値を示した。
論文 参考訳(メタデータ) (2021-11-03T14:29:24Z) - R-BERT-CNN: Drug-target interactions extraction from biomedical
literature [1.8814209805277506]
薬物プロットタスクのBioCreative VIIへの参加について紹介する。
薬物-標的相互作用(DTI)は、薬物の発見と再資源化に重要である。
PubMedには32万件のバイオメディカル記事があり、このような膨大な知識ベースからDTIを手作業で抽出することは困難である。
論文 参考訳(メタデータ) (2021-10-31T22:50:33Z) - Training ELECTRA Augmented with Multi-word Selection [53.77046731238381]
本稿では,マルチタスク学習に基づくELECTRAの改良を目的としたテキストエンコーダ事前学習手法を提案する。
具体的には、識別器を訓練し、置換トークンを同時に検出し、候補集合から元のトークンを選択する。
論文 参考訳(メタデータ) (2021-05-31T23:19:00Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z) - Phonemer at WNUT-2020 Task 2: Sequence Classification Using COVID
Twitter BERT and Bagging Ensemble Technique based on Plurality Voting [0.0]
新型コロナウイルス(COVID-19)に関連する英語のつぶやきを自動的に識別するシステムを開発した。
最終アプローチでは0.9037のF1スコアを達成し,F1スコアを評価基準として総合6位にランク付けした。
論文 参考訳(メタデータ) (2020-10-01T10:54:54Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。