論文の概要: Want to Identify, Extract and Normalize Adverse Drug Reactions in
Tweets? Use RoBERTa
- arxiv url: http://arxiv.org/abs/2006.16146v1
- Date: Mon, 29 Jun 2020 16:10:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 14:40:44.598985
- Title: Want to Identify, Extract and Normalize Adverse Drug Reactions in
Tweets? Use RoBERTa
- Title(参考訳): ツイート中の副作用を識別し、抽出し、正常化する?
RoBERTaの使用
- Authors: Katikapalli Subramanyam Kalyan, S.Sangeetha
- Abstract要約: 本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス(SMM4H)2020におけるタスク2とタスク3の取り組みについて述べる。
タスク2では、有害薬物反応(ADR)ツイートと非ADRツイートを区別し、バイナリ分類として扱う。
タスク3では、ADR参照を抽出し、MedDRAコードにマッピングする。
我々のモデルは、平均スコアよりも大幅に改善された両方のタスクにおいて、有望な結果を達成する。
- 参考スコア(独自算出の注目度): 5.33024001730262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents our approach for task 2 and task 3 of Social Media Mining
for Health (SMM4H) 2020 shared tasks. In task 2, we have to differentiate
adverse drug reaction (ADR) tweets from nonADR tweets and is treated as binary
classification. Task3 involves extracting ADR mentions and then mapping them to
MedDRA codes. Extracting ADR mentions is treated as sequence labeling and
normalizing ADR mentions is treated as multi-class classification. Our system
is based on pre-trained language model RoBERTa and it achieves a) F1-score of
58% in task2 which is 12% more than the average score b) relaxed F1-score of
70.1% in ADR extraction of task 3 which is 13.7% more than the average score
and relaxed F1-score of 35% in ADR extraction + normalization of task3 which is
5.8% more than the average score. Overall, our models achieve promising results
in both the tasks with significant improvements over average scores.
- Abstract(参考訳): 本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス(SMM4H)2020におけるタスク2とタスク3の取り組みについて述べる。
タスク2では、有害薬物反応(ADR)ツイートと非ADRツイートを区別し、バイナリ分類として扱う。
Task3はADR参照を抽出し、それらをMedDRAコードにマッピングする。
ADR参照の抽出はシーケンスラベリングとして扱われ、ADR参照の正規化はマルチクラス分類として扱われる。
我々のシステムは、事前訓練された言語モデルRoBERTaに基づいており、それを実現する。
a)タスク2におけるF1スコアの58%は平均スコアの12%以上である
b) 平均スコアより13.7%高いタスク3の70.1%のF1スコアを緩和し、平均スコアより5.8%高いタスク3の35%のF1スコアを緩和した。
全体として、我々のモデルは、平均スコアよりも大幅に改善された両方のタスクで有望な結果を達成する。
関連論文リスト
- RAMIE: Retrieval-Augmented Multi-task Information Extraction with Large Language Models on Dietary Supplements [12.224815934085154]
臨床記録から食事サプリメント(DS)に関する情報を抽出するための多タスク大言語モデル(LLM)フレームワークを開発した。
我々は4つの中核DS情報抽出タスクをマルチタスクとして使用した。
RAMIEフレームワークの助けを借りて、Llama2-13BはNERタスクでF1スコア87.39(3.51%改善)を達成した。
TEタスクでは、Llama2-7Bは79.45点(14.26%改善)、MedAlpaca-7Bは93.45点(0.94%改善)を記録した。
論文 参考訳(メタデータ) (2024-11-24T03:56:43Z) - PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation [68.17081518640934]
ロボット操作のためのPrIrmitive-driVen waypOinT-aware world model(PIVOT-R)を提案する。
PIVOT-RはWAWM(Waypoint-aware World Model)と軽量アクション予測モジュールで構成される。
私たちのPIVOT-RはSeaWaveベンチマークで最先端のオープンソースモデルより優れており、4段階の命令タスクで平均19.45%の相対的な改善を実現しています。
論文 参考訳(メタデータ) (2024-10-14T11:30:18Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - Cross-lingual Contextualized Phrase Retrieval [63.80154430930898]
そこで本研究では,言語間関係の単語検索を多義的に行うタスクの定式化を提案する。
我々は、コントラスト学習を用いて、言語間コンテクスト対応句検索(CCPR)を訓練する。
フレーズ検索タスクでは、CCPRはベースラインをかなり上回り、少なくとも13ポイント高いトップ1の精度を達成する。
論文 参考訳(メタデータ) (2024-03-25T14:46:51Z) - Text Augmentations with R-drop for Classification of Tweets Self
Reporting Covid-19 [28.91836510067532]
本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス2023共有タスクのためのモデルを提案する。
我々のアプローチは、多種多様なテキスト拡張を取り入れた分類モデルである。
テストセットのF1スコアは0.877である。
論文 参考訳(メタデータ) (2023-11-06T14:18:16Z) - Tool-Augmented Reward Modeling [58.381678612409]
本稿では,外部環境へのアクセスによるRMの強化により,制約に対処するツール拡張された嗜好モデリング手法であるThemisを提案する。
我々の研究は、外部ツールをRMに統合し、様々な外部ソースとの相互作用を可能にすることを目的としている。
人間の評価では、テミスで訓練されたRLHFはベースラインと比較して平均32%の勝利率を得る。
論文 参考訳(メタデータ) (2023-10-02T09:47:40Z) - Incorporating Emotions into Health Mention Classification Task on Social
Media [70.23889100356091]
情緒的特徴を取り入れた健康言及分類のための枠組みを提案する。
我々は,ソーシャルメディアプラットフォームによる5つのHMC関連データセットに対するアプローチを評価した。
以上の結果から,感情的な知識を取り入れたHMCモデルが有効な選択肢であることが示唆された。
論文 参考訳(メタデータ) (2022-12-09T18:38:41Z) - A PubMedBERT-based Classifier with Data Augmentation Strategy for
Detecting Medication Mentions in Tweets [2.539568419434224]
Twitterは毎日大量のユーザー生成テキスト(ツイート)を公開している。
エンティティ認識(NER)は、ツイートデータにいくつかの特別な課題を提示します。
本稿では,複数のデータ拡張手法を組み合わせたPubMedBERTベースの分類器について検討する。
提案手法はF1スコアが0.762であり, 平均値よりもかなり高い値を示した。
論文 参考訳(メタデータ) (2021-11-03T14:29:24Z) - Three Sentences Are All You Need: Local Path Enhanced Document Relation
Extraction [54.95848026576076]
本稿では,文書レベルREのエビデンス文を選択するための,恥ずかしいほど単純だが効果的な方法を提案する。
私たちはhttps://github.com/AndrewZhe/Three-Sentences-Are-All-You-Need.comでコードを公開しました。
論文 参考訳(メタデータ) (2021-06-03T12:29:40Z) - BERT based Transformers lead the way in Extraction of Health Information
from Social Media [0.0]
英語ツイートにおける有害薬物効果(ade)の分類・抽出・正規化(task-1)と症状を含むcovid-19ツイートの分類(task-6)の2つの課題に参加した。
サブタスク-1(a)は61%のF1スコアで1位にランクインしました。
サブタスク-1(b)では50%のF1スコアを獲得し、すべての提出物の平均スコアに対して最大で+8%のF1を向上しました。
BERTweetモデルはSMM4H 2021 Task-6で94%のF1スコアを達成しました。
論文 参考訳(メタデータ) (2021-04-15T10:50:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。