論文の概要: Want to Identify, Extract and Normalize Adverse Drug Reactions in
Tweets? Use RoBERTa
- arxiv url: http://arxiv.org/abs/2006.16146v1
- Date: Mon, 29 Jun 2020 16:10:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 14:40:44.598985
- Title: Want to Identify, Extract and Normalize Adverse Drug Reactions in
Tweets? Use RoBERTa
- Title(参考訳): ツイート中の副作用を識別し、抽出し、正常化する?
RoBERTaの使用
- Authors: Katikapalli Subramanyam Kalyan, S.Sangeetha
- Abstract要約: 本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス(SMM4H)2020におけるタスク2とタスク3の取り組みについて述べる。
タスク2では、有害薬物反応(ADR)ツイートと非ADRツイートを区別し、バイナリ分類として扱う。
タスク3では、ADR参照を抽出し、MedDRAコードにマッピングする。
我々のモデルは、平均スコアよりも大幅に改善された両方のタスクにおいて、有望な結果を達成する。
- 参考スコア(独自算出の注目度): 5.33024001730262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents our approach for task 2 and task 3 of Social Media Mining
for Health (SMM4H) 2020 shared tasks. In task 2, we have to differentiate
adverse drug reaction (ADR) tweets from nonADR tweets and is treated as binary
classification. Task3 involves extracting ADR mentions and then mapping them to
MedDRA codes. Extracting ADR mentions is treated as sequence labeling and
normalizing ADR mentions is treated as multi-class classification. Our system
is based on pre-trained language model RoBERTa and it achieves a) F1-score of
58% in task2 which is 12% more than the average score b) relaxed F1-score of
70.1% in ADR extraction of task 3 which is 13.7% more than the average score
and relaxed F1-score of 35% in ADR extraction + normalization of task3 which is
5.8% more than the average score. Overall, our models achieve promising results
in both the tasks with significant improvements over average scores.
- Abstract(参考訳): 本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス(SMM4H)2020におけるタスク2とタスク3の取り組みについて述べる。
タスク2では、有害薬物反応(ADR)ツイートと非ADRツイートを区別し、バイナリ分類として扱う。
Task3はADR参照を抽出し、それらをMedDRAコードにマッピングする。
ADR参照の抽出はシーケンスラベリングとして扱われ、ADR参照の正規化はマルチクラス分類として扱われる。
我々のシステムは、事前訓練された言語モデルRoBERTaに基づいており、それを実現する。
a)タスク2におけるF1スコアの58%は平均スコアの12%以上である
b) 平均スコアより13.7%高いタスク3の70.1%のF1スコアを緩和し、平均スコアより5.8%高いタスク3の35%のF1スコアを緩和した。
全体として、我々のモデルは、平均スコアよりも大幅に改善された両方のタスクで有望な結果を達成する。
関連論文リスト
- Text Augmentations with R-drop for Classification of Tweets Self
Reporting Covid-19 [28.91836510067532]
本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス2023共有タスクのためのモデルを提案する。
我々のアプローチは、多種多様なテキスト拡張を取り入れた分類モデルである。
テストセットのF1スコアは0.877である。
論文 参考訳(メタデータ) (2023-11-06T14:18:16Z) - Tool-Augmented Reward Modeling [58.381678612409]
本稿では,外部環境へのアクセスによるRMの強化により,制約に対処するツール拡張された嗜好モデリング手法であるThemisを提案する。
我々の研究は、外部ツールをRMに統合し、様々な外部ソースとの相互作用を可能にすることを目的としている。
人間の評価では、テミスで訓練されたRLHFはベースラインと比較して平均32%の勝利率を得る。
論文 参考訳(メタデータ) (2023-10-02T09:47:40Z) - Incorporating Emotions into Health Mention Classification Task on Social
Media [70.23889100356091]
情緒的特徴を取り入れた健康言及分類のための枠組みを提案する。
我々は,ソーシャルメディアプラットフォームによる5つのHMC関連データセットに対するアプローチを評価した。
以上の結果から,感情的な知識を取り入れたHMCモデルが有効な選択肢であることが示唆された。
論文 参考訳(メタデータ) (2022-12-09T18:38:41Z) - Retrieval-Augmented Reinforcement Learning [63.32076191982944]
過去の経験のデータセットを最適な行動にマップするために、ネットワークをトレーニングします。
検索プロセスは、現在のコンテキストで有用なデータセットから情報を取得するために訓練される。
検索強化R2D2はベースラインR2D2エージェントよりもかなり高速に学習し,より高いスコアを得ることを示す。
論文 参考訳(メタデータ) (2022-02-17T02:44:05Z) - A PubMedBERT-based Classifier with Data Augmentation Strategy for
Detecting Medication Mentions in Tweets [2.539568419434224]
Twitterは毎日大量のユーザー生成テキスト(ツイート)を公開している。
エンティティ認識(NER)は、ツイートデータにいくつかの特別な課題を提示します。
本稿では,複数のデータ拡張手法を組み合わせたPubMedBERTベースの分類器について検討する。
提案手法はF1スコアが0.762であり, 平均値よりもかなり高い値を示した。
論文 参考訳(メタデータ) (2021-11-03T14:29:24Z) - Adversarial Retriever-Ranker for dense text retrieval [51.87158529880056]
本稿では、二重エンコーダレトリバーとクロスエンコーダローダからなるAdversarial Retriever-Ranker(AR2)を提案する。
AR2は、既存の高密度レトリバー法より一貫して大幅に優れている。
これには、R@5から77.9%(+2.1%)、TriviaQA R@5から78.2%(+1.4)、MS-MARCO MRR@10から39.5%(+1.3%)の改善が含まれている。
論文 参考訳(メタデータ) (2021-10-07T16:41:15Z) - Three Sentences Are All You Need: Local Path Enhanced Document Relation
Extraction [54.95848026576076]
本稿では,文書レベルREのエビデンス文を選択するための,恥ずかしいほど単純だが効果的な方法を提案する。
私たちはhttps://github.com/AndrewZhe/Three-Sentences-Are-All-You-Need.comでコードを公開しました。
論文 参考訳(メタデータ) (2021-06-03T12:29:40Z) - Understanding the Role of Affect Dimensions in Detecting Emotions from
Tweets: A Multi-task Approach [14.725717500450623]
本稿では,感情表現のカテゴリー的モデルと次元的モデルとの相関を利用して主観的分析を行うVADECを提案する。
マルチラベル感情分類と多次元感情回帰を共同トレーニングし、タスク間の関連性を活用します。
論文 参考訳(メタデータ) (2021-05-09T18:07:04Z) - BERT based Transformers lead the way in Extraction of Health Information
from Social Media [0.0]
英語ツイートにおける有害薬物効果(ade)の分類・抽出・正規化(task-1)と症状を含むcovid-19ツイートの分類(task-6)の2つの課題に参加した。
サブタスク-1(a)は61%のF1スコアで1位にランクインしました。
サブタスク-1(b)では50%のF1スコアを獲得し、すべての提出物の平均スコアに対して最大で+8%のF1を向上しました。
BERTweetモデルはSMM4H 2021 Task-6で94%のF1スコアを達成しました。
論文 参考訳(メタデータ) (2021-04-15T10:50:21Z) - Fake News Detection in Social Media using Graph Neural Networks and NLP
Techniques: A COVID-19 Use-case [2.4937400423177767]
本稿では,MediaEval 2020タスク,すなわちFakeNews: Corona Virusと5G Conspiracy Multimedia Twitter-Data-Based Analysisのソリューションについて述べる。
論文 参考訳(メタデータ) (2020-11-30T16:41:04Z) - Effects of Word-frequency based Pre- and Post- Processings for Audio
Captioning [49.41766997393417]
音響シーン・イベントの検出・分類のタスク6(自動音声キャプション)に使用したシステム(DCASE)2020 Challengeは,音声キャプションのためのデータ拡張,マルチタスク学習,ポストプロセッシングという3つの要素を組み合わせる。
このシステムは評価スコアが最も高いが、個々の要素のどれがパーフォーマンスに最も貢献したかはまだ明らかになっていない。
論文 参考訳(メタデータ) (2020-09-24T01:07:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。