論文の概要: Mining Adverse Drug Reactions from Unstructured Mediums at Scale
- arxiv url: http://arxiv.org/abs/2201.01405v1
- Date: Wed, 5 Jan 2022 01:52:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 18:28:00.147931
- Title: Mining Adverse Drug Reactions from Unstructured Mediums at Scale
- Title(参考訳): スケールにおける非構造媒体からの逆薬物反応のマイニング
- Authors: Hasham Ul Haq Veysel Kocaman David Talby
- Abstract要約: 副作用の薬物反応/事象(ADR/ADE)は、患者の健康と医療費に大きな影響を及ぼす。
ほとんどのADRは正式なチャンネルでは報告されないが、しばしば構造化されていない会話で記録される。
本研究では,非構造化自由テキスト会話におけるADRを検出する自然言語処理(NLP)ソリューションを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adverse drug reactions / events (ADR/ADE) have a major impact on patient
health and health care costs. Detecting ADR's as early as possible and sharing
them with regulators, pharma companies, and healthcare providers can prevent
morbidity and save many lives. While most ADR's are not reported via formal
channels, they are often documented in a variety of unstructured conversations
such as social media posts by patients, customer support call transcripts, or
CRM notes of meetings between healthcare providers and pharma sales reps. In
this paper, we propose a natural language processing (NLP) solution that
detects ADR's in such unstructured free-text conversations, which improves on
previous work in three ways. First, a new Named Entity Recognition (NER) model
obtains new state-of-the-art accuracy for ADR and Drug entity extraction on the
ADE, CADEC, and SMM4H benchmark datasets (91.75%, 78.76%, and 83.41% F1 scores
respectively). Second, two new Relation Extraction (RE) models are introduced -
one based on BioBERT while the other utilizing crafted features over a Fully
Connected Neural Network (FCNN) - are shown to perform on par with existing
state-of-the-art models, and outperform them when trained with a supplementary
clinician-annotated RE dataset. Third, a new text classification model, for
deciding if a conversation includes an ADR, obtains new state-of-the-art
accuracy on the CADEC dataset (86.69% F1 score). The complete solution is
implemented as a unified NLP pipeline in a production-grade library built on
top of Apache Spark, making it natively scalable and able to process millions
of batch or streaming records on commodity clusters.
- Abstract(参考訳): 逆薬物反応/事象(ADR/ADE)は、患者の健康と医療費に大きな影響を及ぼす。
できるだけ早くadrを検出し、規制当局、製薬会社、医療提供者と共有することは、致死を防ぎ、多くの命を救える。
たいていのADRは、正式なチャンネルを通しては報告されていないが、患者によるソーシャルメディア投稿、カスタマーサポート電話の書き起こし、医療提供者と製薬販売担当者の会議のCRMノートなど、様々な非構造化の会話に記録されていることが多い。この記事では、そのような非構造化の会話の中でADRを検出する自然言語処理(NLP)ソリューションを提案し、3つの方法で改善する。
まず、新しい名前付きエンティティ認識(ner)モデルは、ade、cadec、smm4hベンチマークデータセット(それぞれ91.75%、78.76%、83.41%のf1スコア)でadrおよび薬物エンティティ抽出のための新しい最先端精度を得る。
第2に、BioBERTに基づいて2つの新しいリレーショナル抽出(RE)モデルを導入し、もう1つは、Fully Connected Neural Network(FCNN)よりも工芸的な特徴を活用して、既存の最先端モデルと同等に実行し、補助的なクリニック注釈REデータセットでトレーニングした場合に、それらを上回るパフォーマンスを示す。
第3に、会話にADRが含まれているかどうかを決定するための新しいテキスト分類モデルがCADECデータセット(86.69% F1スコア)で新しい最先端の精度を得る。
完全なソリューションは、Apache Spark上に構築されたプロダクショングレードライブラリに統一されたNLPパイプラインとして実装されている。
関連論文リスト
- HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z) - KESDT: knowledge enhanced shallow and deep Transformer for detecting
adverse drug reactions [14.095117843726511]
本稿では,ADR検出のための知識強調シャロー・ディープトランスフォーマ(KESDT)モデルを提案する。
最初の問題に対処するため、浅い融合方式でトランスフォーマーモデルにドメインキーワードを組み込む。
低アノテートデータを克服するため、深層融合方式でトランスフォーマーモデルに同義集合を統合する。
論文 参考訳(メタデータ) (2023-08-18T06:10:11Z) - ADRNet: A Generalized Collaborative Filtering Framework Combining
Clinical and Non-Clinical Data for Adverse Drug Reaction Prediction [49.56476929112382]
逆薬物反応(ADR)予測は、医療と薬物発見において重要な役割を果たす。
ADRNetは、臨床データと非臨床データを組み合わせた一般的な協調フィルタリングフレームワークである。
論文 参考訳(メタデータ) (2023-08-03T11:28:12Z) - A Marker-based Neural Network System for Extracting Social Determinants
of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。
多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。
我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文 参考訳(メタデータ) (2022-12-24T18:40:23Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Deeper Clinical Document Understanding Using Relation Extraction [0.0]
名前付きエンティティ認識(NER)と関係抽出(RE)モデルからなるテキストマイニングフレームワークを提案する。
我々は2つの新しいREモデルアーキテクチャを導入し、BioBERTをベースとした精度最適化アーキテクチャと、フル接続ニューラルネットワーク(FCNN)上のクラフト機能を活用した速度最適化アーキテクチャを紹介した。
本稿では,この枠組みの実践的応用として,バイオメディカル知識グラフの構築と臨床コードへの実体マッピングの精度向上について述べる。
論文 参考訳(メタデータ) (2021-12-25T17:14:13Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Drug-disease Graph: Predicting Adverse Drug Reaction Signals via Graph
Neural Network with Clinical Data [21.700743167418963]
医療クレームデータを用いたADR信号検出のためのグラフベースの新しいフレームワークを開発した。
そこで我々は,Side Effect Resourceデータベースのラベルを用いて,ADR信号の予測にグラフニューラルネットワークを適用した。
論文 参考訳(メタデータ) (2020-04-01T13:01:02Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。