論文の概要: Systematic Comparative Analysis of Large Pretrained Language Models on Contextualized Medication Event Extraction
- arxiv url: http://arxiv.org/abs/2509.19224v1
- Date: Tue, 23 Sep 2025 16:48:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.957805
- Title: Systematic Comparative Analysis of Large Pretrained Language Models on Contextualized Medication Event Extraction
- Title(参考訳): 文脈化メディケーションイベント抽出に基づく大規模事前学習言語モデルの体系的比較分析
- Authors: Tariq Abdul-Quddoos, Xishuang Dong, Lijun Qian,
- Abstract要約: CMED(Contextualized Medication Event dataset)は、構造化されていないEHRと注釈付きノートのデータセットである。
臨床データに基づいて事前訓練されたモデルは、薬物や薬物の事象を検出するのにより効果的である。
一般ドメインデータに基づいて事前訓練したバートベースは、医薬品に関連する事象の文脈を分類するのに最も効果的であることが判明した。
- 参考スコア(独自算出の注目度): 0.3670422696827525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Attention-based models have become the leading approach in modeling medical language for Natural Language Processing (NLP) in clinical notes. These models outperform traditional techniques by effectively capturing contextual rep- resentations of language. In this research a comparative analysis is done amongst pre- trained attention based models namely Bert Base, BioBert, two variations of Bio+Clinical Bert, RoBerta, and Clinical Long- former on task related to Electronic Health Record (EHR) information extraction. The tasks from Track 1 of Harvard Medical School's 2022 National Clinical NLP Challenges (n2c2) are considered for this comparison, with the Contextualized Medication Event Dataset (CMED) given for these task. CMED is a dataset of unstructured EHRs and annotated notes that contain task relevant information about the EHRs. The goal of the challenge is to develop effective solutions for extracting contextual information related to patient medication events from EHRs using data driven methods. Each pre-trained model is fine-tuned and applied on CMED to perform medication extraction, medical event detection, and multi-dimensional medication event context classification. Pro- cessing methods are also detailed for breaking down EHRs for compatibility with the applied models. Performance analysis has been carried out using a script based on constructing medical terms from the evaluation portion of CMED with metrics including recall, precision, and F1-Score. The results demonstrate that models pre-trained on clinical data are more effective in detecting medication and medication events, but Bert Base, pre- trained on general domain data showed to be the most effective for classifying the context of events related to medications.
- Abstract(参考訳): 注意に基づくモデルは、臨床ノートにおける自然言語処理(NLP)のための医学的言語モデリングにおける主要なアプローチとなっている。
これらのモデルは、文脈的反感を効果的に捉え、従来の手法より優れている。
本研究では,Bert Base,BioBert,Bio+Clinical Bert,RoBerta,Citical Long- formerの2種類の電子健康記録(EHR)情報抽出モデルの比較分析を行った。
ハーバード医科学校の2022年の全国臨床NLPチャレンジ(n2c2)のトラック1のタスクは、これらのタスクに与えられたコンテキスト化メディケーションイベントデータセット(CMED)と比較される。
CMEDは、構造化されていないEHRと注釈付きノートのデータセットで、EHRに関するタスク関連の情報を含んでいる。
この課題の目標は、データ駆動手法を用いて、患者薬品イベントに関連するコンテキスト情報をEHRから抽出する効果的なソリューションを開発することである。
各事前訓練モデルは、CMEDに微調整され、医薬品抽出、医療イベント検出、多次元医薬品イベントコンテキスト分類を行う。
適用されたモデルとの互換性のために EHR を分解するためにも、Pro-cessing 手法が詳述されている。
CMEDの評価部分から、リコール、精度、F1スコアなどの指標を用いて、医療用語を構成するスクリプトを用いて、パフォーマンス分析を行った。
その結果、臨床データに基づいて事前訓練したモデルは、薬物や薬物の事象を検出するのにより効果的であることが示されているが、一般領域のデータに基づいて事前訓練したBert Baseは、薬物に関連する事象の文脈を分類するのに最も効果的であることが判明した。
関連論文リスト
- DR.EHR: Dense Retrieval for Electronic Health Record with Knowledge Injection and Synthetic Data [2.9929405444223205]
EHRは臨床実践において重要な役割を担っているが、その検索は主に意味的ギャップの問題によって困難である。
近年の高密度検索の進歩は有望なソリューションを提供するが、医療知識の不足やトレーニングコーパスのミスマッチにより、一般ドメインとバイオメディカルドメインの両方の既存のモデルは不足している。
本稿では,EHR検索に適した高密度検索モデルであるtexttDR.EHRを紹介する。
論文 参考訳(メタデータ) (2025-07-24T17:02:46Z) - Towards Efficient Patient Recruitment for Clinical Trials: Application of a Prompt-Based Learning Model [0.7373617024876725]
臨床試験は医薬品の介入を促進するのに不可欠であるが、適格な参加者を選ぶ際にボトルネックに直面している。
構造化されていない医療用テキストの複雑な性質は、参加者を効率的に識別する上での課題である。
本研究では,コホート選択課題に対するプロンプトベース大規模言語モデルの性能評価を目的とした。
論文 参考訳(メタデータ) (2024-04-24T20:42:28Z) - Medical Data Augmentation via ChatGPT: A Case Study on Medication
Identification and Medication Event Classification [2.980018103007841]
2022年のN2C2コンクールでは、電子健康記録の重要な要因の特定を促進するために様々なタスクが提示された。
事前訓練された大規模言語モデル (LLM) はこれらのタスクにおいて例外的な性能を示した。
本研究の目的は、注釈付きデータの限られた可用性を克服するために、データ拡張のためのLCM(特にChatGPT)の利用を検討することである。
論文 参考訳(メタデータ) (2023-06-10T20:55:21Z) - sEHR-CE: Language modelling of structured EHR data for efficient and
generalizable patient cohort expansion [0.0]
sEHR-CEは、異種臨床データセットの統合表現型化と分析を可能にするトランスフォーマーに基づく新しいフレームワークである。
大規模研究である英国バイオバンクのプライマリ・セカンダリ・ケアデータを用いてアプローチを検証する。
論文 参考訳(メタデータ) (2022-11-30T16:00:43Z) - Competence-based Multimodal Curriculum Learning for Medical Report
Generation [98.10763792453925]
本稿では,コンピテンスベースのマルチモーダルカリキュラム学習フレームワーク(CMCL)を提案する。
具体的には、CMCLは放射線学者の学習過程をシミュレートし、段階的にモデルを最適化する。
パブリックIU-XrayとMIMIC-CXRデータセットの実験は、CMCLを既存のモデルに組み込んでパフォーマンスを向上させることができることを示している。
論文 参考訳(メタデータ) (2022-06-24T08:16:01Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - An efficient representation of chronological events in medical texts [9.118144540451514]
臨床ノートで利用可能な時系列イベントから学習するための体系的手法を提案した。
提案手法は,任意の種類の逐次イベントの非パラメトリック階層表現を生成する。
この手法は、英国で最大の中等医療精神保健 EHR データを用いて開発され、外部で検証された。
論文 参考訳(メタデータ) (2020-10-16T14:54:29Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。