論文の概要: LLM-based Prompt Ensemble for Reliable Medical Entity Recognition from EHRs
- arxiv url: http://arxiv.org/abs/2505.08704v1
- Date: Tue, 13 May 2025 16:11:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.662945
- Title: LLM-based Prompt Ensemble for Reliable Medical Entity Recognition from EHRs
- Title(参考訳): EHRからの信頼性のある医療エンティティ認識のためのLLMベースのプロンプトアンサンブル
- Authors: K M Sajjadul Islam, Ayesha Siddika Nipu, Jiawei Wu, Praveen Madiraju,
- Abstract要約: 本稿では,大規模言語モデル(LLM)を用いた即時医療機関認識について検討する。
即発アンサンブルのGPT-4oはF1スコア0.95、リコール0.98で最高評価を達成した。
アンサンブル法は、埋め込みベースの類似性と多数決によって出力を集約することで信頼性を向上させた。
- 参考スコア(独自算出の注目度): 4.262074310505135
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Electronic Health Records (EHRs) are digital records of patient information, often containing unstructured clinical text. Named Entity Recognition (NER) is essential in EHRs for extracting key medical entities like problems, tests, and treatments to support downstream clinical applications. This paper explores prompt-based medical entity recognition using large language models (LLMs), specifically GPT-4o and DeepSeek-R1, guided by various prompt engineering techniques, including zero-shot, few-shot, and an ensemble approach. Among all strategies, GPT-4o with prompt ensemble achieved the highest classification performance with an F1-score of 0.95 and recall of 0.98, outperforming DeepSeek-R1 on the task. The ensemble method improved reliability by aggregating outputs through embedding-based similarity and majority voting.
- Abstract(参考訳): エレクトロニック・ヘルス・レコード(Electronic Health Records, EHRs)は、患者情報のデジタル記録であり、しばしば構造化されていない臨床テキストを含む。
名前付きエンティティ認識(NER)は、下流の臨床応用を支援するために、問題、検査、治療などの重要な医療機関を抽出するために、EHRに必須である。
本稿では,大規模言語モデル(LLM),特にGPT-4oとDeepSeek-R1を用いて,ゼロショット,少数ショット,アンサンブルアプローチなど,様々なプロンプトエンジニアリング技術によって誘導されるプロンプトベースの医療エンティティ認識について検討する。
あらゆる戦略の中で、即発アンサンブルのGPT-4oはF1スコア0.95、リコール0.98で最高評価を達成し、DeepSeek-R1を上回った。
アンサンブル法は、埋め込みベースの類似性と多数決によって出力を集約することで信頼性を向上させた。
関連論文リスト
- Ontology-based Semantic Similarity Measures for Clustering Medical Concepts in Drug Safety [0.0]
6つの意味的類似度尺度 (SSMs) を薬物安全性データに分類し, MedDRA 優先用語 (PTs) のクラスタリングについて検討した。
特にINTRINSIC-LINとSokaLでは,クラスタリングの精度が向上した。
本研究は,早期信号検出の改善と手動による評価の低減により,ICベースのSSMの薬剤移動性向上に寄与することが示唆された。
論文 参考訳(メタデータ) (2025-03-26T17:19:00Z) - Revisiting Medical Image Retrieval via Knowledge Consolidation [46.6989555659494]
本稿では,階層的特徴と機能に関する知識を集約する新しい手法を提案する。
本稿では,Depth-aware Representation Fusion (DaRF)とStructure-aware Contrastive Hashing (SCH)を紹介する。
解剖学的放射線学データセットの平均精度は5.6~38.9%向上した。
論文 参考訳(メタデータ) (2025-03-12T13:16:42Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - High-precision medical speech recognition through synthetic data and semantic correction: UNITED-MEDASR [1.3810901729134184]
合成データ生成,高精度ASR微調整,セマンティックエンハンスメント技術を統合することで,課題に対処する新しいアーキテクチャであるUnited-MedASRを紹介する。
United-MedASRは、ICD-10、MIMS、FDAデータベースなどの権威ソースからデータを合成することによって、専門化された医療用語を構築する。
処理速度を向上させるために、高速なWhisperを導入し、合理化および高速ASR性能を確保する。
論文 参考訳(メタデータ) (2024-11-24T17:02:48Z) - LLMs in Biomedicine: A study on clinical Named Entity Recognition [42.71263594812782]
大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な汎用性を示す。
本稿では,NERタスクの性能向上戦略について検討する。
提案手法であるDiRAGは,バイオメディカルNERにおけるLDMのゼロショットF1スコアを高めることができる。
論文 参考訳(メタデータ) (2024-04-10T22:26:26Z) - Multimodal Pretraining of Medical Time Series and Notes [45.89025874396911]
ディープラーニングモデルは、意味のあるパターンを抽出する際の約束を示すが、広範囲なラベル付きデータが必要である。
本稿では,臨床測定値とノートのアライメントに着目し,自己指導型事前学習を用いた新しいアプローチを提案する。
病院内での死亡予測や表現型化などの下流タスクでは、データのごく一部がラベル付けされた設定において、ベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T21:53:40Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - A Marker-based Neural Network System for Extracting Social Determinants
of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。
多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。
我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文 参考訳(メタデータ) (2022-12-24T18:40:23Z) - Collaborative residual learners for automatic icd10 prediction using
prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。
平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文 参考訳(メタデータ) (2020-12-16T07:07:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。