Fugu-MT 論文翻訳(概要): LLM-based Prompt Ensemble for Reliable Medical Entity Recognition from EHRs

論文の概要: LLM-based Prompt Ensemble for Reliable Medical Entity Recognition from EHRs

arxiv url: http://arxiv.org/abs/2505.08704v1
Date: Tue, 13 May 2025 16:11:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-14 20:57:54.662945
Title: LLM-based Prompt Ensemble for Reliable Medical Entity Recognition from EHRs
Title（参考訳）: EHRからの信頼性のある医療エンティティ認識のためのLLMベースのプロンプトアンサンブル
Authors: K M Sajjadul Islam, Ayesha Siddika Nipu, Jiawei Wu, Praveen Madiraju,
Abstract要約: 本稿では,大規模言語モデル(LLM)を用いた即時医療機関認識について検討する。即発アンサンブルのGPT-4oはF1スコア0.95、リコール0.98で最高評価を達成した。アンサンブル法は、埋め込みベースの類似性と多数決によって出力を集約することで信頼性を向上させた。
参考スコア（独自算出の注目度）: 4.262074310505135
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Electronic Health Records (EHRs) are digital records of patient information, often containing unstructured clinical text. Named Entity Recognition (NER) is essential in EHRs for extracting key medical entities like problems, tests, and treatments to support downstream clinical applications. This paper explores prompt-based medical entity recognition using large language models (LLMs), specifically GPT-4o and DeepSeek-R1, guided by various prompt engineering techniques, including zero-shot, few-shot, and an ensemble approach. Among all strategies, GPT-4o with prompt ensemble achieved the highest classification performance with an F1-score of 0.95 and recall of 0.98, outperforming DeepSeek-R1 on the task. The ensemble method improved reliability by aggregating outputs through embedding-based similarity and majority voting.
Abstract（参考訳）: エレクトロニック・ヘルス・レコード(Electronic Health Records, EHRs)は、患者情報のデジタル記録であり、しばしば構造化されていない臨床テキストを含む。名前付きエンティティ認識(NER)は、下流の臨床応用を支援するために、問題、検査、治療などの重要な医療機関を抽出するために、EHRに必須である。本稿では,大規模言語モデル(LLM),特にGPT-4oとDeepSeek-R1を用いて,ゼロショット,少数ショット,アンサンブルアプローチなど,様々なプロンプトエンジニアリング技術によって誘導されるプロンプトベースの医療エンティティ認識について検討する。あらゆる戦略の中で、即発アンサンブルのGPT-4oはF1スコア0.95、リコール0.98で最高評価を達成し、DeepSeek-R1を上回った。アンサンブル法は、埋め込みベースの類似性と多数決によって出力を集約することで信頼性を向上させた。

関連論文リスト

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T18:48:21Z)
MaLei at MultiClinSUM: Summarisation of Clinical Documents using Perspective-Aware Iterative Self-Prompting with LLMs [5.40185721303932]
本稿では,MultiClinSUM共有タスクにおける臨床事例文書の要約手法について述べる。我々はLLMにタスク固有のプロンプトを生成するよう依頼することで,大規模言語モデル(LLM)に反復的自己プロンプト手法を適用した。語彙と埋め込み空間のメトリクスであるROUGEとBERTスコアを用いて、エポックによるモデル微調整をガイドした。
論文参考訳（メタデータ） (2025-09-09T11:52:16Z)
A Narrative-Driven Computational Framework for Clinician Burnout Surveillance [0.5281694565226512]
臨床医のバーンアウトは、特にICU(High-acuity intensive care Unit)において、患者の安全に重大な脅威をもたらす本研究では,Beth Israel Deaconess Medical Centerの電子健康記録から得られたMIMIC-IVから,1万 ICU放電サマリーを解析した。このデータセットは、バイタルサイン、医療命令、診断、処置、治療、特定自由テキスト臨床ノートを含む多様な患者データを含んでいる。
論文参考訳（メタデータ） (2025-09-01T19:05:26Z)
ICU-TSB: A Benchmark for Temporal Patient Representation Learning for Unsupervised Stratification into Patient Cohorts [0.055923945039144905]
ICU-TSB (Temporal Stratification Benchmark) を導入した。本ベンチマークは, 臨床的に検証された疾患群とクラスターのアライメントを測定するために, 疾患を利用した新しい階層的評価フレームワークである。その結果,時間的表現学習が臨床的に意味のある患者コホートを再発見できることが示唆された。
論文参考訳（メタデータ） (2025-06-06T15:52:50Z)
Ontology-based Semantic Similarity Measures for Clustering Medical Concepts in Drug Safety [0.0]
6つの意味的類似度尺度 (SSMs) を薬物安全性データに分類し, MedDRA 優先用語 (PTs) のクラスタリングについて検討した。特にINTRINSIC-LINとSokaLでは,クラスタリングの精度が向上した。本研究は,早期信号検出の改善と手動による評価の低減により,ICベースのSSMの薬剤移動性向上に寄与することが示唆された。
論文参考訳（メタデータ） (2025-03-26T17:19:00Z)
Revisiting Medical Image Retrieval via Knowledge Consolidation [46.6989555659494]
本稿では,階層的特徴と機能に関する知識を集約する新しい手法を提案する。本稿では,Depth-aware Representation Fusion (DaRF)とStructure-aware Contrastive Hashing (SCH)を紹介する。解剖学的放射線学データセットの平均精度は5.6～38.9%向上した。
論文参考訳（メタデータ） (2025-03-12T13:16:42Z)
Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文参考訳（メタデータ） (2025-03-06T18:35:39Z)
High-precision medical speech recognition through synthetic data and semantic correction: UNITED-MEDASR [1.3810901729134184]
合成データ生成,高精度ASR微調整,セマンティックエンハンスメント技術を統合することで,課題に対処する新しいアーキテクチャであるUnited-MedASRを紹介する。 United-MedASRは、ICD-10、MIMS、FDAデータベースなどの権威ソースからデータを合成することによって、専門化された医療用語を構築する。処理速度を向上させるために、高速なWhisperを導入し、合理化および高速ASR性能を確保する。
論文参考訳（メタデータ） (2024-11-24T17:02:48Z)
DIRI: Adversarial Patient Reidentification with Large Language Models for Evaluating Clinical Text Anonymization [13.038800602897354]
本研究は, 大規模言語モデルを用いて患者を同定し, 臨床記録の再検討を行った。本手法は, 臨床診断書に適合する患者を同定するために, 大規模言語モデルを用いている。 ClinicalBERTが最も有効であり, マスキングでPIIが同定できたが, 臨床記録の9%は再同定された。
論文参考訳（メタデータ） (2024-10-22T14:06:31Z)
LLMs in Biomedicine: A study on clinical Named Entity Recognition [42.71263594812782]
大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な汎用性を示す。本稿では,NERタスクの性能向上戦略について検討する。提案手法であるDiRAGは,バイオメディカルNERにおけるLDMのゼロショットF1スコアを高めることができる。
論文参考訳（メタデータ） (2024-04-10T22:26:26Z)
Multimodal Pretraining of Medical Time Series and Notes [45.89025874396911]
ディープラーニングモデルは、意味のあるパターンを抽出する際の約束を示すが、広範囲なラベル付きデータが必要である。本稿では,臨床測定値とノートのアライメントに着目し,自己指導型事前学習を用いた新しいアプローチを提案する。病院内での死亡予測や表現型化などの下流タスクでは、データのごく一部がラベル付けされた設定において、ベースラインよりも優れています。
論文参考訳（メタデータ） (2023-12-11T21:53:40Z)
Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites: A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文参考訳（メタデータ） (2023-08-31T00:36:10Z)
Development and validation of a natural language processing algorithm to pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。臨床文献のコーパスを12種類に分類した。私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文参考訳（メタデータ） (2023-03-23T17:17:46Z)
A Marker-based Neural Network System for Extracting Social Determinants of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文参考訳（メタデータ） (2022-12-24T18:40:23Z)
Collaborative residual learners for automatic icd10 prediction using prescribed medications [45.82374977939355]
本稿では,処方用データのみを用いたicd10符号の自動予測のための協調残差学習モデルを提案する。平均精度0.71および0.57のマルチラベル分類精度、F1スコア0.57および0.38の0.73および0.44の精度を取得し、患者および外来データセットの主診断をそれぞれ予測します。
論文参考訳（メタデータ） (2020-12-16T07:07:27Z)
Generating SOAP Notes from Doctor-Patient Conversations Using Modular Summarization Techniques [43.13248746968624]
私たちは、深い要約モデルを利用してSOAPノートを生成するための最初の完全なパイプラインを紹介します。本稿では,各要約部に関連する重要な発話を抽出するアルゴリズムであるCluster2Sentを提案する。本研究は,要約コーパスを構築する際に,要約をセクションに構造化し,証拠を注釈する利点について述べる。
論文参考訳（メタデータ） (2020-05-04T19:10:26Z)
DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。 DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文参考訳（メタデータ） (2020-01-22T17:51:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。