論文の概要: Automated HIV Screening on Dutch EHR with Large Language Models
- arxiv url: http://arxiv.org/abs/2510.19879v1
- Date: Wed, 22 Oct 2025 11:53:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.435261
- Title: Automated HIV Screening on Dutch EHR with Large Language Models
- Title(参考訳): 大規模言語モデルを用いたオランダ EHR によるHIV の自動スクリーニング
- Authors: Lang Zhou, Amrish Jhingoer, Yinghao Luo, Klaske Vliegenthart--Jongbloed, Carlijn Jordans, Ben Werkhoven, Tom Seinen, Erik van Mulligen, Casper Rokx, Yunlei Li,
- Abstract要約: 本稿では,Large Language Model (LLM) を利用して非構造化のEHRテキストを解析するパイプラインを提案する。
パイプラインは偽陰率を低く保ちながら高い精度を実現した。
- 参考スコア(独自算出の注目度): 1.6594309236462432
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient screening and early diagnosis of HIV are critical for reducing onward transmission. Although large scale laboratory testing is not feasible, the widespread adoption of Electronic Health Records (EHRs) offers new opportunities to address this challenge. Existing research primarily focuses on applying machine learning methods to structured data, such as patient demographics, for improving HIV diagnosis. However, these approaches often overlook unstructured text data such as clinical notes, which potentially contain valuable information relevant to HIV risk. In this study, we propose a novel pipeline that leverages a Large Language Model (LLM) to analyze unstructured EHR text and determine a patient's eligibility for further HIV testing. Experimental results on clinical data from Erasmus University Medical Center Rotterdam demonstrate that our pipeline achieved high accuracy while maintaining a low false negative rate.
- Abstract(参考訳): HIVの効率的なスクリーニングと早期診断は、前向き感染を減らすために重要である。
大規模な実験室試験は実現不可能であるが、Electronic Health Records(EHR)の普及により、この課題に対処する新たな機会が提供される。
既存の研究は、主にHIVの診断を改善するために、患者の人口統計などの構造化データに機械学習手法を適用することに焦点を当てている。
しかし、これらのアプローチは、HIVのリスクに関連する貴重な情報を含む可能性がある臨床ノートのような、構造化されていないテキストデータを見落としていることが多い。
本研究では,Large Language Model (LLM) を用いて非構造化ERHテキストを分析し,さらにHIV検査を行うための患者の適性を決定するパイプラインを提案する。
Erasmus University Medical Center Rotterdamの臨床データによる実験結果から, 偽陰性率を低く保ちながら, パイプラインの精度が向上したことが明らかとなった。
関連論文リスト
- Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Explainable AI for Classifying UTI Risk Groups Using a Real-World Linked EHR and Pathology Lab Dataset [0.47517735516852333]
尿路感染症(UTIs)の特徴付けにリンクEHRデータセットを活用する
臨床専門知識からUTIリスク推定フレームワークを導入し,個別の患者タイムラインにまたがってUTIリスクを推定する。
リスクグループ間で臨床および人口統計学的予測値の違いが判明した。
論文 参考訳(メタデータ) (2024-11-26T18:10:51Z) - Prompting Large Language Models for Zero-Shot Clinical Prediction with
Structured Longitudinal Electronic Health Record Data [7.815738943706123]
大規模言語モデル(LLM)は、伝統的に自然言語処理に向いている。
本研究では, GPT-4 などの LLM の EHR データへの適応性について検討する。
EHRデータの長手性、スパース性、知識を注入した性質に対応するため、本研究は特定の特徴を考慮に入れている。
論文 参考訳(メタデータ) (2024-01-25T20:14:50Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。