論文の概要: On Using Large Language Models to Enhance Clinically-Driven Missing Data Recovery Algorithms in Electronic Health Records
- arxiv url: http://arxiv.org/abs/2510.03844v1
- Date: Sat, 04 Oct 2025 15:45:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.293573
- Title: On Using Large Language Models to Enhance Clinically-Driven Missing Data Recovery Algorithms in Electronic Health Records
- Title(参考訳): 電子カルテにおける大規模言語モデルによる臨床駆動型欠失データ回復アルゴリズムの強化について
- Authors: Sarah C. Lotspeich, Abbey Collins, Brian J. Wells, Ashish K. Khanna, Joseph Rigdon, Lucy D'Agostino McGowan,
- Abstract要約: 本稿では、ロードマップ駆動型アルゴリズムの精度とスケーラビリティについて検討し、専門家のチャートレビューを模倣し、欠落した値を復元する。
アルゴリズムは、ロードマップに応じて、専門家のチャートレビュアーと同じくらいの量のデータを失ったことを回復した。
- 参考スコア(独自算出の注目度): 0.24155886449801822
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Electronic health records (EHR) data are prone to missingness and errors. Previously, we devised an "enriched" chart review protocol where a "roadmap" of auxiliary diagnoses (anchors) was used to recover missing values in EHR data (e.g., a diagnosis of impaired glycemic control might imply that a missing hemoglobin A1c value would be considered unhealthy). Still, chart reviews are expensive and time-intensive, which limits the number of patients whose data can be reviewed. Now, we investigate the accuracy and scalability of a roadmap-driven algorithm, based on ICD-10 codes (International Classification of Diseases, 10th revision), to mimic expert chart reviews and recover missing values. Materials and Methods: In addition to the clinicians' original roadmap from our previous work, we consider new versions that were iteratively refined using large language models (LLM) in conjunction with clinical expertise to expand the list of auxiliary diagnoses. Using chart reviews for 100 patients from the EHR at an extensive learning health system, we examine algorithm performance with different roadmaps. Using the larger study of $1000$ patients, we applied the final algorithm, which used a roadmap with clinician-approved additions from the LLM. Results: The algorithm recovered as much, if not more, missing data as the expert chart reviewers, depending on the roadmap. Discussion: Clinically-driven algorithms (enhanced by LLM) can recover missing EHR data with similar accuracy to chart reviews and can feasibly be applied to large samples. Extending them to monitor other dimensions of data quality (e.g., plausability) is a promising future direction.
- Abstract(参考訳): 目的:電子健康記録(EHR)データは、欠落やエラーを起こしやすい。
従来我々は,ERHデータの欠失を回復するために補助診断(アンカー)の「ロードマップ」を用いた「リッチ」チャートレビュープロトコルを考案した(例えば,血糖コントロール障害の診断は,欠失ヘモグロビンA1c値が不健康であることを意味する)。
それでも、チャートレビューは高価で時間集約的であり、データをレビューできる患者の数を制限する。
そこで本研究では,ICD-10コードに基づくロードマップ駆動型アルゴリズムの精度とスケーラビリティについて検討し,専門的なチャートレビューを模倣し,欠落した値を復元する。
材料と方法: 臨床医の当初のロードマップに加え, 臨床専門知識と合わせて, 大規模言語モデル(LLM)を用いて反復的に改良した新版について検討した。
広範に学習する健康システムにおいて,ERHから100名の患者を対象としたチャートレビューを用いて,異なるロードマップを用いたアルゴリズム性能について検討した。
約1000ドルの患者を対象に最終アルゴリズムを適用し,LLMによる臨床応用のロードマップを作成した。
結果: アルゴリズムは、ロードマップに応じて、専門家のチャートレビュアーと同じくらいの量のデータを失っていた。
考察:臨床駆動型アルゴリズム(LLMによって強化された)は、チャートレビューと同様の精度で行方不明のERHデータを復元し、大規模なサンプルに適用することが可能である。
データ品質の他の次元(例えば可視性)を監視できるように拡張することは、将来有望な方向です。
関連論文リスト
- Improving ARDS Diagnosis Through Context-Aware Concept Bottleneck Models [2.3802351706765017]
病気を理解するための新しいリソースとして、大規模で一般公開された臨床データセットが登場した。
これらのデータセットは、もともと研究目的で収集されていないデータから派生しており、その結果、しばしば不完全であり、重要なラベルが欠落している。
多くのAIツールは、疾患分類を実行するなど、これらのデータセットを振り返ってラベル付けするために開発されている。
従来の研究は、高レベルな臨床概念にマッピングする解釈可能な概念を学ぶConcept Bottleneck Models (CBMs)を用いて、予測を説明しようと試みてきた。
我々は,急性呼吸障害症候群(ARDS)の診断を,臨床ノートからコンテキスト情報を取り入れて改善することの価値を実証するために,挑戦的なテストケースとして用いている。
論文 参考訳(メタデータ) (2025-08-13T11:19:30Z) - HealthGAT: Node Classifications in Electronic Health Records using Graph Attention Networks [2.2026317523029193]
HealthGATは、EHRから埋め込みを生成するグラフアテンションネットワークフレームワークである。
本モデルでは,医療コードへの埋め込みを反復的に洗練し,EHRデータ解析の改善を実現している。
本モデルでは,ノード分類や,可読度予測や診断分類などの下流タスクにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-26T22:17:01Z) - DDxT: Deep Generative Transformer Models for Differential Diagnosis [51.25660111437394]
より単純な教師付き学習信号と自己教師付き学習信号で訓練した生成的アプローチが,現在のベンチマークにおいて優れた結果が得られることを示す。
The proposed Transformer-based generative network, named DDxT, autoregressive produce a set of possible pathology,, i. DDx, and predicts the real pathology using a neural network。
論文 参考訳(メタデータ) (2023-12-02T22:57:25Z) - Temporal-spatial Correlation Attention Network for Clinical Data
Analysis in Intensive Care Unit [27.885961694582896]
本稿では,臨床特性予測問題に対処するための時間・適応相関注意ネットワーク(TSCAN)を提案する。
本手法は,アテンションメカニズムモデルの設計に基づいて,臨床データおよび無関係ノードにおける無関係項目を効果的に除去することができる。
また,治療方法の改善に有効な重要な結果を示す重要な臨床指標も見出すことができる。
論文 参考訳(メタデータ) (2023-06-03T00:38:40Z) - MedLens: Improve Mortality Prediction Via Medical Signs Selecting and
Regression [4.43322868663347]
データ品質の問題については文献では議論されていない。
我々はMEDLENSを設計し、統計による自動バイタルメディカルサイン選択手法と、高損失率時系列に対する柔軟なアプローチを用いて設計した。
精度は 0.96 AUC-ROC と 0.81 AUC-PR で、これは以前のベンチマークを超えている。
論文 参考訳(メタデータ) (2023-05-19T15:28:02Z) - Rapid Adaptation in Online Continual Learning: Are We Evaluating It
Right? [135.71855998537347]
オンライン連続学習(OCL)アルゴリズムの適応性を評価するための一般的な手法を,オンライン精度の指標を用いて再検討する。
空白のブラインド分類器でさえ、非現実的に高いオンライン精度を達成できるため、この指標は信頼できない。
既存のOCLアルゴリズムは、オンラインの精度も高いが、有用な情報の保持は不十分である。
論文 参考訳(メタデータ) (2023-05-16T08:29:33Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Simultaneous imputation and disease classification in incomplete medical
datasets using Multigraph Geometric Matrix Completion (MGMC) [37.160335232396406]
我々は,Multigraph Geometric Matrix Completionを用いて,不完全な医療データセットのインプットと疾患予測のエンドツーエンド学習を提案する。
我々は,最先端の手法と比較して,分類と計算性能の観点から,提案手法の優位性を実証的に示す。
論文 参考訳(メタデータ) (2020-05-14T13:11:35Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。