論文の概要: Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping
- arxiv url: http://arxiv.org/abs/2312.06457v1
- Date: Mon, 11 Dec 2023 15:45:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 15:07:17.761291
- Title: Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping
- Title(参考訳): ゼロショット病の表現型付けのための検索型大言語モデル
- Authors: Will E. Thompson, David M. Vidmar, Jessica K. De Freitas, John M.
Pfeifer, Brandon K. Fornwalt, Ruijun Chen, Gabriel Altay, Kabir Manghnani,
Andrew C. Nelsen, Kellie Morland, Martin C. Stumpe, Riccardo Miotto
- Abstract要約: 大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
検索拡張生成とMapReduceにより強化されたゼロショットLLM法を提案する。
肺動脈圧の上昇を特徴とする稀な疾患である肺高血圧症(PH)に対して本法を適用した。
- 参考スコア(独自算出の注目度): 1.8630636381951384
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Identifying disease phenotypes from electronic health records (EHRs) is
critical for numerous secondary uses. Manually encoding physician knowledge
into rules is particularly challenging for rare diseases due to inadequate EHR
coding, necessitating review of clinical notes. Large language models (LLMs)
offer promise in text understanding but may not efficiently handle real-world
clinical documentation. We propose a zero-shot LLM-based method enriched by
retrieval-augmented generation and MapReduce, which pre-identifies
disease-related text snippets to be used in parallel as queries for the LLM to
establish diagnosis. We show that this method as applied to pulmonary
hypertension (PH), a rare disease characterized by elevated arterial pressures
in the lungs, significantly outperforms physician logic rules ($F_1$ score of
0.62 vs. 0.75). This method has the potential to enhance rare disease cohort
identification, expanding the scope of robust clinical research and care gap
identification.
- Abstract(参考訳): 電子健康記録(EHR)から疾患の表現型を同定することは、多くの二次的用途において重要である。
医師の知識をルールに手動で符号化することは、EHRのコーディングが不十分なため、まれな疾患に対して特に難しい。
大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
そこで本研究では,病気関連テキストスニペットを事前識別し,llmの検索クエリと並行して診断を行う,検索型生成とmapreduceに富むゼロショットllmベースの手法を提案する。
肺の動脈圧上昇を特徴とする稀な疾患である肺高血圧症(PH)に対する本法の適用は,医師の論理則(F_1$ score of 0.62 vs. 0.75)を著しく上回っている。
この方法は、稀な疾患のコホート同定を強化し、堅牢な臨床研究とケアギャップ同定の範囲を広げる可能性がある。
関連論文リスト
- Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - Leveraging Large Language Models to Extract Information on Substance Use Disorder Severity from Clinical Notes: A Zero-shot Learning Approach [3.0962132663521227]
物質利用障害 (SUD) は、健康や社会に有害な影響があるとして大きな懸念を抱いている。
国際疾患分類(ICD-10)のような既存の診断符号化システムは、特定の診断のための粒度を欠いている。
従来の自然言語処理(NLP)手法は、このような多様な臨床言語を正確に解析する際の限界に直面している。
本研究では,臨床ノートから重症度関連情報を抽出するためのLarge Language Models (LLMs) の応用について検討した。
論文 参考訳(メタデータ) (2024-03-18T22:39:03Z) - Expert Uncertainty and Severity Aware Chest X-Ray Classification by
Multi-Relationship Graph Learning [48.29204631769816]
我々はCXRレポートから病気ラベルを再抽出し,重症度と分類の不確実性を考慮し,より現実的になるようにした。
以上の結果から, 疾患の重症度と不確実性を考慮したモデルが, 従来の最先端手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-09-06T19:19:41Z) - Leveraging A Medical Knowledge Graph into Large Language Models for
Diagnosis Prediction [7.5569033426158585]
自動診断におけるLarge Language Models (LLMs) の習熟度を高めるための革新的なアプローチを提案する。
我々は,国立医科大学統一医療言語システム(UMLS)からKGを抽出した。
我々のアプローチは説明可能な診断経路を提供し、AIによる診断決定支援システムの実現に近づいている。
論文 参考訳(メタデータ) (2023-08-28T06:05:18Z) - Large Language Models for Granularized Barrett's Esophagus Diagnosis
Classification [4.144525746262123]
病理報告から重要な診断表現型を抽出するためには, 精巧なマニュアルチャートのレビューが必要である。
我々は、データ抽出を自動化する一般化可能な変換器ベースの手法を開発した。
バイナリジスプラシア抽出は0.964F1スコア、マルチクラスモデルは0.911F1スコアを達成する。
論文 参考訳(メタデータ) (2023-08-16T20:17:46Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。