論文の概要: Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping
- arxiv url: http://arxiv.org/abs/2312.06457v1
- Date: Mon, 11 Dec 2023 15:45:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 15:07:17.761291
- Title: Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping
- Title(参考訳): ゼロショット病の表現型付けのための検索型大言語モデル
- Authors: Will E. Thompson, David M. Vidmar, Jessica K. De Freitas, John M.
Pfeifer, Brandon K. Fornwalt, Ruijun Chen, Gabriel Altay, Kabir Manghnani,
Andrew C. Nelsen, Kellie Morland, Martin C. Stumpe, Riccardo Miotto
- Abstract要約: 大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
検索拡張生成とMapReduceにより強化されたゼロショットLLM法を提案する。
肺動脈圧の上昇を特徴とする稀な疾患である肺高血圧症(PH)に対して本法を適用した。
- 参考スコア(独自算出の注目度): 1.8630636381951384
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Identifying disease phenotypes from electronic health records (EHRs) is
critical for numerous secondary uses. Manually encoding physician knowledge
into rules is particularly challenging for rare diseases due to inadequate EHR
coding, necessitating review of clinical notes. Large language models (LLMs)
offer promise in text understanding but may not efficiently handle real-world
clinical documentation. We propose a zero-shot LLM-based method enriched by
retrieval-augmented generation and MapReduce, which pre-identifies
disease-related text snippets to be used in parallel as queries for the LLM to
establish diagnosis. We show that this method as applied to pulmonary
hypertension (PH), a rare disease characterized by elevated arterial pressures
in the lungs, significantly outperforms physician logic rules ($F_1$ score of
0.62 vs. 0.75). This method has the potential to enhance rare disease cohort
identification, expanding the scope of robust clinical research and care gap
identification.
- Abstract(参考訳): 電子健康記録(EHR)から疾患の表現型を同定することは、多くの二次的用途において重要である。
医師の知識をルールに手動で符号化することは、EHRのコーディングが不十分なため、まれな疾患に対して特に難しい。
大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
そこで本研究では,病気関連テキストスニペットを事前識別し,llmの検索クエリと並行して診断を行う,検索型生成とmapreduceに富むゼロショットllmベースの手法を提案する。
肺の動脈圧上昇を特徴とする稀な疾患である肺高血圧症(PH)に対する本法の適用は,医師の論理則(F_1$ score of 0.62 vs. 0.75)を著しく上回っている。
この方法は、稀な疾患のコホート同定を強化し、堅牢な臨床研究とケアギャップ同定の範囲を広げる可能性がある。
関連論文リスト
- Towards Reducing Diagnostic Errors with Interpretable Risk Prediction [19.364785715150038]
特定診断のリスクの増大または低下を示す患者EHRデータ中の証拠片をLCMを用いて同定する方法を提案する。
私たちの究極の目標は、証拠へのアクセスを増やし、診断エラーを減らすことです。
論文 参考訳(メタデータ) (2024-02-15T17:05:48Z) - Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - Expert Uncertainty and Severity Aware Chest X-Ray Classification by
Multi-Relationship Graph Learning [48.29204631769816]
我々はCXRレポートから病気ラベルを再抽出し,重症度と分類の不確実性を考慮し,より現実的になるようにした。
以上の結果から, 疾患の重症度と不確実性を考慮したモデルが, 従来の最先端手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-09-06T19:19:41Z) - Leveraging A Medical Knowledge Graph into Large Language Models for
Diagnosis Prediction [7.5569033426158585]
自動診断におけるLarge Language Models (LLMs) の習熟度を高めるための革新的なアプローチを提案する。
我々は,国立医科大学統一医療言語システム(UMLS)からKGを抽出した。
我々のアプローチは説明可能な診断経路を提供し、AIによる診断決定支援システムの実現に近づいている。
論文 参考訳(メタデータ) (2023-08-28T06:05:18Z) - Large Language Models for Granularized Barrett's Esophagus Diagnosis
Classification [4.144525746262123]
病理報告から重要な診断表現型を抽出するためには, 精巧なマニュアルチャートのレビューが必要である。
我々は、データ抽出を自動化する一般化可能な変換器ベースの手法を開発した。
バイナリジスプラシア抽出は0.964F1スコア、マルチクラスモデルは0.911F1スコアを達成する。
論文 参考訳(メタデータ) (2023-08-16T20:17:46Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Phenotype Detection in Real World Data via Online MixEHR Algorithm [9.385112439570412]
教師なし表現型アルゴリズムmixEHRをオンラインバージョンに拡張し、桁違いの大きなデータセットで使用できるようにしました。
これまでに観察された疾患群の再カプセル化に加えて,臨床的に有意な疾患のサブタイプとコンコービデンスも見いだした。
本研究は, 効果的な教師なし学習方法, 既存の臨床知識の強化, 臨床医との効果的なコラボレーションのための有望なアプローチである。
論文 参考訳(メタデータ) (2022-11-14T17:14:39Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。