論文の概要: Integrating Chain-of-Thought and Retrieval Augmented Generation Enhances Rare Disease Diagnosis from Clinical Notes
- arxiv url: http://arxiv.org/abs/2503.12286v1
- Date: Sat, 15 Mar 2025 22:57:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:34:50.628040
- Title: Integrating Chain-of-Thought and Retrieval Augmented Generation Enhances Rare Disease Diagnosis from Clinical Notes
- Title(参考訳): 診断基準と検索基準の整合化 : 臨床ノートからの検討
- Authors: Da Wu, Zhanliang Wang, Quan Nguyen, Kai Wang,
- Abstract要約: 本稿では,RAG(Chain-of-Thought)とRAG(Retrieval Augmented Generation)を組み合わせたRAG(Retrieval Augmented Generation)の2つの方法を紹介する。
フィラデルフィア小児病院の5,980件のPhenopacket由来のノート,255件の文献ベースの物語,220件の内科的臨床ノートなど,まれな疾患データセットに対するこれらのアプローチを評価した。
- 参考スコア(独自算出の注目度): 7.772766729052347
- License:
- Abstract: Background: Several studies show that large language models (LLMs) struggle with phenotype-driven gene prioritization for rare diseases. These studies typically use Human Phenotype Ontology (HPO) terms to prompt foundation models like GPT and LLaMA to predict candidate genes. However, in real-world settings, foundation models are not optimized for domain-specific tasks like clinical diagnosis, yet inputs are unstructured clinical notes rather than standardized terms. How LLMs can be instructed to predict candidate genes or disease diagnosis from unstructured clinical notes remains a major challenge. Methods: We introduce RAG-driven CoT and CoT-driven RAG, two methods that combine Chain-of-Thought (CoT) and Retrieval Augmented Generation (RAG) to analyze clinical notes. A five-question CoT protocol mimics expert reasoning, while RAG retrieves data from sources like HPO and OMIM (Online Mendelian Inheritance in Man). We evaluated these approaches on rare disease datasets, including 5,980 Phenopacket-derived notes, 255 literature-based narratives, and 220 in-house clinical notes from Childrens Hospital of Philadelphia. Results: We found that recent foundations models, including Llama 3.3-70B-Instruct and DeepSeek-R1-Distill-Llama-70B, outperformed earlier versions such as Llama 2 and GPT-3.5. We also showed that RAG-driven CoT and CoT-driven RAG both outperform foundation models in candidate gene prioritization from clinical notes; in particular, both methods with DeepSeek backbone resulted in a top-10 gene accuracy of over 40% on Phenopacket-derived clinical notes. RAG-driven CoT works better for high-quality notes, where early retrieval can anchor the subsequent reasoning steps in domain-specific evidence, while CoT-driven RAG has advantage when processing lengthy and noisy notes.
- Abstract(参考訳): 背景: いくつかの研究は、大型言語モデル(LLM)が稀な疾患に対する表現型による遺伝子優先順位付けに苦慮していることを示している。
これらの研究は通常、ヒト現象型オントロジー(Human Phenotype Ontology、HPO)という用語を使用して、GPTやLLaMAのような基礎モデルに候補遺伝子を予測させる。
しかし、現実の環境では、基礎モデルは臨床診断のようなドメイン固有のタスクに最適化されていないが、入力は標準化された用語ではなく、構造化されていない臨床ノートである。
LLMは、非構造的な臨床ノートから候補遺伝子や疾患の診断を予測できるように指示されるかは、依然として大きな課題である。
方法: RAG-driven CoT と CoT-driven RAG を導入し, チェイン・オブ・ソート (CoT) とレトリーバル・オーグメンテッド・ジェネレーション (RAG) を組み合わせた臨床ノートの分析を行った。
RAGはHPOやOMIM(Online Mendelian Inheritance in Man)などのソースからデータを取得する。
フィラデルフィア小児病院の5,980件のPhenopacket由来のノート,255件の文献ベースの物語,220件の内科的臨床ノートなど,まれな疾患データセットに対するこれらのアプローチを評価した。
結果: Llama 3.3-70B-Instruct や DeepSeek-R1-Distill-Llama-70B を含む最近の基礎モデルは,Llama 2 や GPT-3.5 など以前のバージョンよりも優れていた。
また, RAG-driven CoT と CoT-driven RAG は, 臨床ノートから候補遺伝子の優先順位付けにおける基礎モデルよりも優れており, 特にDeepSeek のバックボーンを用いた場合, Phenopacket 由来の臨床ノートでは, 上位10遺伝子精度が40%以上であった。
RAG駆動のCoTは高品質な音符に向いており、早期検索はドメイン固有の証拠にその後の推論ステップを固定することができる。
関連論文リスト
- Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文 参考訳(メタデータ) (2024-10-16T23:03:27Z) - MLC-GCN: Multi-Level Generated Connectome Based GCN for AD Analysis [14.541273450756128]
アルツハイマー病(英: Alzheimers Disease、AD)は、現在発症可能な神経変性疾患である。
アルツハイマー病(英語: Alzheimer's Disease、AD)は、現在発症可能な神経変性疾患である。
論文 参考訳(メタデータ) (2024-08-06T14:18:36Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping [1.8630636381951384]
大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
検索拡張生成とMapReduceにより強化されたゼロショットLLM法を提案する。
肺動脈圧の上昇を特徴とする稀な疾患である肺高血圧症(PH)に対して本法を適用した。
論文 参考訳(メタデータ) (2023-12-11T15:45:27Z) - Histopathologic Cancer Detection [0.0]
この作業では、PatchCamelyonベンチマークデータセットを使用して、モデルをマルチレイヤのパーセプトロンと畳み込みモデルでトレーニングし、精度の高いリコール、F1スコア、精度、AUCスコアでモデルのパフォーマンスを観察する。
また,データ拡張を伴うResNet50とInceptionNetモデルを導入し,ResNet50が最先端モデルに勝てることを示す。
論文 参考訳(メタデータ) (2023-11-13T19:51:46Z) - An evaluation of GPT models for phenotype concept recognition [0.4715973318447338]
臨床表現型および表現型アノテーションのためのGPT(Generative Pre-trained Transformer)モデルの性能について検討した。
その結果、適切な設定で、これらのモデルが芸術的パフォーマンスの状態を達成できることが示されている。
論文 参考訳(メタデータ) (2023-09-29T12:06:55Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。