論文の概要: Zebra-Llama: A Context-Aware Large Language Model for Democratizing Rare Disease Knowledge
- arxiv url: http://arxiv.org/abs/2411.02657v1
- Date: Mon, 04 Nov 2024 22:45:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-06 15:00:16.622826
- Title: Zebra-Llama: A Context-Aware Large Language Model for Democratizing Rare Disease Knowledge
- Title(参考訳): Zebra-Llama:希少疾患の知識を民主化するためのコンテキスト対応大規模言語モデル
- Authors: Karthik Soman, Andrew Langdon, Catalina Villouta, Chinmay Agrawal, Lashaw Salta, Braian Peetoom, Gianmarco Bellucci, Orion J Buske,
- Abstract要約: ゼブラ・ラマ(Zebra-Llama)は、高精度な検索型拡張生成(RAG)機能を備えた文脈認識言語モデルである。
Ehlers-Danlos症候群 (EDS) を症例として, 5,000人中1人に影響を及ぼすEDSは, 稀な疾患の複雑さを実証する。
Zebra-Llamaは、EDS関連のクエリを扱う上で、前例のない機能を示している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Rare diseases present unique challenges in healthcare, often suffering from delayed diagnosis and fragmented information landscapes. The scarcity of reliable knowledge in these conditions poses a distinct challenge for Large Language Models (LLMs) in supporting clinical management and delivering precise patient information underscoring the need for focused training on these 'zebra' cases. We present Zebra-Llama, a specialized context-aware language model with high precision Retrieval Augmented Generation (RAG) capability, focusing on Ehlers-Danlos Syndrome (EDS) as our case study. EDS, affecting 1 in 5,000 individuals, exemplifies the complexities of rare diseases with its diverse symptoms, multiple subtypes, and evolving diagnostic criteria. By implementing a novel context-aware fine-tuning methodology trained on questions derived from medical literature, patient experiences, and clinical resources, along with expertly curated responses, Zebra-Llama demonstrates unprecedented capabilities in handling EDS-related queries. On a test set of real-world questions collected from EDS patients and clinicians, medical experts evaluated the responses generated by both models, revealing Zebra-Llama's substantial improvements over base model (Llama 3.1-8B-Instruct) in thoroughness (77.5% vs. 70.1%), accuracy (83.0% vs. 78.8%), clarity (74.7% vs. 72.0%) and citation reliability (70.6% vs. 52.3%). Released as an open-source resource, Zebra-Llama not only provides more accessible and reliable EDS information but also establishes a framework for developing specialized AI solutions for other rare conditions. This work represents a crucial step towards democratizing expert-level knowledge in rare disease management, potentially transforming how healthcare providers and patients navigate the complex landscape of rare diseases.
- Abstract(参考訳): 希少な疾患は、診断の遅れや情報風景の断片化に苦しむ医療に特有の課題を呈する。
これらの状況における信頼性の高い知識の不足は、臨床管理を支援し、これらの「ゼブラ」ケースに焦点を絞ったトレーニングの必要性を裏付ける正確な患者情報を提供することにおいて、LLM(Large Language Models)にとって大きな課題となっている。
症例スタディとしてEhlers-Danlos症候群(EDS)に着目し,高精度検索能力(RAG)を有する特殊な文脈認識言語モデルであるZebra-Llamaを提案する。
EDSは5000人中1人に影響を及ぼし、多様な症状、複数のサブタイプ、進化する診断基準で希少疾患の複雑さを実証している。
医学文献、患者経験、臨床資源から得られた質問に基づいて訓練された新しい文脈対応の微調整手法を実装することにより、ゼブラ・ラマはEDS関連クエリを扱う前例のない能力を示した。
EDS患者と臨床医から収集された実世界の質問のセットで、医療専門家は両モデルの反応を評価し、ゼブラ・ラマのベースモデル(Llama 3.1-8B-Instruct)の徹底性(77.5% vs. 70.1%)、精度(83.0% vs. 78.8%)、明瞭さ(74.7% vs. 72.0%)、引用信頼性(70.6% vs. 52.3%)を大幅に改善した。
オープンソースリソースとしてリリースされたZebra-Llamaは、よりアクセシブルで信頼性の高いEDS情報を提供するだけでなく、他のまれな条件に対する専門的なAIソリューションを開発するためのフレームワークも確立している。
この研究は、稀な疾患管理における専門家レベルの知識を民主化するための重要なステップであり、医療提供者や患者が稀な疾患の複雑な風景をいかにナビゲートするかを変える可能性がある。
関連論文リスト
- Detecting Bias and Enhancing Diagnostic Accuracy in Large Language Models for Healthcare [0.2302001830524133]
バイアスドAIによる医療アドバイスと誤診は患者の安全を脅かす可能性がある。
本研究では、医療における倫理的かつ正確なAIを促進するために設計された新しいリソースを紹介する。
論文 参考訳(メタデータ) (2024-10-09T06:00:05Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - A Concept-based Interpretable Model for the Diagnosis of Choroid
Neoplasias using Multimodal Data [28.632437578685842]
我々は成人で最も多い眼がんである脈絡膜新生症(5.1%)に焦点を当てた。
本研究は,3種類の脈絡膜腫瘍を識別する概念に基づく解釈可能なモデルを提案する。
注目すべきは、このモデルがブラックボックスモデルに匹敵するF1スコアの0.91を達成する一方で、ジュニア医師の診断精度を42%向上させることである。
論文 参考訳(メタデータ) (2024-03-08T07:15:53Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - NeuraHealthNLP: An Automated Screening Pipeline to Detect Undiagnosed
Cognitive Impairment in Electronic Health Records with Deep Learning and
Natural Language Processing [0.0]
認知症の症例の75%は世界中で診断されず、低所得国と中所得国で90%に達する。
現在の診断方法は非常に複雑で、医療ノートのマニュアルレビュー、多くの認知検査、高価な脳スキャン、脊髄液検査などが含まれる。
このプロジェクトでは、HRの未検出認知症をスケーラブルかつ高速に発見するための、最先端の自動スクリーニングパイプラインを開発する。
論文 参考訳(メタデータ) (2022-01-12T06:19:14Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Towards Causality-Aware Inferring: A Sequential Discriminative Approach
for Medical Diagnosis [142.90770786804507]
医学診断アシスタント(MDA)は、疾患を識別するための症状を逐次調査する対話型診断エージェントを構築することを目的としている。
この研究は、因果図を利用して、MDAにおけるこれらの重要な問題に対処しようとする。
本稿では,他の記録から知識を引き出すことにより,非記録的調査に効果的に答える確率に基づく患者シミュレータを提案する。
論文 参考訳(メタデータ) (2020-03-14T02:05:54Z) - Heterogeneity Loss to Handle Intersubject and Intrasubject Variability
in Cancer [11.440201348567681]
深層学習(DL)モデルは、医学領域において顕著な結果を示している。
これらのAI手法は、開発途上国に安価な医療ソリューションとして大きな支援を提供することができる。
この研究は、そのような血液がん診断の応用に焦点をあてている。
論文 参考訳(メタデータ) (2020-03-06T16:16:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。