論文の概要: Rare Disease Differential Diagnosis with Large Language Models at Scale: From Abdominal Actinomycosis to Wilson's Disease
- arxiv url: http://arxiv.org/abs/2502.15069v1
- Date: Thu, 20 Feb 2025 22:02:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 16:11:15.273337
- Title: Rare Disease Differential Diagnosis with Large Language Models at Scale: From Abdominal Actinomycosis to Wilson's Disease
- Title(参考訳): 大規模言語モデルを用いた希少疾患の鑑別診断 : 腹部放線菌症からウィルソン病まで
- Authors: Elliot Schumacher, Dhruv Naik, Anitha Kannan,
- Abstract要約: 大型言語モデル (LLM) は, 疾患診断において顕著な能力を示した。
医療現場でのLSMの使用の増加には、希少な疾患のパフォーマンスが重要である。
本稿では,知識LLMとエキスパートシステムを組み合わせたRareScaleを提案する。
- 参考スコア(独自算出の注目度): 8.81420331399616
- License:
- Abstract: Large language models (LLMs) have demonstrated impressive capabilities in disease diagnosis. However, their effectiveness in identifying rarer diseases, which are inherently more challenging to diagnose, remains an open question. Rare disease performance is critical with the increasing use of LLMs in healthcare settings. This is especially true if a primary care physician needs to make a rarer prognosis from only a patient conversation so that they can take the appropriate next step. To that end, several clinical decision support systems are designed to support providers in rare disease identification. Yet their utility is limited due to their lack of knowledge of common disorders and difficulty of use. In this paper, we propose RareScale to combine the knowledge LLMs with expert systems. We use jointly use an expert system and LLM to simulate rare disease chats. This data is used to train a rare disease candidate predictor model. Candidates from this smaller model are then used as additional inputs to black-box LLM to make the final differential diagnosis. Thus, RareScale allows for a balance between rare and common diagnoses. We present results on over 575 rare diseases, beginning with Abdominal Actinomycosis and ending with Wilson's Disease. Our approach significantly improves the baseline performance of black-box LLMs by over 17% in Top-5 accuracy. We also find that our candidate generation performance is high (e.g. 88.8% on gpt-4o generated chats).
- Abstract(参考訳): 大型言語モデル (LLM) は, 疾患診断において顕著な能力を示した。
しかし、診断が本質的に困難である稀な疾患を同定する効果は、未解決の問題である。
医療現場でのLSMの使用の増加には、希少な疾患のパフォーマンスが重要である。
特に、プライマリケアの医師が患者との会話のみから、適切な次の段階に進むために、より稀な予後を取る必要がある場合、これは特に当てはまる。
この目的のために、いくつかの臨床診断支援システムは、稀な疾患の特定における提供者を支援するように設計されている。
しかし、それらの効用は、共通の障害に関する知識の欠如と使用の難しさのために制限されている。
本稿では,知識LLMとエキスパートシステムを組み合わせたRareScaleを提案する。
我々は、専門家システムとLSMを併用して、希少な病的チャットをシミュレートする。
このデータは、稀な疾患候補予測モデルをトレーニングするために使用される。
この小さなモデルからの候補は、最終的な鑑定を行うためにブラックボックスLSMへの追加入力として使用される。
したがって、RareScaleは稀な診断と一般的な診断のバランスを取ることができる。
腹部放線菌症からWilson病まで575以上の稀な疾患について報告する。
提案手法は,ブラックボックスLLMのベースライン性能をTop-5精度で17%以上向上させる。
また、我々の候補生成性能は高い(gpt-4o生成チャットでは88.8%)。
関連論文リスト
- Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - CovidLLM: A Robust Large Language Model with Missing Value Adaptation and Multi-Objective Learning Strategy for Predicting Disease Severity and Clinical Outcomes in COVID-19 Patients [4.063838267166007]
コロナウイルス病2019(COVID-19)は世界中で何百万人もの死者を出した。
これらの疾患の重症度と臨床症状の早期発見は, 予後不良の予防に不可欠である。
本研究は,専門的なプロンプトの構築と多目的学習戦略の採用に重点を置いている。
論文 参考訳(メタデータ) (2024-11-28T11:27:38Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - AutoRD: An Automatic and End-to-End System for Rare Disease Knowledge Graph Construction Based on Ontologies-enhanced Large Language Models [25.966454809890227]
希少な病気は世界中で数百万人に影響を与えるが、その頻度が低いため研究の焦点が限られていることが多い。
近年のLarge Language Models (LLMs) の進歩は, 医療情報の抽出を自動化することを約束している。
本稿では,まれな疾患に関する医療用テキストから情報を自動的に抽出するAutoRDというエンドツーエンドシステムを提案する。
論文 参考訳(メタデータ) (2024-03-01T20:06:39Z) - RareBench: Can LLMs Serve as Rare Diseases Specialists? [11.828142771893443]
Generalist Large Language Models (LLMs) は、医学的診断を含む様々な領域において有望であることを示している。
世界中で約3億人に影響を及ぼす希少な疾患は、しばしば不満足な臨床診断率を持つ。
RareBenchは、希少疾患の領域における4つの重要な次元におけるLSMの能力を評価するために設計された先駆的なベンチマークである。
GPT-4の診断能力と専門医との総合的な比較検討を行った。
論文 参考訳(メタデータ) (2024-02-09T11:34:16Z) - Diagnosis Uncertain Models For Medical Risk Prediction [80.07192791931533]
本研究は, 患者の診断にはアクセスできない, バイタルサイン, 検査値, 既往歴にアクセス可能な患者リスクモデルについて考察する。
このようなすべての原因のリスクモデルが、診断全体にわたって良い一般化を持つが、予測可能な障害モードを持つことが示される。
患者診断の不確実性から生じるリスク予測の不確実性を明示的にモデル化し,この問題に対する対策を提案する。
論文 参考訳(メタデータ) (2023-06-29T23:36:04Z) - Evaluate underdiagnosis and overdiagnosis bias of deep learning model on
primary open-angle glaucoma diagnosis in under-served patient populations [64.91773761529183]
原発性オープンアングル緑内障(POAG)はアメリカにおける盲目の主要な原因である。
深層学習は眼底画像を用いたPOAGの検出に広く用いられている。
臨床診断における人間のバイアスは、広く使われているディープラーニングモデルに反映され増幅される可能性がある。
論文 参考訳(メタデータ) (2023-01-26T18:53:09Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - Mining Misdiagnosis Patterns from Biomedical Literature [8.534433954411409]
一般的に誤診される疾患は、多くの異なる疾患と誤診されることが多かった。
誤診の関係は一般的に存在するが、その関係は片側で見られることが多かった。
論文 参考訳(メタデータ) (2020-06-24T13:34:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。