論文の概要: A Specialized Large Language Model for Clinical Reasoning and Diagnosis in Rare Diseases
- arxiv url: http://arxiv.org/abs/2511.14638v1
- Date: Tue, 18 Nov 2025 16:29:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.211258
- Title: A Specialized Large Language Model for Clinical Reasoning and Diagnosis in Rare Diseases
- Title(参考訳): 尿路病における臨床推論・診断のための大規模言語モデル
- Authors: Tao Yang, Dandan Huang, Yunting Lin, Pengfei Wu, Zhikun Wu, Gangyuan Ma, Yulan Lu, Xinran Dong, Dingpeng Li, Junshuang Ge, Zhiyan Zhang, Xuanzhao Huang, Wenyan Nong, Yao Zhou, Hui Tang, Hongxi Yang, Shijie Zhang, Juan Li, Xiaojun Cao, Lin Yang, Xia Gao, Kaishou Xu, Xiaoqiong Gu, Wen Zhang, Huimin Xia, Li Liu, Wenhao Zhou, Mulin Jun Li,
- Abstract要約: RareSeek R1は、ノイズや重なり合う表現型の下で、技術精度、堅牢な一般化、安定性の状態を達成している。
この研究は、診断を短縮し、聴覚的、臨床的に翻訳可能な意思決定支援を可能にする、物語第一の知識統合推論パラダイムを前進させる。
- 参考スコア(独自算出の注目度): 22.51015369266496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rare diseases affect hundreds of millions worldwide, yet diagnosis often spans years. Convectional pipelines decouple noisy evidence extraction from downstream inferential diagnosis, and general/medical large language models (LLMs) face scarce real world electronic health records (EHRs), stale domain knowledge, and hallucinations. We assemble a large, domain specialized clinical corpus and a clinician validated reasoning set, and develop RareSeek R1 via staged instruction tuning, chain of thought learning, and graph grounded retrieval. Across multicenter EHR narratives and public benchmarks, RareSeek R1 attains state of the art accuracy, robust generalization, and stability under noisy or overlapping phenotypes. Augmented retrieval yields the largest gains when narratives pair with prioritized variants by resolving ambiguity and aligning candidates to mechanisms. Human studies show performance on par with experienced physicians and consistent gains in assistive use. Notably, transparent reasoning highlights decisive non phenotypic evidence (median 23.1%, such as imaging, interventions, functional tests) underpinning many correct diagnoses. This work advances a narrative first, knowledge integrated reasoning paradigm that shortens the diagnostic odyssey and enables auditable, clinically translatable decision support.
- Abstract(参考訳): 希少な病気は世界中に何億もの影響を及ぼすが、診断には数年かかることが多い。
対流パイプラインは、下流の推論診断から抽出されたノイズの証拠を分離し、一般的な医療用大言語モデル(LLM)は、現実の電子健康記録(EHR)が不足し、ドメイン知識が停滞し、幻覚を呈する。
我々は,大規模で専門的な臨床コーパスと臨床者が検証した推論セットを組み立て,RareSeek R1を段階的指導チューニング,思考学習の連鎖,グラフ基底検索を通じて開発する。
RareSeek R1はマルチセンターのEHRナラティブと公開ベンチマークを通じて、ノイズや重複する表現型の下での最先端の精度、堅牢な一般化、安定性を実現している。
拡張された検索は、物語が曖昧さを解消し、候補をメカニズムに合わせることによって優先順位付けされた変種と組み合わせるときに最も大きな利益をもたらす。
人間の研究は、経験豊富な医師と同等のパフォーマンスを示し、補助的使用における一貫した利益を示している。
特に、透明な推論は決定的な非表現型証拠(画像、介入、機能検査など23.1%)を強調しており、多くの正しい診断の基盤となっている。
この研究は、診断を短縮し、聴覚的、臨床的に翻訳可能な意思決定支援を可能にする、物語第一の知識統合推論パラダイムを前進させる。
関連論文リスト
- RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.12425911708585]
Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-21T17:42:47Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models [25.13622249539088]
diagnosisArenaは、専門レベルの診断能力の厳格な評価のために設計されたベンチマークである。
診断アリーナは1,113組のセグメンテーション患者と、28の専門専門医からなる。
我々の研究では、最も先進的な推論モデルであるo3、o1、DeepSeek-R1でさえ、それぞれ51.12%、31.09%、17.79%の精度しか達成していないことが明らかになった。
論文 参考訳(メタデータ) (2025-05-20T09:14:53Z) - The Multi-Round Diagnostic RAG Framework for Emulating Clinical Reasoning [10.483453944197407]
現代医学と漢方医学の両方をカバーする知識グラフであるDiagnosGraphを構築した。
口語患者の物語と学術的な医療知識のギャップを埋めるために、DiagnosGraphは1,908ドルの医療記録も導入している。
MRD-RAGがLSMの診断性能を向上させることを実証した。
論文 参考訳(メタデータ) (2025-04-10T13:17:51Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。