論文の概要: Dr. Assistant: Enhancing Clinical Diagnostic Inquiry via Structured Diagnostic Reasoning Data and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2601.13690v1
- Date: Tue, 20 Jan 2026 07:43:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.207493
- Title: Dr. Assistant: Enhancing Clinical Diagnostic Inquiry via Structured Diagnostic Reasoning Data and Reinforcement Learning
- Title(参考訳): Dr.アシスタント:構造化診断推論データと強化学習による臨床診断調査の強化
- Authors: Yue Guo, Fanfu Wang, Jianwei Lv, Xincheng Shi, Yuchen Li, Youya Wang, Yunsheng Zeng, Yujing Liu, Yunhao Qiao, Gen Li, Junfeng Wang, Bo Yuan,
- Abstract要約: 大規模言語モデル(LLM)は、幅広い知識保護、検索、コミュニケーション能力のために、医療において広く採用されている。
LLMは医療ベンチマークにおいて有望であり、その診断的推論と調査のスキルは制限されている。
本稿では,(1)抽象的な臨床推論ロジックを捉えるための臨床診断推論データ(CDRD)構造と,その構築のためのパイプライン,(2)臨床推論と検査技術を備えた臨床診断モデルであるDr. Assistantを提案する。
- 参考スコア(独自算出の注目度): 14.866862028323053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical Decision Support Systems (CDSSs) provide reasoning and inquiry guidance for physicians, yet they face notable challenges, including high maintenance costs and low generalization capability. Recently, Large Language Models (LLMs) have been widely adopted in healthcare due to their extensive knowledge reserves, retrieval, and communication capabilities. While LLMs show promise and excel at medical benchmarks, their diagnostic reasoning and inquiry skills are constrained. To mitigate this issue, we propose (1) Clinical Diagnostic Reasoning Data (CDRD) structure to capture abstract clinical reasoning logic, and a pipeline for its construction, and (2) the Dr. Assistant, a clinical diagnostic model equipped with clinical reasoning and inquiry skills. Its training involves a two-stage process: SFT, followed by RL with a tailored reward function. We also introduce a benchmark to evaluate both diagnostic reasoning and inquiry. Our experiments demonstrate that the Dr. Assistant outperforms open-source models and achieves competitive performance to closed-source models, providing an effective solution for clinical diagnostic inquiry guidance.
- Abstract(参考訳): 臨床決定支援システム(CDSS)は、医師の推論と調査のガイダンスを提供するが、高いメンテナンスコストと低い一般化能力を含む顕著な課題に直面している。
近年,Large Language Models (LLMs) が医療分野で広く採用されている。
LLMは医療ベンチマークにおいて有望であり、優れているが、診断的推論と調査のスキルは制限されている。
この問題を軽減するために,(1)抽象的な臨床推論ロジックを捉えるCDRD構造と,その構築のためのパイプライン,(2)臨床推論と検査技術を備えた臨床診断モデルであるDr. Assistantを提案する。
トレーニングには2段階のプロセス、SFT、RLと調整された報酬関数が含まれる。
また,診断的推論と調査の両方を評価するためのベンチマークも導入した。
実験の結果,Dr. Assistantはオープンソースモデルより優れ,クローズドソースモデルと競合する性能を示し,臨床診断指導のための効果的なソリューションを提供する。
関連論文リスト
- Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文 参考訳(メタデータ) (2025-10-21T18:10:45Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.12425911708585]
Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-21T17:42:47Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models [25.13622249539088]
diagnosisArenaは、専門レベルの診断能力の厳格な評価のために設計されたベンチマークである。
診断アリーナは1,113組のセグメンテーション患者と、28の専門専門医からなる。
我々の研究では、最も先進的な推論モデルであるo3、o1、DeepSeek-R1でさえ、それぞれ51.12%、31.09%、17.79%の精度しか達成していないことが明らかになった。
論文 参考訳(メタデータ) (2025-05-20T09:14:53Z) - Expertise Is What We Want [0.0]
アプリケーションアーキテクチャ、LLE(Large Language Expert)は、LLM(Large Language Models)の柔軟性とパワーと、Expert Systemsの解釈可能性、説明可能性、信頼性を組み合わせたものです。
LLE(Large Language Expert)システムのパワーを強調するために,新たに癌と診断された患者の作業を支援するLLEを構築した。
論文 参考訳(メタデータ) (2025-02-27T18:05:15Z) - Bridging Stepwise Lab-Informed Pretraining and Knowledge-Guided Learning for Diagnostic Reasoning [20.369746122143063]
本稿では,2つの相補的な情報ソースを結合した2元検定フレームワークを提案する。
外部知識のために,大規模モデルによって強化された階層的言語と意味的関係をエンコードする診断知識グラフ(KG)を構築した。
そこで本研究では,臨床検査信号に基づく段階的推論プロセスに従ってモデルを誘導する,ラボインフォームド・プロキシータスクを提案する。
論文 参考訳(メタデータ) (2024-10-25T20:25:22Z) - Towards the Identifiability and Explainability for Personalized Learner
Modeling: An Inductive Paradigm [36.60917255464867]
本稿では,エンコーダ・デコーダモデルにインスパイアされた新しい応答効率応答パラダイムに基づく,識別可能な認知診断フレームワークを提案する。
診断精度を損なうことなく,ID-CDFが効果的に対処できることが示唆された。
論文 参考訳(メタデータ) (2023-09-01T07:18:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。