論文の概要: From Physician Expertise to Clinical Agents: Preserving, Standardizing, and Scaling Physicians' Medical Expertise with Lightweight LLM
- arxiv url: http://arxiv.org/abs/2603.23520v1
- Date: Fri, 06 Mar 2026 14:03:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:13.006731
- Title: From Physician Expertise to Clinical Agents: Preserving, Standardizing, and Scaling Physicians' Medical Expertise with Lightweight LLM
- Title(参考訳): 医学専門医から臨床医へ:軽度LSMを用いた医学専門医の保存・標準化・拡張
- Authors: Chanyong Luo, Jirui Dai, Zhendong Wang, Kui Chen, Jiaxi Yang, Bingjie Lu, Jing Wang, Jiaxin Hao, Bing Li, Ruiyang He, Yiyu Qiao, Chenkai Zhang, Kaiyu Wang, Zhi Liu, Zeyu Zheng, Yan Li, Xiaohong Gu,
- Abstract要約: Med-Shichengは、著名な医師の診断・治療哲学とケース依存適応規則を体系的に学習し、伝達するフレームワークである。
我々は,5人の中国医学・専門医を対象とし,複数の資料をキュレートし,一つのモデルを訓練して,5つの知識システムをすべて7つのタスクで内部化する。
- 参考スコア(独自算出の注目度): 35.1716550725657
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medicine is an empirical discipline refined through long-term observation and the messy, high-variance reality of clinical practice. Physicians build diagnostic and therapeutic competence through repeated cycles of application, reflection, and improvement, forming individualized methodologies. Yet outcomes vary widely, and master physicians' knowledge systems are slow to develop and hard to transmit at scale, contributing to the scarcity of high-quality clinical expertise. To address this, we propose Med-Shicheng, a general framework that enables large language models to systematically learn and transfer distinguished physicians' diagnostic-and-therapeutic philosophy and case-dependent adaptation rules in a standardized way. Built on Tianyi, Med-Shicheng consists of five stages. We target five National Masters of Chinese Medicine or distinguished TCM physicians, curate multi-source materials, and train a single model to internalize all five knowledge systems across seven tasks, including etiology-pathogenesis analysis, syndrome diagnosis, treatment principle selection, prescription generation, prescription explanation, symptom evolution with regimen adjustment, and clinical advice. Implemented on Qwen2.5-1.5B-Base, Med-Shicheng runs on resource-constrained GPUs while achieving performance comparable to DeepSeek-R1 and GPT-5. We also examine the reliability of LLM-as-a-judge versus physician evaluation: automated judging tracks overall trends but shows bias on fine-grained individualized distinctions, highlighting the need for physician involvement when ground truth is unavailable and for domain-adapted judge models.
- Abstract(参考訳): 医学は、長期的な観察と、臨床実践の散らかった高分散現実を通じて洗練される経験的規律である。
医師は、応用、反射、改善の繰り返しを通じて診断と治療能力を構築し、個別化された方法論を形成する。
しかし、成果は様々であり、主治医の知識体系は発達が遅く、大規模に伝達することが難しく、高品質な臨床専門知識の不足に寄与している。
そこで本稿では,著名な医師の診断・治療哲学とケース依存適応規則を標準化された方法で体系的に学習し,伝達することのできる,大規模言語モデルのための汎用フレームワークであるMed-Shichengを提案する。
ティアーニーに建設され、メド・シチェングは5つのステージで構成されている。
本研究は,中国医科専門医5名を対象に,多ソース教材をキュレートし,エチオロジー・病原性分析,症候群診断,治療原則選択,処方薬生成,処方薬説明,症状の進化,規則調整,臨床アドバイスを含む,5つの知識システムを内包する1つのモデルを訓練する。
Qwen2.5-1.5B-Baseで実装されたMed-Shichengは、リソース制約付きGPU上で動作し、DeepSeek-R1やGPT-5に匹敵するパフォーマンスを実現している。
また, LLM-as-a-judgeの信頼性と医師評価の信頼性についても検討した: 自動判定は全体的な傾向を追及するが, 細粒度の個別化に偏りがみられ, 根本的真理が得られない場合の医師関与の必要性や, ドメイン適応型審査モデルの必要性が強調される。
関連論文リスト
- MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.63542462400175]
医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。
具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。
5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文 参考訳(メタデータ) (2025-05-31T13:22:55Z) - RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment [54.91736546490813]
本稿では,大規模言語モデルと特定の診断規則との整合性を考慮したルールアラインフレームワークを提案する。
患者と医師間の規則に基づくコミュニケーションを含む医療対話データセットを開発した。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-22T17:44:40Z) - A Spectrum Evaluation Benchmark for Medical Multi-Modal Large Language Models [57.88111980149541]
Asclepiusは、Med-MLLMの異なる医学的特長と診断能力で評価する、新しいMed-MLLMベンチマークである。
3つの基本原則に基づいて、アスクレピウスは15の医療専門分野を包括的に評価する。
また、6つのMed-MLLMの詳細な分析を行い、3人の専門家と比較した。
論文 参考訳(メタデータ) (2024-02-17T08:04:23Z) - MedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large
Language Models [56.36916128631784]
中国の医療分野の総合的なベンチマークであるMedBenchを紹介する。
このベンチマークは、中国の医療ライセンス試験、居住者標準化訓練試験、および現実世界のクリニックの4つの主要なコンポーネントで構成されている。
幅広い実験を行い, 多様な視点から詳細な分析を行い, 以下の結果を得た。
論文 参考訳(メタデータ) (2023-12-20T07:01:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。