論文の概要: MAP: Evaluation and Multi-Agent Enhancement of Large Language Models for Inpatient Pathways
- arxiv url: http://arxiv.org/abs/2503.13205v1
- Date: Mon, 17 Mar 2025 14:14:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 16:00:40.831570
- Title: MAP: Evaluation and Multi-Agent Enhancement of Large Language Models for Inpatient Pathways
- Title(参考訳): MAP: 入院経路における大規模言語モデルの評価とマルチエージェント化
- Authors: Zhen Chen, Zhihao Peng, Xusheng Liang, Cheng Wang, Peigan Liang, Linsheng Zeng, Minjie Ju, Yixuan Yuan,
- Abstract要約: 入院経路は包括的患者情報に基づく複雑な臨床診断を必要とする。
3つの臨床薬品を併用した多段階入院経路(MAP)フレームワークを提案する。
LLM HuatuoGPT2-13Bと比較して診断精度は25.10%向上した。
- 参考スコア(独自算出の注目度): 26.013336927642765
- License:
- Abstract: Inpatient pathways demand complex clinical decision-making based on comprehensive patient information, posing critical challenges for clinicians. Despite advancements in large language models (LLMs) in medical applications, limited research focused on artificial intelligence (AI) inpatient pathways systems, due to the lack of large-scale inpatient datasets. Moreover, existing medical benchmarks typically concentrated on medical question-answering and examinations, ignoring the multifaceted nature of clinical decision-making in inpatient settings. To address these gaps, we first developed the Inpatient Pathway Decision Support (IPDS) benchmark from the MIMIC-IV database, encompassing 51,274 cases across nine triage departments and 17 major disease categories alongside 16 standardized treatment options. Then, we proposed the Multi-Agent Inpatient Pathways (MAP) framework to accomplish inpatient pathways with three clinical agents, including a triage agent managing the patient admission, a diagnosis agent serving as the primary decision maker at the department, and a treatment agent providing treatment plans. Additionally, our MAP framework includes a chief agent overseeing the inpatient pathways to guide and promote these three clinician agents. Extensive experiments showed our MAP improved the diagnosis accuracy by 25.10% compared to the state-of-the-art LLM HuatuoGPT2-13B. It is worth noting that our MAP demonstrated significant clinical compliance, outperforming three board-certified clinicians by 10%-12%, establishing a foundation for inpatient pathways systems.
- Abstract(参考訳): 入院経路は、包括的患者情報に基づく複雑な臨床意思決定を必要とし、臨床医にとって重要な課題である。
医学応用における大規模言語モデル(LLM)の進歩にもかかわらず、大規模な入院データセットが欠如しているため、人工知能(AI)の入院経路システムに焦点を当てた限定的な研究が行われた。
さらに、既存の医療ベンチマークは、典型的には、患者設定における臨床意思決定の多面的な性質を無視して、医学的質問応答と検査に集中している。
これらのギャップに対処するため,MIMIC-IVデータベースからIPDS(In patient Pathway Decision Support)ベンチマークを作成した。
そこで我々は, 入院管理のトリアージエージェント, 当科の主治医を務める診断エージェント, 治療計画を提供する治療エージェントを含む3つの臨床エージェントを用いて, 入院経路を達成するためのマルチエージェント・インテント・パスウェイ(MAP)フレームワークを提案した。
さらに、MAPフレームワークには、これらの3つの臨床薬を誘導し、促進するための入院経路を監督するチーフエージェントが含まれています。
LLM HuatuoGPT2-13Bと比較して診断精度は25.10%向上した。
当院のMAPは, 3名の臨床検査医を10%~12%上回り, 院内通院の基盤を築いてきた。
関連論文リスト
- Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Towards Evaluating and Building Versatile Large Language Models for Medicine [57.49547766838095]
MedS-Benchは大規模言語モデル(LLM)の性能を臨床的に評価するためのベンチマークである。
MedS-Benchは、臨床報告の要約、治療勧告、診断、名前付きエンティティ認識、医療概念説明を含む、11のハイレベルな臨床タスクにまたがる。
MedS-Insは58の医療指向言語コーパスで構成され、112のタスクで1350万のサンプルを収集している。
論文 参考訳(メタデータ) (2024-08-22T17:01:34Z) - Development of a Large Language Model-based Multi-Agent Clinical Decision Support System for Korean Triage and Acuity Scale (KTAS)-Based Triage and Treatment Planning in Emergency Departments [0.0]
本研究は, 患者トリアージ, 治療計画, 救急管理全般において, LLM駆動型CDSSを用いて, ED医師や看護師を支援することを目的とするものである。
このシステムは、Triage Nuurse、救急医、薬剤師、EDコーディネーターの4つのAIエージェントで構成されている。
トリアージアセスメントにはKTAS(Korea Triage and Acuity Scale)が組み込まれ、医薬品管理にはRxNorm APIが組み込まれている。
論文 参考訳(メタデータ) (2024-08-14T13:03:41Z) - GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.09501109871351]
LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文 参考訳(メタデータ) (2024-08-06T17:59:21Z) - A Spectrum Evaluation Benchmark for Medical Multi-Modal Large Language Models [57.88111980149541]
Asclepiusは、Med-MLLMの異なる医学的特長と診断能力で評価する、新しいMed-MLLMベンチマークである。
3つの基本原則に基づいて、アスクレピウスは15の医療専門分野を包括的に評価する。
また、6つのMed-MLLMの詳細な分析を行い、3人の専門家と比較した。
論文 参考訳(メタデータ) (2024-02-17T08:04:23Z) - Beyond Direct Diagnosis: LLM-based Multi-Specialist Agent Consultation
for Automatic Diagnosis [30.943705201552643]
本研究では,潜在的な疾患に対するエージェントの確率分布を適応的に融合させることにより,現実世界の診断過程をモデル化する枠組みを提案する。
提案手法では,パラメータ更新とトレーニング時間を大幅に短縮し,効率と実用性を向上する。
論文 参考訳(メタデータ) (2024-01-29T12:25:30Z) - Towards Conversational Diagnostic AI [32.84876349808714]
本稿では,診断対話に最適化されたLarge Language Model (LLM)ベースのAIシステムであるAMIE(Articulate Medical Intelligence Explorer)を紹介する。
AMIEは、さまざまな疾患条件にまたがって学習をスケールするための自動フィードバック機構を備えた、セルフプレイベースのシミュレート環境を使用する。
AMIEの診断精度は, 専門医によると32例中28例, 患者アクターでは26例中24例で高い成績を示した。
論文 参考訳(メタデータ) (2024-01-11T04:25:06Z) - Towards Accurate Differential Diagnosis with Large Language Models [37.48155380562073]
LLM(Large Language Models)を利用した対話型インタフェースは、差分診断の側面をアシストし、自動化する新たな機会を提供する。
20人の臨床医が、ニューイングランド・ジャーナル・オブ・メディカル(New England Journal of Medicine)から入手した、302の挑戦的な現実世界の医療事例を評価した。
我々のLSMは,難治性症例の診断的推論と精度を向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-30T19:55:51Z) - MyoPS: A Benchmark of Myocardial Pathology Segmentation Combining
Three-Sequence Cardiac Magnetic Resonance Images [84.02849948202116]
本研究は,MyoPS(MyoPS)の医療画像解析における新たな課題を定義するものである。
myoPSは、MICCAI 2020とともにMyoPSチャレンジで最初に提案された3シーケンスの心臓磁気共鳴(CMR)画像を組み合わせている。
この課題は45対のCMR画像と予め整列されたCMR画像を提供し、アルゴリズムは3つのCMRシーケンスから補完的な情報を結合して病理領域を分割することを可能にする。
論文 参考訳(メタデータ) (2022-01-10T06:37:23Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - SmartTriage: A system for personalized patient data capture,
documentation generation, and decision support [9.09817311390571]
我々は,電子カルテ(EMR)との緊密な双方向統合を通じて,従来の症状チェックを超える機械学習支援システムであるSmartTriageを開発した。
SmartTriageは、患者の主訴を自由テキストエントリから識別し、関連する症状学を得るために一連の個別の質問を行う。
患者固有のデータは、詳細なICD-10-CMコード、薬品、検査、画像の順序を予測するために使用される。
論文 参考訳(メタデータ) (2020-10-19T22:45:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。