Fugu-MT 論文翻訳(概要): Development and Testing of a Novel Large Language Model-Based Clinical Decision Support Systems for Medication Safety in 12 Clinical Specialties

論文の概要: Development and Testing of a Novel Large Language Model-Based Clinical Decision Support Systems for Medication Safety in 12 Clinical Specialties

arxiv url: http://arxiv.org/abs/2402.01741v2
Date: Sat, 17 Feb 2024 21:13:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 03:09:16.190371
Title: Development and Testing of a Novel Large Language Model-Based Clinical Decision Support Systems for Medication Safety in 12 Clinical Specialties
Title（参考訳）: 新規大規模言語モデルに基づく医薬品安全のための臨床判断支援システムの開発と試験
Authors: Jasmine Chiat Ling Ong, Liyuan Jin, Kabilan Elangovan, Gilbert Yong San Lim, Daniel Yan Zheng Lim, Gerald Gui Ren Sng, Yuhe Ke, Joshua Yi Min Tung, Ryan Jian Zhong, Christopher Ming Yao Koh, Keane Zhi Hao Lee, Xiang Chen, Jack Kian Chng, Aung Than, Ken Junyang Goh, Daniel Shu Wei Ting
Abstract要約: 本稿では, 安全な薬剤処方をサポートするために, 臨床診断支援システム (CDSS) として, 新規な検索言語モデル (LLM) フレームワークを導入する。本研究は、12の異なる医療・外科専門分野の23の臨床ヴィグネットに61のプリスクリプティングエラーシナリオを組み込んだ。
参考スコア（独自算出の注目度）: 3.963266190903893
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Importance: We introduce a novel Retrieval Augmented Generation (RAG)-Large Language Model (LLM) framework as a Clinical Decision Support Systems (CDSS) to support safe medication prescription. Objective: To evaluate the efficacy of LLM-based CDSS in correctly identifying medication errors in different patient case vignettes from diverse medical and surgical sub-disciplines, against a human expert panel derived ground truth. We compared performance for under 2 different CDSS practical healthcare integration modalities: LLM-based CDSS alone (fully autonomous mode) vs junior pharmacist + LLM-based CDSS (co-pilot, assistive mode). Design, Setting, and Participants: Utilizing a RAG model with state-of-the-art medically-related LLMs (GPT-4, Gemini Pro 1.0 and Med-PaLM 2), this study used 61 prescribing error scenarios embedded into 23 complex clinical vignettes across 12 different medical and surgical specialties. A multidisciplinary expert panel assessed these cases for Drug-Related Problems (DRPs) using the PCNE classification and graded severity / potential for harm using revised NCC MERP medication error index. We compared. Results RAG-LLM performed better compared to LLM alone. When employed in a co-pilot mode, accuracy, recall, and F1 scores were optimized, indicating effectiveness in identifying moderate to severe DRPs. The accuracy of DRP detection with RAG-LLM improved in several categories but at the expense of lower precision. Conclusions This study established that a RAG-LLM based CDSS significantly boosts the accuracy of medication error identification when used alongside junior pharmacists (co-pilot), with notable improvements in detecting severe DRPs. This study also illuminates the comparative performance of current state-of-the-art LLMs in RAG-based CDSS systems.
Abstract（参考訳）: 重要性: 安全な医薬品処方をサポートするために, 臨床決定支援システム (CDSS) として, 新規な検索言語モデル (LLM) フレームワークを導入する。目的: LLMをベースとしたCDSSの有効性を評価するため, 臨床・外科領域の多種多様な患者用ヴィグネットの薬物的誤りを, 人手による根本真理の導出に対して正しく同定する。 LLMをベースとしたCDSS単独(完全自律型)とジュニア薬剤師+LCMをベースとしたCDSS(コパイロット,補助型)を比較した。デザイン, 設定, 参加者: 最先端の医療関連LSM (GPT-4, Gemini Pro 1.0, Med-PaLM 2) を用いたRAGモデルを用いて, 12種類の医療・外科専門分野の23の複合臨床用ヴィグネットに61のシナリオを組み込んだ。 PCNE分類による薬物関連問題 (DRPs) と, NCC MERP の薬剤エラー指標を用いた重症度/潜在的な評価を行った。比較した。 RAG-LLM は LLM 単独よりも優れていた。コパイロットモードを採用すると、精度、リコール、F1スコアが最適化され、中等度から重度のDRPを識別する効果が示された。 RAG-LLMによるDRP検出の精度はいくつかのカテゴリーで向上したが、精度は低下した。結論】RAG-LLMをベースとしたCDSSは中等薬理士(co-pilot)と併用した場合の薬物誤認の精度を著しく向上させ,重度のDRPの検出において顕著な改善が認められた。また, RAGを用いたCDSSシステムにおいて, 現状LLMの性能比較を行った。

関連論文リスト

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T18:48:21Z)
MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文参考訳（メタデータ） (2026-01-16T02:32:07Z)
LDP: Parameter-Efficient Fine-Tuning of Multimodal LLM for Medical Report Generation [11.77291778908787]
早期大腸癌の診断には大腸内視鏡的診断が重要である。従来の自動報告は、高品質なマルチモーダル医療データの不足により、矛盾や幻覚に悩まされている。本稿では,MLLM(Multimodal large language model)を利用したプロの診断報告生成のための新しいフレームワーク LDP を提案する。
論文参考訳（メタデータ） (2025-12-11T15:43:33Z)
Human-Level and Beyond: Benchmarking Large Language Models Against Clinical Pharmacists in Prescription Review [9.611501492890461]
RxBenchは、一般的な処方薬レビューカテゴリをカバーし、14の頻繁な処方薬エラーを集約する包括的なベンチマークである。 1,150のシングルチョイス、230のマルチチョイス、879のショートアンサーアイテムで構成され、いずれも経験豊富な臨床薬剤師によってレビューされている。 Gemini-2.5-pro-preview-05-06、Grok-4-0709、DeepSeek-R1-0528は一貫して第1階層を形成し、精度と堅牢性の両方で他のモデルを上回った。
論文参考訳（メタデータ） (2025-11-17T08:36:53Z)
From Prompt Optimization to Multi-Dimensional Credibility Evaluation: Enhancing Trustworthiness of Chinese LLM-Generated Liver MRI Reports [13.226827332616134]
大言語モデル (LLM) は画像所見から診断結果を生成する上で有望な性能を示した。本研究は, MDCA (Multi-dimensional Credibility Assessment) フレームワークの導入により, LLM産生肝MRIの信頼性を高めることを目的とする。
論文参考訳（メタデータ） (2025-10-27T04:57:20Z)
LGE-Guided Cross-Modality Contrastive Learning for Gadolinium-Free Cardiomyopathy Screening in Cine CMR [51.11296719862485]
CMRを用いたガドリニウムフリー心筋症スクリーニングのためのコントラシブラーニングおよびクロスモーダルアライメントフレームワークを提案する。 CMRとLate Gadolinium Enhancement (LGE) 配列の潜伏空間を整列させることにより, 本モデルでは線維症特異的な病理組織をCMR埋め込みにエンコードする。
論文参考訳（メタデータ） (2025-08-23T07:21:23Z)
Design and Validation of a Responsible Artificial Intelligence-based System for the Referral of Diabetic Retinopathy Patients [65.57160385098935]
糖尿病網膜症の早期発見は、視力喪失のリスクを最大95%減少させる可能性がある。我々は、AIライフサイクル全体にわたる倫理的原則を取り入れた、DRスクリーニングのための責任あるAIシステムであるRAIS-DRを開発した。当科におけるRAIS-DRをFDA認可のEyeArtシステムと比較した。
論文参考訳（メタデータ） (2025-08-17T21:54:11Z)
LRMR: LLM-Driven Relational Multi-node Ranking for Lymph Node Metastasis Assessment in Rectal Cancer [12.795639054336226]
直腸癌リンパ節転移の術前評価は治療決定を導く。一部の人工知能モデルはブラックボックスとして機能し、臨床信頼に必要な解釈性に欠ける。 LLM-Driven Multi-node Ranking frameworkであるLRMRを紹介する。
論文参考訳（メタデータ） (2025-07-15T16:29:45Z)
Lessons Learned from Evaluation of LLM based Multi-agents in Safer Therapy Recommendation [9.84660526673816]
本研究では,Large Language Model (LLM) を用いたマルチエージェントシステムの有用性と有用性について検討した。我々は,MDT(Multidisciplinary Team)意思決定をシミュレーションする単一のエージェントとMASフレームワークを設計した。我々はMAS性能を単エージェントアプローチと実世界のベンチマークと比較した。
論文参考訳（メタデータ） (2025-07-15T02:01:38Z)
MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.63542462400175]
医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。 5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文参考訳（メタデータ） (2025-05-31T13:22:55Z)
Look & Mark: Leveraging Radiologist Eye Fixations and Bounding boxes in Multimodal Large Language Models for Chest X-ray Report Generation [2.821158017021184]
Look & Mark (L&M) は、放射線医学的アイフィクス(Look)とバウンディングボックスアノテーション(Mark)を統合した新しい接地固定戦略である。 LLaVA-OVは87.3%の臨床平均成績(C.AVG)を達成しており、L&Mとインコンテキストラーニングを組み合わせた汎用モデルもすべてのモデルの中で最高である。
論文参考訳（メタデータ） (2025-05-28T10:54:40Z)
ChestX-Reasoner: Advancing Radiology Foundation Models with Reasoning through Step-by-Step Verification [57.22053411719822]
ChestX-Reasoner(チェストX-Reasoner)は、臨床報告から直接採掘されるプロセスの監督を活用するために設計された放射線診断MLLMである。我々の2段階のトレーニングフレームワークは、モデル推論と臨床標準との整合性を高めるために、プロセス報酬によって指導された教師付き微調整と強化学習を組み合わせる。
論文参考訳（メタデータ） (2025-04-29T16:48:23Z)
Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering [70.44269982045415]
Retrieval-augmented Generation (RAG) は,大規模言語モデル (LLM) の性能向上のための有望なアプローチとして登場した。医療用QAデータセットに様々な補助的要素を提供するMedRGB(MedRGB)を導入する。実験結果から,検索した文書のノイズや誤情報の処理能力に限界があることが判明した。
論文参考訳（メタデータ） (2024-11-14T06:19:18Z)
Language Models And A Second Opinion Use Case: The Pocket Professional [0.0]
本研究は、専門的な意思決定において、正式な第二意見ツールとして、LLM(Large Language Models)の役割を検証する。この研究は、20ヶ月にわたるMedscapeからの183の挑戦的な医療事例を分析し、クラウドソースされた医師の反応に対して複数のLSMのパフォーマンスをテストした。
論文参考訳（メタデータ） (2024-10-27T23:48:47Z)
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。 Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文参考訳（メタデータ） (2024-10-16T23:03:27Z)
Copiloting Diagnosis of Autism in Real Clinical Scenarios via LLMs [25.380978438307267]
我々はADOS-Copilotというフレームワークを提案し、スコアと説明のバランスをとる。以上の結果から,本フレームワークは臨床医の診断と競合する可能性が示唆された。
論文参考訳（メタデータ） (2024-10-08T04:48:42Z)
MAGDA: Multi-agent guideline-driven diagnostic assistance [43.15066219293877]
救急部門、地方病院、または未開発地域の診療所では、臨床医は訓練された放射線技師による高速な画像分析を欠いていることが多い。本研究では,ゼロショットガイドライン駆動意思決定支援のための新しいアプローチを提案する。我々は、患者診断に到達するために協調する、対照的な視覚言語モデルで強化された複数のLLMエージェントのシステムをモデル化する。
論文参考訳（メタデータ） (2024-09-10T09:10:30Z)
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文参考訳（メタデータ） (2024-02-15T06:46:48Z)
Combining Insights From Multiple Large Language Models Improves Diagnostic Accuracy [0.0]
大きな言語モデル (LLM) は診断支援ツールとして提案されるか、あるいは "curbside consults" の代替として言及される。個別の商業用LDMを問うことで得られた差分診断の精度を,同一LCMの組み合わせからの応答を集約して合成した差分診断の精度と比較した。
論文参考訳（メタデータ） (2024-02-13T21:24:21Z)
Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文参考訳（メタデータ） (2024-02-05T08:25:22Z)
Auditing Algorithmic Fairness in Machine Learning for Health with Severity-Based LOGAN [70.76142503046782]
臨床予測タスクにおいて,局所バイアスを自動検出するSLOGANを用いて,機械学習ベースの医療ツールを補足することを提案する。 LOGANは、患者の重症度と過去の医療史における集団バイアス検出を文脈化することにより、既存のツールであるLOcal Group biAs detectioNに適応する。 SLOGANは, クラスタリング品質を維持しながら, 患者群の75%以上において, SLOGANよりも高い公平性を示す。
論文参考訳（メタデータ） (2022-11-16T08:04:12Z)
Outlier-based Autism Detection using Longitudinal Structural MRI [6.311381904410801]
本稿では, 構造的磁気共鳴画像(sMRI)に基づく自閉症スペクトラム障害の診断を, 異常検出手法を用いて提案する。 GAN(Generative Adversarial Network)は、健康な被験者のsMRIスキャンでのみ訓練される。実験の結果、ASD検出フレームワークは最先端のトレーニングデータと互換性があり、トレーニングデータもはるかに少ないことがわかった。
論文参考訳（メタデータ） (2022-02-21T04:37:25Z)
Performance of Dual-Augmented Lagrangian Method and Common Spatial Patterns applied in classification of Motor-Imagery BCI [68.8204255655161]
運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は、神経リハビリテーションのための画期的な技術になる可能性がある。使用する脳波信号のノイズの性質のため、信頼性の高いBCIシステムは特徴の最適化と抽出のために特別な手順を必要とする。
論文参考訳（メタデータ） (2020-10-13T20:50:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。