論文の概要: CPGPrompt: Translating Clinical Guidelines into LLM-Executable Decision Support
- arxiv url: http://arxiv.org/abs/2601.03475v1
- Date: Wed, 07 Jan 2026 00:05:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.093332
- Title: CPGPrompt: Translating Clinical Guidelines into LLM-Executable Decision Support
- Title(参考訳): CPGPrompt: 臨床ガイドラインをLCM対応型意思決定支援に変換する
- Authors: Ruiqi Deng, Geoffrey Martin, Tony Wang, Gongbo Zhang, Yi Liu, Chunhua Weng, Yanshan Wang, Justin F Rousseau, Yifan Peng,
- Abstract要約: 物語臨床ガイドラインを大規模言語モデル(LLM)に変換する自動プロンプトシステムであるCPGPromptを開発し,検証する。
本フレームワークはCDGを構造化決定木に翻訳し,LLMを用いて患者ケース評価に動的にナビゲートする。
システム性能は、二項特殊参照決定ときめ細かい経路分類タスクの両方で評価された。
- 参考スコア(独自算出の注目度): 18.887576751340884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical practice guidelines (CPGs) provide evidence-based recommendations for patient care; however, integrating them into Artificial Intelligence (AI) remains challenging. Previous approaches, such as rule-based systems, face significant limitations, including poor interpretability, inconsistent adherence to guidelines, and narrow domain applicability. To address this, we develop and validate CPGPrompt, an auto-prompting system that converts narrative clinical guidelines into large language models (LLMs). Our framework translates CPGs into structured decision trees and utilizes an LLM to dynamically navigate them for patient case evaluation. Synthetic vignettes were generated across three domains (headache, lower back pain, and prostate cancer) and distributed into four categories to test different decision scenarios. System performance was assessed on both binary specialty-referral decisions and fine-grained pathway-classification tasks. The binary specialty referral classification achieved consistently strong performance across all domains (F1: 0.85-1.00), with high recall (1.00 $\pm$ 0.00). In contrast, multi-class pathway assignment showed reduced performance, with domain-specific variations: headache (F1: 0.47), lower back pain (F1: 0.72), and prostate cancer (F1: 0.77). Domain-specific performance differences reflected the structure of each guideline. The headache guideline highlighted challenges with negation handling. The lower back pain guideline required temporal reasoning. In contrast, prostate cancer pathways benefited from quantifiable laboratory tests, resulting in more reliable decision-making.
- Abstract(参考訳): 臨床実践ガイドライン(CPGs)は、患者のケアに対するエビデンスに基づく勧告を提供するが、それらを人工知能(AI)に統合することは依然として困難である。
ルールベースのシステムのような以前のアプローチでは、解釈可能性の低さ、ガイドラインへの一貫性の欠如、ドメイン適用可能性の狭さなど、重大な制限に直面していた。
そこで我々は,物語臨床ガイドラインを大規模言語モデル(LLM)に変換する自動プロンプトシステムであるCPGPromptを開発し,検証する。
本フレームワークはCDGを構造化決定木に翻訳し,LLMを用いて患者ケース評価に動的にナビゲートする。
合成ヴィグネットは3つの領域(頭部、腰痛、前立腺癌)で生成され、異なる決定シナリオをテストするために4つのカテゴリに分散された。
システム性能は、二項特殊参照決定ときめ細かい経路分類タスクの両方で評価された。
バイナリ特殊化参照分類は、すべてのドメイン(F1: 0.85-1.00)で一貫して強いパフォーマンスを実現し、高いリコール(1.00$\pm$ 0.00)を実現した。
対照的に、マルチクラスパスの割り当ては、頭痛(F1:0.47)、腰痛(F1:0.72)、前立腺癌(F1:0.77)など、ドメイン固有のバリエーションでパフォーマンスが低下した。
ドメイン固有の性能差は、各ガイドラインの構造を反映している。
頭痛ガイドラインは否定的扱いの課題を強調した。
下肢痛ガイドは時間的推論を必要とした。
対照的に、前立腺がん経路は定量検査の恩恵を受け、より信頼性の高い意思決定をもたらす。
関連論文リスト
- Orchestrator Multi-Agent Clinical Decision Support System for Secondary Headache Diagnosis in Primary Care [13.520457515792534]
本稿では,オーケストレータ-スペシャリストアーキテクチャ上に構築された多言語モデル(LLM)に基づく多言語臨床意思決定支援システムを提案する。
このシステムは、診断を7つのドメイン特化エージェントに分解し、それぞれが構造化されエビデンスに基づく理論的根拠を生成する。
90例の2次頭痛患者を用いてマルチエージェントシステムの評価を行い,その成績を単一LLMベースラインと比較した。
論文 参考訳(メタデータ) (2025-12-03T19:26:12Z) - A Locally Executable AI System for Improving Preoperative Patient Communication: A Multi-Domain Clinical Evaluation [1.9205944025326396]
LENOHAは、入力を高精度な文変換器の制約でルーティングする安全第一のローカルファーストシステムである。
臨床問合せのために、クリニカルカレーションされたFAQから口頭で回答を返す。
エネルギー検定の結果,1回の入力で1.0 mWh,小語で168 mWhの応答で1回の応答で1.0 mWhを消費することがわかった。
論文 参考訳(メタデータ) (2025-10-02T04:53:11Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Design and Validation of a Responsible Artificial Intelligence-based System for the Referral of Diabetic Retinopathy Patients [65.57160385098935]
糖尿病網膜症の早期発見は、視力喪失のリスクを最大95%減少させる可能性がある。
我々は、AIライフサイクル全体にわたる倫理的原則を取り入れた、DRスクリーニングのための責任あるAIシステムであるRAIS-DRを開発した。
当科におけるRAIS-DRをFDA認可のEyeArtシステムと比較した。
論文 参考訳(メタデータ) (2025-08-17T21:54:11Z) - LRMR: LLM-Driven Relational Multi-node Ranking for Lymph Node Metastasis Assessment in Rectal Cancer [12.795639054336226]
直腸癌リンパ節転移の術前評価は治療決定を導く。
一部の人工知能モデルはブラックボックスとして機能し、臨床信頼に必要な解釈性に欠ける。
LLM-Driven Multi-node Ranking frameworkであるLRMRを紹介する。
論文 参考訳(メタデータ) (2025-07-15T16:29:45Z) - AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs [0.0]
歩行障害は、神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を果たす。
近年のディープラーニングベースのアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多い。
本稿では、事前訓練されたVQ-VAEモーショントークンライザと、一対のモーショントークン上で微調整されたLarge Language Model(LLM)からなる新しいパイプラインであるAGIRを紹介する。
論文 参考訳(メタデータ) (2025-03-23T17:12:16Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Taxonomy Adaptive Cross-Domain Adaptation in Medical Imaging via
Optimization Trajectory Distillation [73.83178465971552]
自動医用画像解析の成功は、大規模かつ専門家による注釈付きトレーニングセットに依存する。
非教師なしドメイン適応(UDA)はラベル付きデータ収集の負担を軽減するための有望なアプローチである。
本稿では,2つの技術的課題に新しい視点から対処する統一的手法である最適化トラジェクトリ蒸留を提案する。
論文 参考訳(メタデータ) (2023-07-27T08:58:05Z) - Performance of Dual-Augmented Lagrangian Method and Common Spatial
Patterns applied in classification of Motor-Imagery BCI [68.8204255655161]
運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は、神経リハビリテーションのための画期的な技術になる可能性がある。
使用する脳波信号のノイズの性質のため、信頼性の高いBCIシステムは特徴の最適化と抽出のために特別な手順を必要とする。
論文 参考訳(メタデータ) (2020-10-13T20:50:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。