論文の概要: MedDM:LLM-executable clinical guidance tree for clinical decision-making
- arxiv url: http://arxiv.org/abs/2312.02441v1
- Date: Tue, 5 Dec 2023 02:44:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-06 17:03:37.529346
- Title: MedDM:LLM-executable clinical guidance tree for clinical decision-making
- Title(参考訳): MedDM:LLM-executable clinical guidance tree for clinical decision-making
- Authors: Binbin Li and Tianxin Meng and Xiaoming Shi and Jie Zhai and Tong Ruan
- Abstract要約: LLMで直接使用できる適切な臨床ガイダンスツリーデータセットは存在しない。
まず LLM-executavle Clinical Guide Tree (CGT) を提案する。
本研究は,フローチャートから医療診断意思決定データセット(MedDM)を構築した。
- 参考スコア(独自算出の注目度): 9.27804927412851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is becoming increasingly emphasis on the importance of LLM participating
in clinical diagnosis decision-making. However, the low specialization refers
to that current medical LLMs can not provide specific medical advice, which are
more like a medical Q\&A. And there is no suitable clinical guidance tree data
set that can be used directly with LLM. To address this issue, we first propose
LLM-executavle clinical guidance tree(CGT), which can be directly used by large
language models, and construct medical diagnostic decision-making dataset
(MedDM), from flowcharts in clinical practice guidelines. We propose an
approach to screen flowcharts from medical literature, followed by their
identification and conversion into standardized diagnostic decision trees.
Constructed a knowledge base with 1202 decision trees, which came from 5000
medical literature and covered 12 hospital departments, including internal
medicine, surgery, psychiatry, and over 500 diseases.Moreover, we propose a
method for reasoning on LLM-executable CGT and a Patient-LLM multi-turn
dialogue framework.
- Abstract(参考訳): 臨床診断決定にLLMが関与することの重要性がますます強調されている。
しかしながら、低い専門化は、現在の医学llmは、医学的なq\&aに近い特定の医療アドバイスを提供できないことを意味する。
LLMで直接使用できる適切な臨床ガイダンスツリーデータセットは存在しない。
この問題に対処するために,我々はまず,大規模言語モデルで直接使用できるLCM-executavle Clinical Guide Tree(CGT)を提案し,臨床実践ガイドラインのフローチャートから医療診断意思決定データセット(MedDM)を構築した。
医学文献からフローチャートをスクリーン化する方法を提案し,その識別と標準化された診断決定木への変換を行う。
内科, 外科, 精神科, および500以上の疾患を含む12の病院に, 5000件の医学文献から得られた1202本の決定木を用いた知識ベースを構築し, さらに, LLM-executable CGTと患者-LLM多ターン対話の枠組みに基づく推論手法を提案する。
関連論文リスト
- CliMedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models in Clinical Scenarios [50.032101237019205]
CliMedBenchは、14のエキスパートによるコア臨床シナリオを備えた総合的なベンチマークである。
このベンチマークの信頼性はいくつかの点で確認されている。
論文 参考訳(メタデータ) (2024-10-04T15:15:36Z) - RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment [54.91736546490813]
本稿では,大規模言語モデルと特定の診断規則との整合性を考慮したルールアラインフレームワークを提案する。
患者と医師間の規則に基づくコミュニケーションを含む医療対話データセットを開発した。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-22T17:44:40Z) - Stochastic Parrots or ICU Experts? Large Language Models in Critical Care Medicine: A Scoping Review [3.993456293626592]
大規模言語モデル(LLM)は、自然言語理解、推論、生成において強力な能力を示している。
重度医療ユニット(ICU)の集中的モニタリングと介入を必要とする重度疾患患者の診断と治療を提供する。
論文 参考訳(メタデータ) (2024-07-27T13:41:43Z) - CliBench: A Multifaceted and Multigranular Evaluation of Large Language Models for Clinical Decision Making [16.310913127940857]
我々はMIMIC IVデータセットから開発された新しいベンチマークであるCliBenchを紹介する。
このベンチマークは、臨床診断におけるLSMの能力を包括的かつ現実的に評価する。
臨床診断の熟練度を評価するため,先進LSMのゼロショット評価を行った。
論文 参考訳(メタデータ) (2024-06-14T11:10:17Z) - Large Language Models in the Clinic: A Comprehensive Benchmark [63.21278434331952]
診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
まず、さまざまな臨床言語の生成、理解、推論タスクを含む11の既存のデータセットを収集します。
次に,現実の実践において複雑だが一般的である6つの新しいデータセットと臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文 参考訳(メタデータ) (2024-04-25T15:51:06Z) - MedKP: Medical Dialogue with Knowledge Enhancement and Clinical Pathway
Encoding [48.348511646407026]
本稿では,知識向上と臨床パスウェイ符号化フレームワークを用いた医療対話について紹介する。
このフレームワークは、医療知識グラフを介して外部知識増強モジュールと、医療機関および医師の行動を介して、内部臨床経路をコードする。
論文 参考訳(メタデータ) (2024-03-11T10:57:45Z) - Guiding Clinical Reasoning with Large Language Models via Knowledge Seeds [32.99251005719732]
臨床推論(英: Clinical reasoning)とは、医師が患者の評価と管理に用いている認知過程のことである。
本研究では,医学的知識によるLCMの強化を目的とした新しい枠組みであるICP(In-Context Padding)を提案する。
論文 参考訳(メタデータ) (2024-03-11T10:53:20Z) - Asclepius: A Spectrum Evaluation Benchmark for Medical Multi-Modal Large
Language Models [59.60384461302662]
医療マルチモーダル大言語モデル(Med-MLLM)を評価するための新しいベンチマークであるAsclepiusを紹介する。
Asclepiusは、異なる医療専門性と異なる診断能力の観点から、モデル能力の厳密かつ包括的に評価する。
また、6つのMed-MLLMの詳細な分析を行い、5人の専門家と比較した。
論文 参考訳(メタデータ) (2024-02-17T08:04:23Z) - MedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large
Language Models [56.36916128631784]
中国の医療分野の総合的なベンチマークであるMedBenchを紹介する。
このベンチマークは、中国の医療ライセンス試験、居住者標準化訓練試験、および現実世界のクリニックの4つの主要なコンポーネントで構成されている。
幅広い実験を行い, 多様な視点から詳細な分析を行い, 以下の結果を得た。
論文 参考訳(メタデータ) (2023-12-20T07:01:49Z) - Diagnostic Reasoning Prompts Reveal the Potential for Large Language
Model Interpretability in Medicine [4.773117448586697]
そこで我々は,大言語モデル(LLM)が臨床推論を実行し,正確な診断を行うことができるかどうかを,新たな診断推論プロンプトを開発した。
GPT4は診断精度を犠牲にすることなく臨床医の一般的な臨床推論過程を模倣することができる。
論文 参考訳(メタデータ) (2023-08-13T19:04:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。