論文の概要: Generative Large Language Models are autonomous practitioners of
evidence-based medicine
- arxiv url: http://arxiv.org/abs/2401.02851v1
- Date: Fri, 5 Jan 2024 15:09:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-08 14:53:38.440819
- Title: Generative Large Language Models are autonomous practitioners of
evidence-based medicine
- Title(参考訳): 生成型大規模言語モデルはエビデンスベースの医療の自律的実践者である
- Authors: Akhil Vaid, Joshua Lampert, Juhee Lee, Ashwin Sawant, Donald Apakama,
Ankit Sakhuja, Ali Soroush, Denise Lee, Isotta Landi, Nicole Bussola, Ismail
Nabeel, Robbie Freeman, Patricia Kovatch, Brendan Carr, Benjamin Glicksberg,
Edgar Argulian, Stamatios Lerakis, Monica Kraft, Alexander Charney, Girish
Nadkarni
- Abstract要約: EBM(エビデンス・ベース・メディカル)は、臨床医学の基礎であり、臨床医が継続的に知識を更新し、患者医療に最良の臨床証拠を適用する必要がある。
EBMの実践は、医学研究の急速な進歩による課題に直面し、臨床医に情報過負荷をもたらす。
人工知能(AI)の統合、特にジェネレーティブ・大型言語モデル(LLM)は、この複雑さを管理するための有望なソリューションを提供する。
- 参考スコア(独自算出の注目度): 27.229179922424063
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Background: Evidence-based medicine (EBM) is fundamental to modern clinical
practice, requiring clinicians to continually update their knowledge and apply
the best clinical evidence in patient care. The practice of EBM faces
challenges due to rapid advancements in medical research, leading to
information overload for clinicians. The integration of artificial intelligence
(AI), specifically Generative Large Language Models (LLMs), offers a promising
solution towards managing this complexity.
Methods: This study involved the curation of real-world clinical cases across
various specialties, converting them into .json files for analysis. LLMs,
including proprietary models like ChatGPT 3.5 and 4, Gemini Pro, and
open-source models like LLaMA v2 and Mixtral-8x7B, were employed. These models
were equipped with tools to retrieve information from case files and make
clinical decisions similar to how clinicians must operate in the real world.
Model performance was evaluated based on correctness of final answer, judicious
use of tools, conformity to guidelines, and resistance to hallucinations.
Results: GPT-4 was most capable of autonomous operation in a clinical
setting, being generally more effective in ordering relevant investigations and
conforming to clinical guidelines. Limitations were observed in terms of model
ability to handle complex guidelines and diagnostic nuances. Retrieval
Augmented Generation made recommendations more tailored to patients and
healthcare systems.
Conclusions: LLMs can be made to function as autonomous practitioners of
evidence-based medicine. Their ability to utilize tooling can be harnessed to
interact with the infrastructure of a real-world healthcare system and perform
the tasks of patient management in a guideline directed manner. Prompt
engineering may help to further enhance this potential and transform healthcare
for the clinician and the patient.
- Abstract(参考訳): 背景: Evidence-based Medicine (EBM) は現代の臨床実践の基本であり、臨床医は継続的に知識を更新し、患者に最良の臨床証拠を適用する必要がある。
EBMの実践は、医学研究の急速な進歩による課題に直面し、臨床医に情報過負荷をもたらす。
人工知能(AI)の統合、特にジェネレーティブ大型言語モデル(LLM)は、この複雑さを管理するための有望なソリューションを提供する。
方法: 本研究は, 各種専門分野における実地臨床症例のキュレーションにかかわって, それらを.
分析用のjsonファイル。
LLMはChatGPT 3.5や4、Gemini Pro、LLaMA v2やMixtral-8x7Bといったオープンソースのモデルを含む。
これらのモデルには、ケースファイルから情報を取得し、臨床医が現実世界で行うべき方法と同様の臨床判断を行うためのツールが備わっていた。
モデル性能は最終回答の正確性,ツールの公平な使用,ガイドラインへの適合性,幻覚に対する抵抗などに基づいて評価された。
結果: GPT-4は, 臨床現場での自律的な手術が可能で, 関連調査の発注や臨床ガイドラインの遵守に有効であった。
複雑なガイドラインや診断ニュアンスを扱うモデル能力の観点から,限界が認められた。
Retrieval Augmented Generationは、患者や医療システムに合わせた推奨を行った。
結論: LLMはエビデンスベースの医療の自律的な実践者として機能させることができる。
ツールを活用する能力は、現実世界の医療システムのインフラと相互作用し、ガイドラインに指示された方法で患者管理のタスクを実行するために利用することができる。
プロンプトエンジニアリングは、この可能性をさらに強化し、臨床医と患者の医療を変えるのに役立つかもしれない。
関連論文リスト
- Training Small Multimodal Models to Bridge Biomedical Competency Gap: A
Case Study in Radiology Imaging [114.43429928419755]
バイオメディカル・コンピテンシー・ギャップを橋渡しするオープンソース小型マルチモーダル・モデル(SMM)の訓練について検討する。
LLaVA-Radは高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Guiding Clinical Reasoning with Large Language Models via Knowledge
Seeds [37.080274964170094]
臨床推論(英: Clinical reasoning)とは、医師が患者の評価と管理に用いている認知過程のことである。
本研究では,医学的知識によるLCMの強化を目的とした新しい枠組みであるICP(In-Context Padding)を提案する。
論文 参考訳(メタデータ) (2024-03-11T10:53:20Z) - AI Hospital: Interactive Evaluation and Collaboration of LLMs as Intern
Doctors for Clinical Diagnosis [72.50974375416239]
リアルタイムのインタラクティブな診断環境を構築するために設計されたフレームワークであるAI Hospitalを紹介する。
様々な大規模言語モデル(LLM)は、対話的診断のためのインターン医師として機能する。
我々は,医療部長の監督の下で,反復的な議論と紛争解決プロセスを含む協調的なメカニズムを導入する。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - Large Language Models Illuminate a Progressive Pathway to Artificial
Healthcare Assistant: A Review [16.008511195589925]
大規模言語モデル(LLM)は、人間のレベルの言語理解と推論を模倣する有望な能力を示している。
本稿では,医学におけるLSMの応用と意義について概説する。
論文 参考訳(メタデータ) (2023-11-03T13:51:36Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Retrieve, Reason, and Refine: Generating Accurate and Faithful Patient
Instructions [65.11629300465812]
臨床作業量を削減しつつ,不完全性を回避する客観的な手段を提供する新しい課題を提案する。
Re3Writerは医師の作業パターンを模倣し、医師によって書かれた歴史的なPIから関連する作業経験を最初に取得する。
その後、回収された作業経験を洗練させ、医療知識を推論して有用な情報を抽出する。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - VBridge: Connecting the Dots Between Features, Explanations, and Data
for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。
我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。
症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文 参考訳(メタデータ) (2021-08-04T17:34:13Z) - IT ambidexterity driven patient agility and hospital patient service
performance: a variance approach [0.0]
本稿では,病院部門が企業の新たなIT資源と実践を同時に探求する能力をどのように活用できるかを検討する。
研究モデルを開発し、オランダの90の臨床病院の横断的なデータを用いてテストする。
研究結果は、理論化されたモデルを支持し、臨床実践を変革し、患者の機敏性を促進する方法に光を当てる。
論文 参考訳(メタデータ) (2021-07-20T11:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。