Fugu-MT 論文翻訳(概要): Augmenting Black-box LLMs with Medical Textbooks for Clinical Question Answering

論文の概要: Augmenting Black-box LLMs with Medical Textbooks for Clinical Question Answering

arxiv url: http://arxiv.org/abs/2309.02233v1
Date: Tue, 5 Sep 2023 13:39:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-06 14:35:03.440973
Title: Augmenting Black-box LLMs with Medical Textbooks for Clinical Question Answering
Title（参考訳）: 医療用教科書を用いたブラックボックス式LCMの臨床質問応答
Authors: Yubo Wang, Xueguang Ma, Wenhu Chen
Abstract要約: 大規模言語モデル(LLM)は、タスク指向の対話や質問応答といった下流タスクに対して、人間のような応答を生成することができる。本稿では,医学教科書を用いた大規模言語モデル (LLM-AMT) について紹介する。実験の結果,教科書の増補はウィキペディアの増補よりも9.7%から12.2%に向上した。
参考スコア（独自算出の注目度）: 54.13933019557655
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large-scale language models (LLMs), such as ChatGPT, are capable of generating human-like responses for various downstream tasks, such as task-oriented dialogues and question answering. However, applying LLMs to medical domains remains challenging due to their inability to leverage domain-specific knowledge. In this study, we present the Large-scale Language Models Augmented with Medical Textbooks (LLM-AMT), which integrates authoritative medical textbooks as the cornerstone of its design, enhancing its proficiency in the specialized domain through plug-and-play modules, comprised of a Hybrid Textbook Retriever, supplemented by the Query Augmenter and the LLM Reader. Experimental evaluation on three open-domain medical question-answering tasks reveals a substantial enhancement in both the professionalism and accuracy of the LLM responses when utilizing LLM-AMT, exhibiting an improvement ranging from 11.4% to 13.2%. Despite being 100 times smaller, we found that medical textbooks as the retrieval corpus serves as a more valuable external knowledge source than Wikipedia in the medical domain. Our experiments show that textbook augmentation results in a performance improvement ranging from 9.7% to 12.2% over Wikipedia augmentation.
Abstract（参考訳）: ChatGPTのような大規模言語モデル(LLM)は、タスク指向の対話や質問応答など、さまざまな下流タスクに対してヒューマンライクな応答を生成することができる。しかし、LLMを医学領域に適用することは、ドメイン固有の知識を活用できないため、依然として困難である。本研究では,医療用テキストを付加した大規模言語モデル (LLM-AMT) を提案し,その設計の基盤として権威ある医療用教科書を統合し,クエリ・オーグメンタとLCMリーダによって補完されたハイブリッドテキストブック・レトリバーからなるプラグイン・アンド・プレイ・モジュールを通じて,特定のドメインにおける習熟度を高めた。 3つのオープンドメイン医療質問応答タスクに対する実験的評価は、LSM-AMTを利用する場合のプロ主義とLSM応答の精度の両方が大幅に向上し、11.4%から13.2%の改善が見られた。検索コーパスとしての医学教科書は,100倍小さいにもかかわらず,医学領域におけるウィキペディアよりも貴重な外部知識源であることがわかった。実験の結果,教科書の増補はウィキペディアの増補よりも9.7%から12.2%に向上した。

関連論文リスト

MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [57.98393950821579]
マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文参考訳（メタデータ） (2025-06-24T17:52:43Z)
MIRIAD: Augmenting LLMs with millions of medical query-response pairs [36.32674607022871]
医療用QAペア5,821,948の大規模キュレートコーパスであるMIRIADを紹介する。また,MIRIADの精度はRAGベースラインに比べて6.7%向上した。 56の医学分野にまたがるMIRIADのインタラクティブマップであるMIRIAD-Atlasについても紹介する。
論文参考訳（メタデータ） (2025-06-06T13:52:32Z)
Fact or Guesswork? Evaluating Large Language Model's Medical Knowledge with Structured One-Hop Judgment [108.55277188617035]
大規模言語モデル(LLM)は、様々な下流タスクドメインで広く採用されているが、実際の医学的知識を直接呼び起こし適用する能力はいまだ探索されていない。既存の医療QAベンチマークの多くは、複雑な推論やマルチホップ推論を評価しており、LSM固有の医療知識を推論能力から切り離すことが困難である。 LLMの1ホップの医療知識を測定するために特別に設計されたデータセットであるMedical Knowledge Judgmentを紹介する。
論文参考訳（メタデータ） (2025-02-20T05:27:51Z)
MedG-KRP: Medical Graph Knowledge Representation Probing [0.6496030410305753]
大規模言語モデル(LLM)は、最近、強力なツールとして登場し、多くの医学的応用を見つけている。 LLMの生物医学的推論能力を評価するための知識グラフ(KG)に基づく手法を提案する。 GPT-4, Llama3-70b, PalmyraMed-70bは, 特殊な医療モデルである。
論文参考訳（メタデータ） (2024-12-14T22:23:20Z)
MEG: Medical Knowledge-Augmented Large Language Models for Question Answering [37.3562521243773]
本稿では,医療知識を付加したLCMのパラメータ効率向上手法であるMEGを提案する。本手法は,4つの医用マルチチョイスデータセットを用いて評価する。
論文参考訳（メタデータ） (2024-11-06T12:57:58Z)
SeRTS: Self-Rewarding Tree Search for Biomedical Retrieval-Augmented Generation [50.26966969163348]
大規模言語モデル(LLM)は,検索増強世代(RAG)の進展に伴い,生物医学領域において大きな可能性を示した。既存の検索強化アプローチは、様々なクエリやドキュメント、特に医療知識クエリに対処する上で、課題に直面している。モンテカルロ木探索(MCTS)と自己回帰パラダイムに基づく自己回帰木探索(SeRTS)を提案する。
論文参考訳（メタデータ） (2024-06-17T06:48:31Z)
MedREQAL: Examining Medical Knowledge Recall of Large Language Models via Question Answering [5.065947993017158]
大きな言語モデル(LLM)は、大きなテキストコーパスで事前学習中に知識を符号化する印象的な能力を示している。体系的レビューから得られた新しいデータセットを構築することにより, LLMが医療知識のリコールを示す能力について検討する。
論文参考訳（メタデータ） (2024-06-09T16:33:28Z)
OpenMedLM: Prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models [4.556924372105915]
オープンソース(OS)モデルは、医療用LDMにとって重要な成長領域である。医用ベンチマークでOS LLMに対してSOTA(State-of-the-art)パフォーマンスを提供するプロンプトプラットフォームであるOpenMedLMを提案する。
論文参考訳（メタデータ） (2024-02-29T17:19:39Z)
MEDITRON-70B: Scaling Medical Pretraining for Large Language Models [91.25119823784705]
大きな言語モデル(LLM)は、医療知識へのアクセスを民主化することができる。医療領域に適応した7Bおよび70BパラメータのオープンソースLLMスイートであるMEDITRONをリリースする。
論文参考訳（メタデータ） (2023-11-27T18:49:43Z)
ChiMed-GPT: A Chinese Medical Large Language Model with Full Training Regime and Better Alignment to Human Preferences [51.66185471742271]
我々は中国医学領域向けに明示的に設計されたベンチマークLSMであるChiMed-GPTを提案する。 ChiMed-GPTは、事前訓練、SFT、RLHFを含む総合的な訓練体制を実施。我々は,ChiMed-GPTを患者識別に関する態度尺度の実行を促すことによって,潜在的なバイアスを分析した。
論文参考訳（メタデータ） (2023-11-10T12:25:32Z)
A Survey of Large Language Models in Medicine: Progress, Application, and Challenge [85.09998659355038]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文参考訳（メタデータ） (2023-11-09T02:55:58Z)
Integrating UMLS Knowledge into Large Language Models for Medical Question Answering [18.06960842747575]
大規模言語モデル(LLM)は強力なテキスト生成能力を示し、医療分野に前例のない革新をもたらした。我々は、医療コミュニティにより良いサービスを提供することを目的として、UMLS(Unified Medical Language System)に基づく拡張LLMフレームワークを開発する。ベンチマークモデルとしてLLaMa2-13b-chatとChatGPT-3.5を採用し、LiveQAテストセットから104の質問に対してROUGEスコアとBERTScoreを用いて自動評価を行う。
論文参考訳（メタデータ） (2023-10-04T12:50:26Z)
MKRAG: Medical Knowledge Retrieval Augmented Generation for Medical Question Answering [45.84961106102445]
大規模言語モデル(LLM)は、医療質問応答(QA)のようなドメイン固有のタスクでよく機能しないことが多い。本稿では,医学的事実を外部知識ベースから抽出し,LLMのクエリプロンプトに注入するための総合的検索手法を提案する。 Vicuna-7Bは44.46%から48.54%の精度向上を示した。
論文参考訳（メタデータ） (2023-09-27T21:26:03Z)
MedAlign: A Clinician-Generated Dataset for Instruction Following with Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文参考訳（メタデータ） (2023-08-27T12:24:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。