論文の概要: MedAgents: Large Language Models as Collaborators for Zero-shot Medical
Reasoning
- arxiv url: http://arxiv.org/abs/2311.10537v1
- Date: Thu, 16 Nov 2023 11:47:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-20 14:32:37.986516
- Title: MedAgents: Large Language Models as Collaborators for Zero-shot Medical
Reasoning
- Title(参考訳): medagents: ゼロショット医療推論のコラボレータとしての大規模言語モデル
- Authors: Xiangru Tang, Anni Zou, Zhuosheng Zhang, Yilun Zhao, Xingyao Zhang,
Arman Cohan, Mark Gerstein
- Abstract要約: 大規模言語モデル(LLM)は医療や医療において重大な障壁に直面している。
我々は,ロールプレイング LLM ベースのエージェントを活用する医療領域のための,新しい多分野協調(MC)フレームワークを提案する。
このトレーニング不要で解釈可能なフレームワークは、ドメインの専門家を集め、個別の分析を提案し、分析結果をレポートにまとめ、合意に達するまで議論を繰り返し、最終的に決定する、という5つの重要なステップを含む。
- 参考スコア(独自算出の注目度): 36.87736316227058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs), despite their remarkable progress across
various general domains, encounter significant barriers in medicine and
healthcare. This field faces unique challenges such as domain-specific
terminologies and the reasoning over specialized knowledge. To address these
obstinate issues, we propose a novel Multi-disciplinary Collaboration (MC)
framework for the medical domain that leverages role-playing LLM-based agents
who participate in a collaborative multi-round discussion, thereby enhancing
LLM proficiency and reasoning capabilities. This training-free and
interpretable framework encompasses five critical steps: gathering domain
experts, proposing individual analyses, summarising these analyses into a
report, iterating over discussions until a consensus is reached, and ultimately
making a decision. Our work particularly focuses on the zero-shot scenario, our
results on nine data sets (MedQA, MedMCQA, PubMedQA, and six subtasks from
MMLU) establish that our proposed MC framework excels at mining and harnessing
the medical expertise in LLMs, as well as extending its reasoning abilities.
Based on these outcomes, we further conduct a human evaluation to pinpoint and
categorize common errors within our method, as well as ablation studies aimed
at understanding the impact of various factors on overall performance. Our code
can be found at \url{https://github.com/gersteinlab/MedAgents}.
- Abstract(参考訳): 大きな言語モデル(LLM)は、様々な一般領域で顕著な進歩を遂げているが、医療や医療において大きな障壁に直面している。
この分野はドメイン固有の用語や専門知識に対する推論といったユニークな課題に直面します。
これらの課題に対処するため、我々は、協調的な多ラウンド議論に参加するロールプレイング LLM エージェントを活用した医療領域のための新しい多分野連携(MC)フレームワークを提案する。
このトレーニングフリーで解釈可能なフレームワークは、ドメインエキスパートの収集、個人分析の提案、これらの分析をレポートにまとめ、コンセンサスに達するまで議論を反復し、最終的に決定する、という5つの重要なステップを包含する。
我々の研究は,9つのデータセット(MedQA, MedMCQA, PubMedQA, MMLUの6つのサブタスク)について行った結果から, LLMにおける医学的専門知識のマイニングと活用に優れたMCフレームワークであることが確認された。
これらの結果に基づいて,本手法の一般的な誤りの特定と分類を行うとともに,様々な要因が全体的な性能に与える影響を理解するためのアブレーション研究を行う。
我々のコードは \url{https://github.com/gersteinlab/MedAgents} にある。
関連論文リスト
- Tool Calling: Enhancing Medication Consultation via Retrieval-Augmented Large Language Models [10.04914417538886]
大規模言語モデル(LLM)は、様々な言語タスクで顕著な成功を収めてきたが、幻覚や時間的ミスアライメントに悩まされている。
従来のtextitRetrieve-then-Read の代わりに,新しい textitDistill-Retrieve-Read フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-27T13:11:42Z) - Adaptive Collaboration Strategy for LLMs in Medical Decision Making [40.979954284814895]
医療意思決定エージェント(MDAgents, Medical Decision-making Agents, MDAgents)は, LLMの効果的な協調構造を自動的に割り当てることによって, このギャップに対処することを目的としている。
割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手前の医療作業の複雑さに合わせて調整される。
MDAgentsは、マルチモーダル医療推論の理解を必要とする7つのベンチマークのうち5つで最高のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-04-22T06:30:05Z) - Large Multimodal Agents: A Survey [78.81459893884737]
大規模言語モデル(LLM)は、テキストベースのAIエージェントのパワーで優れたパフォーマンスを実現している。
LLMを利用したAIエージェントをマルチモーダルドメインに拡張することに焦点を当てた、新たな研究トレンドがある。
本総説は, この急速に発展する分野において, 今後の研究に有用な洞察とガイドラインを提供することを目的としている。
論文 参考訳(メタデータ) (2024-02-23T06:04:23Z) - Asclepius: A Spectrum Evaluation Benchmark for Medical Multi-Modal Large
Language Models [59.60384461302662]
医療マルチモーダル大言語モデル(Med-MLLM)を評価するための新しいベンチマークであるAsclepiusを紹介する。
Asclepiusは、異なる医療専門性と異なる診断能力の観点から、モデル能力の厳密かつ包括的に評価する。
また、6つのMed-MLLMの詳細な分析を行い、5人の専門家と比較した。
論文 参考訳(メタデータ) (2024-02-17T08:04:23Z) - MedSumm: A Multimodal Approach to Summarizing Code-Mixed Hindi-English
Clinical Queries [16.101969130235055]
本稿では,Multimodal Medical Codemixed Question Summarization MMCQSデータセットを紹介する。
このデータセットは、ヒンディー語と英語の混成医療クエリと視覚支援を組み合わせたものだ。
データセット、コード、トレーニング済みのモデルを公開します。
論文 参考訳(メタデータ) (2024-01-03T07:58:25Z) - LMM-Assisted Breast Cancer Treatment Target Segmentation with Consistency Embedding [49.40059830266193]
放射線腫瘍学の分野に適した多目的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
本モデルでは, 臨床ワークフローにおける一連のタスク, 臨床報告要約, 放射線治療計画提案, 計画指導対象ボリュームセグメンテーションを網羅する。
また, クリーン入力の処理能力を保ちながら, LMMの頑健さをノイズ入力に高める, CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z) - A Survey of Large Language Models in Medicine: Progress, Application,
and Challenge [86.4234483148876]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。
本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文 参考訳(メタデータ) (2023-11-09T02:55:58Z) - Large Language Models Illuminate a Progressive Pathway to Artificial
Healthcare Assistant: A Review [16.008511195589925]
大規模言語モデル(LLM)は、人間のレベルの言語理解と推論を模倣する有望な能力を示している。
本稿では,医学におけるLSMの応用と意義について概説する。
論文 参考訳(メタデータ) (2023-11-03T13:51:36Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。