論文の概要: MedAgents: Large Language Models as Collaborators for Zero-shot Medical
Reasoning
- arxiv url: http://arxiv.org/abs/2311.10537v2
- Date: Mon, 19 Feb 2024 18:26:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 04:46:53.092680
- Title: MedAgents: Large Language Models as Collaborators for Zero-shot Medical
Reasoning
- Title(参考訳): medagents: ゼロショット医療推論のコラボレータとしての大規模言語モデル
- Authors: Xiangru Tang, Anni Zou, Zhuosheng Zhang, Ziming Li, Yilun Zhao,
Xingyao Zhang, Arman Cohan, Mark Gerstein
- Abstract要約: 大規模言語モデル(LLM)は医療や医療において重大な障壁に直面している。
本稿では,LLMをベースとしたエージェントをロールプレイング環境で活用する医療分野のための,新しい多分野連携(MC)フレームワークを提案する。
私たちの研究は、現実世界のシナリオに適用可能なゼロショット設定に焦点を当てています。
- 参考スコア(独自算出の注目度): 37.34662825863483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs), despite their remarkable progress across
various general domains, encounter significant barriers in medicine and
healthcare. This field faces unique challenges such as domain-specific
terminologies and reasoning over specialized knowledge. To address these
issues, we propose a novel Multi-disciplinary Collaboration (MC) framework for
the medical domain that leverages LLM-based agents in a role-playing setting
that participate in a collaborative multi-round discussion, thereby enhancing
LLM proficiency and reasoning capabilities. This training-free framework
encompasses five critical steps: gathering domain experts, proposing individual
analyses, summarising these analyses into a report, iterating over discussions
until a consensus is reached, and ultimately making a decision. Our work
focuses on the zero-shot setting, which is applicable in real-world scenarios.
Experimental results on nine datasets (MedQA, MedMCQA, PubMedQA, and six
subtasks from MMLU) establish that our proposed MC framework excels at mining
and harnessing the medical expertise within LLMs, as well as extending its
reasoning abilities. Our code can be found at
\url{https://github.com/gersteinlab/MedAgents}.
- Abstract(参考訳): 大きな言語モデル(LLM)は、様々な一般領域で顕著な進歩を遂げているが、医療や医療において大きな障壁に直面している。
この分野はドメイン固有の用語や専門知識に対する推論といったユニークな課題に直面します。
そこで本研究では,医療領域における多学際コラボレーション(mc)フレームワークを提案する。このフレームワークはロールプレイング・セッティングにおいてllmベースのエージェントを活用し,協調的な多学際議論に参加し,llmの熟練度と推論能力を高める。
このトレーニングフリーフレームワークは、ドメインエキスパートの収集、個人分析の提案、これらの分析をレポートに要約し、コンセンサスに達するまで議論を反復し、最終的に決定する、という5つの重要なステップを包含する。
本研究は,実世界のシナリオに適用可能なゼロショット設定に着目した。
9つのデータセット(MedQA、MedMCQA、PubMedQA、MMLUの6つのサブタスク)の実験結果から、提案したMCフレームワークは、LSM内の医療専門知識のマイニングと活用に優れ、推論能力の拡充を図っていることが判明した。
我々のコードは \url{https://github.com/gersteinlab/MedAgents} にある。
関連論文リスト
- Tool Calling: Enhancing Medication Consultation via Retrieval-Augmented Large Language Models [10.04914417538886]
大規模言語モデル(LLM)は、様々な言語タスクで顕著な成功を収めてきたが、幻覚や時間的ミスアライメントに悩まされている。
従来のtextitRetrieve-then-Read の代わりに,新しい textitDistill-Retrieve-Read フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-27T13:11:42Z) - Adaptive Collaboration Strategy for LLMs in Medical Decision Making [40.979954284814895]
医療意思決定エージェント(MDAgents, Medical Decision-making Agents, MDAgents)は, LLMの効果的な協調構造を自動的に割り当てることによって, このギャップに対処することを目的としている。
割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手前の医療作業の複雑さに合わせて調整される。
MDAgentsは、マルチモーダル医療推論の理解を必要とする7つのベンチマークのうち5つで最高のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-04-22T06:30:05Z) - Large Multimodal Agents: A Survey [78.81459893884737]
大規模言語モデル(LLM)は、テキストベースのAIエージェントのパワーで優れたパフォーマンスを実現している。
LLMを利用したAIエージェントをマルチモーダルドメインに拡張することに焦点を当てた、新たな研究トレンドがある。
本総説は, この急速に発展する分野において, 今後の研究に有用な洞察とガイドラインを提供することを目的としている。
論文 参考訳(メタデータ) (2024-02-23T06:04:23Z) - Asclepius: A Spectrum Evaluation Benchmark for Medical Multi-Modal Large
Language Models [59.60384461302662]
医療マルチモーダル大言語モデル(Med-MLLM)を評価するための新しいベンチマークであるAsclepiusを紹介する。
Asclepiusは、異なる医療専門性と異なる診断能力の観点から、モデル能力の厳密かつ包括的に評価する。
また、6つのMed-MLLMの詳細な分析を行い、5人の専門家と比較した。
論文 参考訳(メタデータ) (2024-02-17T08:04:23Z) - MedSumm: A Multimodal Approach to Summarizing Code-Mixed Hindi-English
Clinical Queries [16.101969130235055]
本稿では,Multimodal Medical Codemixed Question Summarization MMCQSデータセットを紹介する。
このデータセットは、ヒンディー語と英語の混成医療クエリと視覚支援を組み合わせたものだ。
データセット、コード、トレーニング済みのモデルを公開します。
論文 参考訳(メタデータ) (2024-01-03T07:58:25Z) - LMM-Assisted Breast Cancer Treatment Target Segmentation with Consistency Embedding [49.40059830266193]
放射線腫瘍学の分野に適した多目的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
本モデルでは, 臨床ワークフローにおける一連のタスク, 臨床報告要約, 放射線治療計画提案, 計画指導対象ボリュームセグメンテーションを網羅する。
また, クリーン入力の処理能力を保ちながら, LMMの頑健さをノイズ入力に高める, CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z) - A Survey of Large Language Models in Medicine: Progress, Application,
and Challenge [86.4234483148876]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。
本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文 参考訳(メタデータ) (2023-11-09T02:55:58Z) - Large Language Models Illuminate a Progressive Pathway to Artificial
Healthcare Assistant: A Review [16.008511195589925]
大規模言語モデル(LLM)は、人間のレベルの言語理解と推論を模倣する有望な能力を示している。
本稿では,医学におけるLSMの応用と意義について概説する。
論文 参考訳(メタデータ) (2023-11-03T13:51:36Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。