Fugu-MT 論文翻訳(概要): MedAgents: Large Language Models as Collaborators for Zero-shot Medical Reasoning

論文の概要: MedAgents: Large Language Models as Collaborators for Zero-shot Medical Reasoning

arxiv url: http://arxiv.org/abs/2311.10537v1
Date: Thu, 16 Nov 2023 11:47:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-20 14:32:37.986516
Title: MedAgents: Large Language Models as Collaborators for Zero-shot Medical Reasoning
Title（参考訳）: medagents: ゼロショット医療推論のコラボレータとしての大規模言語モデル
Authors: Xiangru Tang, Anni Zou, Zhuosheng Zhang, Yilun Zhao, Xingyao Zhang, Arman Cohan, Mark Gerstein
Abstract要約: 大規模言語モデル(LLM)は医療や医療において重大な障壁に直面している。我々は,ロールプレイング LLM ベースのエージェントを活用する医療領域のための,新しい多分野協調(MC)フレームワークを提案する。このトレーニング不要で解釈可能なフレームワークは、ドメインの専門家を集め、個別の分析を提案し、分析結果をレポートにまとめ、合意に達するまで議論を繰り返し、最終的に決定する、という5つの重要なステップを含む。
参考スコア（独自算出の注目度）: 36.87736316227058
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs), despite their remarkable progress across various general domains, encounter significant barriers in medicine and healthcare. This field faces unique challenges such as domain-specific terminologies and the reasoning over specialized knowledge. To address these obstinate issues, we propose a novel Multi-disciplinary Collaboration (MC) framework for the medical domain that leverages role-playing LLM-based agents who participate in a collaborative multi-round discussion, thereby enhancing LLM proficiency and reasoning capabilities. This training-free and interpretable framework encompasses five critical steps: gathering domain experts, proposing individual analyses, summarising these analyses into a report, iterating over discussions until a consensus is reached, and ultimately making a decision. Our work particularly focuses on the zero-shot scenario, our results on nine data sets (MedQA, MedMCQA, PubMedQA, and six subtasks from MMLU) establish that our proposed MC framework excels at mining and harnessing the medical expertise in LLMs, as well as extending its reasoning abilities. Based on these outcomes, we further conduct a human evaluation to pinpoint and categorize common errors within our method, as well as ablation studies aimed at understanding the impact of various factors on overall performance. Our code can be found at \url{https://github.com/gersteinlab/MedAgents}.
Abstract（参考訳）: 大きな言語モデル(LLM)は、様々な一般領域で顕著な進歩を遂げているが、医療や医療において大きな障壁に直面している。この分野はドメイン固有の用語や専門知識に対する推論といったユニークな課題に直面します。これらの課題に対処するため、我々は、協調的な多ラウンド議論に参加するロールプレイング LLM エージェントを活用した医療領域のための新しい多分野連携(MC)フレームワークを提案する。このトレーニングフリーで解釈可能なフレームワークは、ドメインエキスパートの収集、個人分析の提案、これらの分析をレポートにまとめ、コンセンサスに達するまで議論を反復し、最終的に決定する、という5つの重要なステップを包含する。我々の研究は,9つのデータセット(MedQA, MedMCQA, PubMedQA, MMLUの6つのサブタスク)について行った結果から, LLMにおける医学的専門知識のマイニングと活用に優れたMCフレームワークであることが確認された。これらの結果に基づいて,本手法の一般的な誤りの特定と分類を行うとともに,様々な要因が全体的な性能に与える影響を理解するためのアブレーション研究を行う。我々のコードは \url{https://github.com/gersteinlab/MedAgents} にある。

関連論文リスト

Mediator-Guided Multi-Agent Collaboration among Open-Source Models for Medical Decision-Making [18.640622974004724]
多様な視覚言語モデル(VLM)の盲目の組み合わせは、誤った結果の解釈を増幅することができる。医療マルチモーダル意思決定のためのメディエータ誘導型マルチエージェント協調フレームワークであるMedOrchを提案する。我々は、異なるVLMエージェント内の協調が、個々のエージェントの能力を超えることができることを示す。
論文参考訳（メタデータ） (2025-08-08T04:02:10Z)
MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [57.98393950821579]
マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文参考訳（メタデータ） (2025-06-24T17:52:43Z)
MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.63542462400175]
医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。 5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文参考訳（メタデータ） (2025-05-31T13:22:55Z)
LLM-MedQA: Enhancing Medical Question Answering through Case Studies in Large Language Models [18.6994780408699]
大規模言語モデル (LLM) は、医学的質問応答において重大な課題に直面している。マルチエージェント医療質問応答システムに類似の事例生成を取り入れた新しい手法を提案する。本手法は, モデル固有の医療知識と推論能力を活用し, 追加のトレーニングデータの必要性を解消する。
論文参考訳（メタデータ） (2024-12-31T19:55:45Z)
MedAide: Towards an Omni Medical Aide via Specialized LLM-based Multi-Agent Collaboration [16.062646854608094]
大規模言語モデル(LLM)による対話システムは、現在医療分野において潜在的に有望であることを示している。本稿では,医療専門サービスのためのオムニ・メディカル・マルチエージェント・コラボレーション・フレームワークであるMedAideを提案する。
論文参考訳（メタデータ） (2024-10-16T13:10:27Z)
Towards Evaluating and Building Versatile Large Language Models for Medicine [57.49547766838095]
MedS-Benchは大規模言語モデル(LLM)の性能を臨床的に評価するためのベンチマークである。 MedS-Benchは、臨床報告の要約、治療勧告、診断、名前付きエンティティ認識、医療概念説明を含む、11のハイレベルな臨床タスクにまたがる。 MedS-Insは58の医療指向言語コーパスで構成され、112のタスクで1350万のサンプルを収集している。
論文参考訳（メタデータ） (2024-08-22T17:01:34Z)
TCMD: A Traditional Chinese Medicine QA Dataset for Evaluating Large Language Models [22.76485170022542]
従来の中国医学検査課題を解くための大規模な手動指導を含む,新しいQAデータセットを提案する。 TCMDは、注釈付き医療科目で、さまざまな領域にまたがって大量の質問を集めています。
論文参考訳（メタデータ） (2024-06-07T13:48:15Z)
Inquire, Interact, and Integrate: A Proactive Agent Collaborative Framework for Zero-Shot Multimodal Medical Reasoning [21.562034852024272]
医療における大規模言語モデル(LLM)の導入は、大きな研究関心を集めている。ほとんどの最先端のLCMは、マルチモーダル入力を直接処理できない、単調でテキストのみのモデルである。医療マルチモーダル推論問題を解決するために,マルチモーダル医療協調推論フレームワーク textbfMultiMedRes を提案する。
論文参考訳（メタデータ） (2024-05-19T18:26:11Z)
COGNET-MD, an evaluation framework and dataset for Large Language Model benchmarks in the medical domain [1.6752458252726457]
大規模言語モデル(LLM)は最先端の人工知能(AI)技術である。医療領域認知ネットワーク評価ツールキット(COGNET-MD)について概説する。医用テキストの解釈におけるLCMの能力を評価するのが困難であるスコアフレームを提案する。
論文参考訳（メタデータ） (2024-05-17T16:31:56Z)
MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making [45.74980058831342]
MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手元にある医療タスクに合わせて調整される。 MDAgentsは医療知識の理解を必要とするタスクに関する10のベンチマークのうち7つのベンチマークで最高のパフォーマンスを達成した。
論文参考訳（メタデータ） (2024-04-22T06:30:05Z)
Large Multimodal Agents: A Survey [78.81459893884737]
大規模言語モデル(LLM)は、テキストベースのAIエージェントのパワーで優れたパフォーマンスを実現している。 LLMを利用したAIエージェントをマルチモーダルドメインに拡張することに焦点を当てた、新たな研究トレンドがある。本総説は, この急速に発展する分野において, 今後の研究に有用な洞察とガイドラインを提供することを目的としている。
論文参考訳（メタデータ） (2024-02-23T06:04:23Z)
Asclepius: A Spectrum Evaluation Benchmark for Medical Multi-Modal Large Language Models [59.60384461302662]
医療マルチモーダル大言語モデル(Med-MLLM)を評価するための新しいベンチマークであるAsclepiusを紹介する。 Asclepiusは、異なる医療専門性と異なる診断能力の観点から、モデル能力の厳密かつ包括的に評価する。また、6つのMed-MLLMの詳細な分析を行い、5人の専門家と比較した。
論文参考訳（メタデータ） (2024-02-17T08:04:23Z)
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文参考訳（メタデータ） (2024-02-15T06:46:48Z)
A Survey of Large Language Models in Medicine: Progress, Application, and Challenge [85.09998659355038]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文参考訳（メタデータ） (2023-11-09T02:55:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。