論文の概要: Expertise-aware Multi-LLM Recruitment and Collaboration for Medical Decision-Making
- arxiv url: http://arxiv.org/abs/2508.13754v1
- Date: Tue, 19 Aug 2025 11:51:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.906488
- Title: Expertise-aware Multi-LLM Recruitment and Collaboration for Medical Decision-Making
- Title(参考訳): 医療意思決定のための専門家対応マルチLLMリクルートとコラボレーション
- Authors: Liuxin Bao, Zhihao Peng, Xiaofei Zhou, Runmin Cong, Jiyong Zhang, Yixuan Yuan,
- Abstract要約: 本稿では,MDMシステムの精度と信頼性を高めるために,EMRC(Expertise-aware Multi-LLM Recruitment and Collaboration)フレームワークを提案する。
i) 専門知識を意識したエージェント採用と(ii) 信頼と敵主導のマルチエージェントコラボレーションの2段階で活動する。
我々は,EMRCフレームワークを3つの公開MDMデータセット上で評価し,EMRCが最先端の単一LLM法とマルチLLM法より優れていることを示す。
- 参考スコア(独自算出の注目度): 44.18785040972984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical Decision-Making (MDM) is a complex process requiring substantial domain-specific expertise to effectively synthesize heterogeneous and complicated clinical information. While recent advancements in Large Language Models (LLMs) show promise in supporting MDM, single-LLM approaches are limited by their parametric knowledge constraints and static training corpora, failing to robustly integrate the clinical information. To address this challenge, we propose the Expertise-aware Multi-LLM Recruitment and Collaboration (EMRC) framework to enhance the accuracy and reliability of MDM systems. It operates in two stages: (i) expertise-aware agent recruitment and (ii) confidence- and adversarial-driven multi-agent collaboration. Specifically, in the first stage, we use a publicly available corpus to construct an LLM expertise table for capturing expertise-specific strengths of multiple LLMs across medical department categories and query difficulty levels. This table enables the subsequent dynamic selection of the optimal LLMs to act as medical expert agents for each medical query during the inference phase. In the second stage, we employ selected agents to generate responses with self-assessed confidence scores, which are then integrated through the confidence fusion and adversarial validation to improve diagnostic reliability. We evaluate our EMRC framework on three public MDM datasets, where the results demonstrate that our EMRC outperforms state-of-the-art single- and multi-LLM methods, achieving superior diagnostic performance. For instance, on the MMLU-Pro-Health dataset, our EMRC achieves 74.45% accuracy, representing a 2.69% improvement over the best-performing closed-source model GPT- 4-0613, which demonstrates the effectiveness of our expertise-aware agent recruitment strategy and the agent complementarity in leveraging each LLM's specialized capabilities.
- Abstract(参考訳): MDM(Messical Decision-Making)は、異種および複雑な臨床情報を効果的に合成するために、ドメイン固有の専門知識を必要とする複雑なプロセスである。
近年のLarge Language Models (LLM) の進歩は,MDMをサポートする上での有望性を示しているが,単一LLMアプローチはパラメトリック知識制約や静的トレーニングコーパスによって制限されており,臨床情報をしっかりと統合することができない。
この課題に対処するために,MDMシステムの精度と信頼性を高めるために,エキスパート対応マルチLLMリクルート・コラボレーション(EMRC)フレームワークを提案する。
2つの段階に分かれている。
一 専門知識を有するエージェントの募集及び募集
(二) 信頼と敵主導のマルチエージェントコラボレーション。
特に,第1段階では,医療部門における複数のLSMの専門性や問合せ難易度を把握するための専門知識表を構築するために,公開コーパスを用いている。
このテーブルは、推論フェーズ中の各医療クエリに対して、最適なLSMを動的に選択し、医療専門家エージェントとして機能させる。
第2段階では、選択されたエージェントを用いて自己評価された信頼度スコアの応答を生成し、信頼融合と逆検証を通じて統合し、診断信頼性を向上させる。
我々はEMRCフレームワークを3つの公開MDMデータセット上で評価し、その結果、EMRCが最先端のシングル/マルチLLM法より優れ、診断性能が優れていることを示した。
例えば、MMLU-Pro-Healthデータセットにおいて、EMRCは74.45%の精度を達成し、最高のパフォーマンスのクローズドソースモデルであるGPT-4-0613よりも2.69%改善した。
関連論文リスト
- MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [57.98393950821579]
マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。
我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。
このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文 参考訳(メタデータ) (2025-06-24T17:52:43Z) - MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.63542462400175]
医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。
具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。
5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文 参考訳(メタデータ) (2025-05-31T13:22:55Z) - DDO: Dual-Decision Optimization via Multi-Agent Collaboration for LLM-Based Medical Consultation [10.348275814202848]
大規模言語モデル(LLM)は強力な一般化と推論能力を示す。
textbfDDO, textbfDual-textbfDecision textbfOptimization by decoupling and independently optimization the two sub-tasks。
論文 参考訳(メタデータ) (2025-05-24T10:26:57Z) - MedAgentBoard: Benchmarking Multi-Agent Collaboration with Conventional Methods for Diverse Medical Tasks [17.567786780266353]
我々はMedAgentBoardを紹介する。MedAgentBoardは、マルチエージェントコラボレーション、シングルLLM、および従来のアプローチの体系的評価のための総合的なベンチマークである。
MedAgentBoardには、医療(視覚)質問応答、レイサマリ生成、構造化電子健康記録(EHR)予測モデリング、臨床ワークフロー自動化の4つの多様な医療タスクカテゴリが含まれている。
マルチエージェントコラボレーションは特定のシナリオにおいてメリットを示すが、高度な単一LLMを一貫して上回るものではない。
論文 参考訳(メタデータ) (2025-05-18T11:28:17Z) - MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making [45.74980058831342]
MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。
割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手元にある医療タスクに合わせて調整される。
MDAgentsは医療知識の理解を必要とするタスクに関する10のベンチマークのうち7つのベンチマークで最高のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-04-22T06:30:05Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。