Fugu-MT 論文翻訳(概要): Expertise-aware Multi-LLM Recruitment and Collaboration for Medical Decision-Making

論文の概要: Expertise-aware Multi-LLM Recruitment and Collaboration for Medical Decision-Making

arxiv url: http://arxiv.org/abs/2508.13754v1
Date: Tue, 19 Aug 2025 11:51:15 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-20 15:36:31.906488
Title: Expertise-aware Multi-LLM Recruitment and Collaboration for Medical Decision-Making
Title（参考訳）: 医療意思決定のための専門家対応マルチLLMリクルートとコラボレーション
Authors: Liuxin Bao, Zhihao Peng, Xiaofei Zhou, Runmin Cong, Jiyong Zhang, Yixuan Yuan,
Abstract要約: 本稿では,MDMシステムの精度と信頼性を高めるために,EMRC(Expertise-aware Multi-LLM Recruitment and Collaboration)フレームワークを提案する。 i) 専門知識を意識したエージェント採用と(ii) 信頼と敵主導のマルチエージェントコラボレーションの2段階で活動する。我々は,EMRCフレームワークを3つの公開MDMデータセット上で評価し,EMRCが最先端の単一LLM法とマルチLLM法より優れていることを示す。
参考スコア（独自算出の注目度）: 44.18785040972984
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Medical Decision-Making (MDM) is a complex process requiring substantial domain-specific expertise to effectively synthesize heterogeneous and complicated clinical information. While recent advancements in Large Language Models (LLMs) show promise in supporting MDM, single-LLM approaches are limited by their parametric knowledge constraints and static training corpora, failing to robustly integrate the clinical information. To address this challenge, we propose the Expertise-aware Multi-LLM Recruitment and Collaboration (EMRC) framework to enhance the accuracy and reliability of MDM systems. It operates in two stages: (i) expertise-aware agent recruitment and (ii) confidence- and adversarial-driven multi-agent collaboration. Specifically, in the first stage, we use a publicly available corpus to construct an LLM expertise table for capturing expertise-specific strengths of multiple LLMs across medical department categories and query difficulty levels. This table enables the subsequent dynamic selection of the optimal LLMs to act as medical expert agents for each medical query during the inference phase. In the second stage, we employ selected agents to generate responses with self-assessed confidence scores, which are then integrated through the confidence fusion and adversarial validation to improve diagnostic reliability. We evaluate our EMRC framework on three public MDM datasets, where the results demonstrate that our EMRC outperforms state-of-the-art single- and multi-LLM methods, achieving superior diagnostic performance. For instance, on the MMLU-Pro-Health dataset, our EMRC achieves 74.45% accuracy, representing a 2.69% improvement over the best-performing closed-source model GPT- 4-0613, which demonstrates the effectiveness of our expertise-aware agent recruitment strategy and the agent complementarity in leveraging each LLM's specialized capabilities.
Abstract（参考訳）: MDM(Messical Decision-Making)は、異種および複雑な臨床情報を効果的に合成するために、ドメイン固有の専門知識を必要とする複雑なプロセスである。近年のLarge Language Models (LLM) の進歩は,MDMをサポートする上での有望性を示しているが,単一LLMアプローチはパラメトリック知識制約や静的トレーニングコーパスによって制限されており,臨床情報をしっかりと統合することができない。この課題に対処するために,MDMシステムの精度と信頼性を高めるために,エキスパート対応マルチLLMリクルート・コラボレーション(EMRC)フレームワークを提案する。 2つの段階に分かれている。一専門知識を有するエージェントの募集及び募集 (二) 信頼と敵主導のマルチエージェントコラボレーション。特に,第1段階では,医療部門における複数のLSMの専門性や問合せ難易度を把握するための専門知識表を構築するために,公開コーパスを用いている。このテーブルは、推論フェーズ中の各医療クエリに対して、最適なLSMを動的に選択し、医療専門家エージェントとして機能させる。第2段階では、選択されたエージェントを用いて自己評価された信頼度スコアの応答を生成し、信頼融合と逆検証を通じて統合し、診断信頼性を向上させる。我々はEMRCフレームワークを3つの公開MDMデータセット上で評価し、その結果、EMRCが最先端のシングル/マルチLLM法より優れ、診断性能が優れていることを示した。例えば、MMLU-Pro-Healthデータセットにおいて、EMRCは74.45%の精度を達成し、最高のパフォーマンスのクローズドソースモデルであるGPT-4-0613よりも2.69%改善した。

関連論文リスト

MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.37068897861388]
MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。 6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2026-02-03T09:47:49Z)
MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文参考訳（メタデータ） (2026-01-16T02:32:07Z)
MACD: Multi-Agent Clinical Diagnosis with Self-Learned Knowledge for LLM [32.0716204095227]
大規模言語モデル(LLM)は医学的応用において顕著な可能性を示している。本研究は,新しいMulti-Agent Clinical Diagnosis (MACD) フレームワークを提案する。 LLMはマルチエージェントパイプラインを通じて自己学習型臨床知識を提供する。
論文参考訳（メタデータ） (2025-09-24T12:37:11Z)
A Knowledge-driven Adaptive Collaboration of LLMs for Enhancing Medical Decision-making [49.048767633316764]
KAMACは知識駆動のAdaptive Multi-Agent Collaborationフレームワークである。エージェントは進化する診断コンテキストに基づいて、専門家チームを動的に形成および拡張することができる。 2つの実世界の医療ベンチマーク実験により、KAMACはシングルエージェント法と高度なマルチエージェント法の両方を著しく上回っていることが示された。
論文参考訳（メタデータ） (2025-09-18T14:33:36Z)
Adaptive Cluster Collaborativeness Boosts LLMs Medical Decision Support Capacity [24.722167779987814]
大規模言語モデル(LLM)は自然言語処理システムにおいて有効であることが証明されている。本稿では,自己多様性と相互整合性を考慮したクラスタ協調手法を提案する。本手法は,全分野にまたがる公的なパススコアまでの精度を実現する。
論文参考訳（メタデータ） (2025-07-25T04:21:16Z)
MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [57.98393950821579]
マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文参考訳（メタデータ） (2025-06-24T17:52:43Z)
MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.63542462400175]
医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。 5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文参考訳（メタデータ） (2025-05-31T13:22:55Z)
DDO: Dual-Decision Optimization via Multi-Agent Collaboration for LLM-Based Medical Consultation [10.348275814202848]
大規模言語モデル(LLM)は強力な一般化と推論能力を示す。 textbfDDO, textbfDual-textbfDecision textbfOptimization by decoupling and independently optimization the two sub-tasks。
論文参考訳（メタデータ） (2025-05-24T10:26:57Z)
MedAgentBoard: Benchmarking Multi-Agent Collaboration with Conventional Methods for Diverse Medical Tasks [17.567786780266353]
我々はMedAgentBoardを紹介する。MedAgentBoardは、マルチエージェントコラボレーション、シングルLLM、および従来のアプローチの体系的評価のための総合的なベンチマークである。 MedAgentBoardには、医療(視覚)質問応答、レイサマリ生成、構造化電子健康記録(EHR)予測モデリング、臨床ワークフロー自動化の4つの多様な医療タスクカテゴリが含まれている。マルチエージェントコラボレーションは特定のシナリオにおいてメリットを示すが、高度な単一LLMを一貫して上回るものではない。
論文参考訳（メタデータ） (2025-05-18T11:28:17Z)
MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making [45.74980058831342]
MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手元にある医療タスクに合わせて調整される。 MDAgentsは医療知識の理解を必要とするタスクに関する10のベンチマークのうち7つのベンチマークで最高のパフォーマンスを達成した。
論文参考訳（メタデータ） (2024-04-22T06:30:05Z)
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文参考訳（メタデータ） (2024-02-15T06:46:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。