論文の概要: MedRoute: RL-Based Dynamic Specialist Routing in Multi-Agent Medical Diagnosis
- arxiv url: http://arxiv.org/abs/2604.06180v1
- Date: Thu, 05 Feb 2026 19:50:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.376119
- Title: MedRoute: RL-Based Dynamic Specialist Routing in Multi-Agent Medical Diagnosis
- Title(参考訳): MedRoute:マルチエージェント診断におけるRLベースのダイナミックスペシャリストルーティング
- Authors: Ashmal Vayani, Parth Parag Kulkarni, Joseph Fioresi, Song Wang, Mubarak Shah,
- Abstract要約: 臨床実践では、複数の専門医が診断を行い、それぞれが専門分野に特化している。
この新興分野の現在のアプローチは、通常、様々な専門家の静的または事前定義された選択に依存しており、現実的なシナリオの変化に適応できない。
LMMエージェントの協調システムからなる柔軟で動的なマルチエージェントフレームワークであるMedRouteを提案する。
- 参考スコア(独自算出の注目度): 49.78267008828593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical diagnosis using Large Multimodal Models (LMMs) has gained increasing attention due to capability of these models in providing precise diagnoses. These models generally combine medical questions with visual inputs to generate diagnoses or treatments. However, they are often overly general and unsuitable under the wide range of medical conditions in real-world healthcare. In clinical practice, diagnosis is performed by multiple specialists, each contributing domain-specific expertise. To emulate this process, a potential solution is to deploy a dynamic multi-agent LMM framework, where each agent functions as a medical specialist. Current approaches in this emerging area, typically relying on static or predefined selection of various specialists, cannot be adapted to the changing practical scenario. In this paper, we propose MedRoute, a flexible and dynamic multi-agent framework that comprises of a collaborative system of specialist LMM agents. Furthermore, we add a General Practitioner with an RL-trained router for dynamic specialist selection, and a Moderator that produces the final decision. In this way, our framework closely mirrors real clinical workflows. Extensive evaluations on text and image-based medical datasets demonstrate improved diagnostic accuracy, outperforming the state-of-the-art baselines. Our work lays a strong foundation for future research. Code and models are available at https://github.com/UCF-CRCV/MedRoute/.
- Abstract(参考訳): LMM(Large Multimodal Models)を用いた診断は,これらのモデルの正確な診断能力から注目されている。
これらのモデルは一般的に、医学的な問題と視覚的な入力を組み合わせて診断や治療を生成する。
しかし、現実の医療における幅広い医療条件下では、一般的には不適当であることが多い。
臨床実践では、複数の専門医が診断を行い、それぞれが専門分野に特化している。
このプロセスをエミュレートするためには、動的マルチエージェントLMMフレームワークをデプロイし、各エージェントが医療専門家として機能する可能性がある。
この新興分野の現在のアプローチは、通常、様々な専門家の静的または事前定義された選択に依存しており、現実的なシナリオの変化に適応できない。
本稿では,LMMエージェントの協調システムからなる柔軟で動的なマルチエージェントフレームワークであるMedRouteを提案する。
さらに、動的スペシャリスト選択のためのRL学習ルータを備えたGeneral Practitionerと、最終決定を生成するモデレータも追加する。
このようにして、我々のフレームワークは実際の臨床ワークフローを密接に反映している。
テキストと画像に基づく医療データセットの大規模な評価では、診断精度が向上し、最先端のベースラインを上回っている。
私たちの研究は将来の研究の強力な基盤となる。
コードとモデルはhttps://github.com/UCF-CRCV/MedRoute/.comで入手できる。
関連論文リスト
- MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - A Knowledge-driven Adaptive Collaboration of LLMs for Enhancing Medical Decision-making [49.048767633316764]
KAMACは知識駆動のAdaptive Multi-Agent Collaborationフレームワークである。
エージェントは進化する診断コンテキストに基づいて、専門家チームを動的に形成および拡張することができる。
2つの実世界の医療ベンチマーク実験により、KAMACはシングルエージェント法と高度なマルチエージェント法の両方を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2025-09-18T14:33:36Z) - MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [57.98393950821579]
マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。
我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。
このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文 参考訳(メタデータ) (2025-06-24T17:52:43Z) - MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning [63.63542462400175]
医療エージェント間の動的に最適化された協調を可能にする強化学習に基づくマルチエージェントフレームワークMMedAgent-RLを提案する。
具体的には、Qwen2.5-VLに基づく2つのGPエージェントをRLを介して訓練する: トリアージ医師は患者を適切な専門分野に割り当てることを学ぶ一方、主治医はマルチスペシャリストの判断を統合する。
5つのVQAベンチマークの実験では、MMedAgent-RLはオープンソースおよびプロプライエタリなMed-LVLMよりも優れており、人間のような推論パターンも示している。
論文 参考訳(メタデータ) (2025-05-31T13:22:55Z) - Med-MoE: Mixture of Domain-Specific Experts for Lightweight Medical Vision-Language Models [17.643421997037514]
差別的, 生成的両マルチモーダル医療課題に対処する新しい枠組みを提案する。
Med-MoEの学習は、マルチモーダル医療アライメント、命令チューニングとルーティング、ドメイン固有のMoEチューニングの3つのステップで構成されている。
我々のモデルは最先端のベースラインに匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2024-04-16T02:35:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。