論文の概要: MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making
- arxiv url: http://arxiv.org/abs/2404.15155v3
- Date: Wed, 30 Oct 2024 02:32:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-31 14:25:33.364110
- Title: MDAgents: An Adaptive Collaboration of LLMs for Medical Decision-Making
- Title(参考訳): MDAgents:医学的意思決定のためのLLMの適応的コラボレーション
- Authors: Yubin Kim, Chanwoo Park, Hyewon Jeong, Yik Siu Chan, Xuhai Xu, Daniel McDuff, Hyeonhoon Lee, Marzyeh Ghassemi, Cynthia Breazeal, Hae Won Park,
- Abstract要約: MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。
割り当てられた単独またはグループの共同作業構造は、実際の医療決定過程をエミュレートして、手元にある医療タスクに合わせて調整される。
MDAgentsは医療知識の理解を必要とするタスクに関する10のベンチマークのうち7つのベンチマークで最高のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 45.74980058831342
- License:
- Abstract: Foundation models are becoming valuable tools in medicine. Yet despite their promise, the best way to leverage Large Language Models (LLMs) in complex medical tasks remains an open question. We introduce a novel multi-agent framework, named Medical Decision-making Agents (MDAgents) that helps address this gap by automatically assigning a collaboration structure to a team of LLMs. The assigned solo or group collaboration structure is tailored to the medical task at hand, emulating real-world medical decision-making processes adapted to tasks of varying complexities. We evaluate our framework and baseline methods using state-of-the-art LLMs across a suite of real-world medical knowledge and medical diagnosis benchmarks, including a comparison of LLMs' medical complexity classification against human physicians. MDAgents achieved the best performance in seven out of ten benchmarks on tasks requiring an understanding of medical knowledge and multi-modal reasoning, showing a significant improvement of up to 4.2% (p < 0.05) compared to previous methods' best performances. Ablation studies reveal that MDAgents effectively determines medical complexity to optimize for efficiency and accuracy across diverse medical tasks. Notably, the combination of moderator review and external medical knowledge in group collaboration resulted in an average accuracy improvement of 11.8%. Our code can be found at https://github.com/mitmedialab/MDAgents.
- Abstract(参考訳): 基礎モデルは医療において貴重なツールになりつつある。
しかし、その約束にもかかわらず、複雑な医療タスクでLarge Language Models(LLM)を利用する最善の方法は、未解決の問題である。
我々は,MDAgents(Medical Decision-making Agents)と呼ばれる新しいマルチエージェントフレームワークを導入する。
割り当てられた単独またはグループの共同作業構造は、様々な複雑さのタスクに適応した実世界の医療意思決定プロセスをエミュレートして、手前の医療タスクに合わせて調整される。
実世界の医学的知識と診断ベンチマークを用いて, LLMsの医学的複雑性の分類と人的医師との比較を含む, 最先端のLCMを用いて, フレームワークとベースラインの手法を評価した。
MDAgentsは医療知識とマルチモーダル推論の理解を必要とするタスクについて10のベンチマークのうち7つ中7つのベンチマークで最高のパフォーマンスを達成し、従来の方法と比較して最大4.2%(p < 0.05)の大幅な改善を示した。
アブレーション研究により、MDAgentsは医療の複雑さを効果的に決定し、様々な医療タスクにおける効率と精度を最適化することが明らかになった。
特に、グループコラボレーションにおけるモデレーターレビューと外部医療知識の組み合わせにより、平均精度は11.8%向上した。
私たちのコードはhttps://github.com/mitmedialab/MDAgents.comにある。
関連論文リスト
- A Demonstration of Adaptive Collaboration of Large Language Models for Medical Decision-Making [38.2229221645303]
大規模言語モデル(LLM)は、膨大な医療知識とマルチモーダルヘルスデータを合成することで、このプロセスを合理化することを約束する。
我々のMDAgentsは、タスクの複雑さに基づいて協調構造をLLMに動的に割り当てることで、このニーズに対処します。
このフレームワークは、診断精度を改善し、複雑な現実世界の医療シナリオにおける適応応答をサポートする。
論文 参考訳(メタデータ) (2024-10-31T22:58:08Z) - Demystifying Large Language Models for Medicine: A Primer [50.83806796466396]
大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。
本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文 参考訳(メタデータ) (2024-10-24T15:41:56Z) - MedAide: Towards an Omni Medical Aide via Specialized LLM-based Multi-Agent Collaboration [16.062646854608094]
大規模言語モデル(LLM)による対話システムは、現在医療分野において潜在的に有望であることを示している。
本稿では,医療専門サービスのためのオムニ・メディカル・マルチエージェント・コラボレーション・フレームワークであるMedAideを提案する。
論文 参考訳(メタデータ) (2024-10-16T13:10:27Z) - RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment [54.91736546490813]
本稿では,大規模言語モデルと特定の診断規則との整合性を考慮したルールアラインフレームワークを提案する。
患者と医師間の規則に基づくコミュニケーションを含む医療対話データセットを開発した。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-22T17:44:40Z) - Towards Evaluating and Building Versatile Large Language Models for Medicine [57.49547766838095]
MedS-Benchは大規模言語モデル(LLM)の性能を臨床的に評価するためのベンチマークである。
MedS-Benchは、臨床報告の要約、治療勧告、診断、名前付きエンティティ認識、医療概念説明を含む、11のハイレベルな臨床タスクにまたがる。
MedS-Insは58の医療指向言語コーパスで構成され、112のタスクで1350万のサンプルを収集している。
論文 参考訳(メタデータ) (2024-08-22T17:01:34Z) - Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents [14.167006531064517]
治療過程全体をシミュレートした,エージェント病院という病院のシミュラムを紹介した。
すべての患者、看護師、医師は、大規模言語モデル(LLM)を利用した自律型エージェントである。
論文 参考訳(メタデータ) (2024-05-05T14:53:51Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - MedAgents: Large Language Models as Collaborators for Zero-shot Medical Reasoning [35.804520192679874]
大規模言語モデル(LLM)は医療や医療において重大な障壁に直面している。
MedAgentsは医療分野のための新しい多分野連携フレームワークである。
私たちの研究は、現実世界のシナリオに適用可能なゼロショット設定に焦点を当てています。
論文 参考訳(メタデータ) (2023-11-16T11:47:58Z) - Towards Medical Artificial General Intelligence via Knowledge-Enhanced
Multimodal Pretraining [121.89793208683625]
医療人工知能(MAGI)は、1つの基礎モデルで異なる医療課題を解くことができる。
我々は、Micical-knedge-enhanced mulTimOdal pretRaining (motoR)と呼ばれる新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-26T01:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。