論文の概要: M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging
- arxiv url: http://arxiv.org/abs/2502.20301v1
- Date: Thu, 27 Feb 2025 17:29:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 14:59:42.275081
- Title: M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging
- Title(参考訳): M^3Builder:医療画像における機械学習のためのマルチエージェントシステム
- Authors: Jinghao Feng, Qiaoyu Zheng, Chaoyi Wu, Ziheng Zhao, Ya Zhang, Yanfeng Wang, Weidi Xie,
- Abstract要約: 医療画像における機械学習(ML)の自動化を目的とした,新しいマルチエージェントシステムであるM3Builderを提案する。
M3Builderは、複雑なマルチステップ医療MLに取り組むために、4つの専門エージェントを雇用している。
既存のMLエージェント設計と比較して、M3Builderは医療画像におけるMLタスクの完了に優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 54.40890979694209
- License:
- Abstract: Agentic AI systems have gained significant attention for their ability to autonomously perform complex tasks. However, their reliance on well-prepared tools limits their applicability in the medical domain, which requires to train specialized models. In this paper, we make three contributions: (i) We present M3Builder, a novel multi-agent system designed to automate machine learning (ML) in medical imaging. At its core, M3Builder employs four specialized agents that collaborate to tackle complex, multi-step medical ML workflows, from automated data processing and environment configuration to self-contained auto debugging and model training. These agents operate within a medical imaging ML workspace, a structured environment designed to provide agents with free-text descriptions of datasets, training codes, and interaction tools, enabling seamless communication and task execution. (ii) To evaluate progress in automated medical imaging ML, we propose M3Bench, a benchmark comprising four general tasks on 14 training datasets, across five anatomies and three imaging modalities, covering both 2D and 3D data. (iii) We experiment with seven state-of-the-art large language models serving as agent cores for our system, such as Claude series, GPT-4o, and DeepSeek-V3. Compared to existing ML agentic designs, M3Builder shows superior performance on completing ML tasks in medical imaging, achieving a 94.29% success rate using Claude-3.7-Sonnet as the agent core, showing huge potential towards fully automated machine learning in medical imaging.
- Abstract(参考訳): エージェントAIシステムは、複雑なタスクを自律的に実行する能力において、大きな注目を集めている。
しかし、十分に準備されたツールへの依存は、専門的なモデルを訓練する必要がある医療領域における適用性を制限している。
本稿では,3つのコントリビューションについて述べる。
(i)M3Builderは,医療画像における機械学習(ML)の自動化を目的とした,新しいマルチエージェントシステムである。
M3Builderの中核となるのは、自動化されたデータ処理と環境設定から、自己完結した自動デバッグとモデルトレーニングに至るまで、複雑なマルチステップの医療MLワークフローに取り組むために協力する4つの専門エージェントである。
これらのエージェントは、データセット、トレーニングコード、インタラクションツールのフリーテキスト記述を提供するように設計された構造化された環境である、医療イメージングMLワークスペース内で動作し、シームレスなコミュニケーションとタスク実行を可能にする。
2) 自動医用画像MLの進歩を評価するため,M3Benchを提案する。M3Benchは,14のトレーニングデータセットにおいて,5つの解剖学と3つの画像モダリティにまたがる4つの一般的なタスクからなるベンチマークで,2次元データと3次元データの両方をカバーする。
3)Claudeシリーズ,GPT-4o,DeepSeek-V3などのエージェントコアとして機能する最先端の大規模言語モデルについて実験を行った。
既存のMLエージェント設計と比較すると、M3Builderは医療画像におけるMLタスクの完了に優れたパフォーマンスを示し、エージェントコアとしてClaude-3.7-Sonnetを使用して94.29%の成功率を達成した。
関連論文リスト
- Med-2E3: A 2D-Enhanced 3D Medical Multimodal Large Language Model [16.93216342922561]
我々は、3Dエンコーダと2Dエンコーダを統合した3次元医用画像解析のための新しいMLLMであるMed-2E3を提案する。
より効果的に2D特徴を集約するために,スライス内容とタスク命令に基づいて各2Dスライスに注目したテキストガイド型インタースライス(TG-IS)スコアリングモジュールを設計する。
大規模でオープンソースの3D医療マルチモーダルベンチマークの実験では、Med-2E3がタスク固有の注意分布を示し、現在の最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-11-19T09:59:59Z) - Automated Ensemble Multimodal Machine Learning for Healthcare [52.500923923797835]
本稿では,自動機械学習を用いた構造化臨床(タブラル)データと医用画像の統合を実現するマルチモーダルフレームワークAutoPrognosis-Mを紹介する。
AutoPrognosis-Mには、畳み込みニューラルネットワークとビジョントランスフォーマーを含む17のイメージングモデルと、3つの異なるマルチモーダル融合戦略が含まれている。
論文 参考訳(メタデータ) (2024-07-25T17:46:38Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - MMedAgent: Learning to Use Medical Tools with Multi-modal Agent [27.314055140281432]
本報告では,医療分野向けに設計された最初のエージェントである textbfMulti-modal textbfMedical textbfAgent (MMedAgent) を紹介する。
MMedAgentは、最先端のオープンソース手法やクローズドソースモデルであるGPT-4oと比較して、様々な医療タスクにおいて優れた性能を発揮することを示す総合的な実験である。
論文 参考訳(メタデータ) (2024-07-02T17:58:23Z) - M3H: Multimodal Multitask Machine Learning for Healthcare [7.4489490661717355]
M3Hは、医療フレームワークのためのマルチモーダルマルチタスク機械学習(Multimodal Multitask Machine Learning for Healthcare)である。
教師付きバイナリ/マルチクラス分類、回帰、教師なしクラスタリングのためのデータからの学習を集約する。
16の医療部門、病院の手術予測3件、患者の表現タスク1件の40の疾患診断のうち、平均11.6%でシングルタスクモデルを上回っている。
論文 参考訳(メタデータ) (2024-04-29T14:39:15Z) - Med-MoE: Mixture of Domain-Specific Experts for Lightweight Medical Vision-Language Models [17.643421997037514]
差別的, 生成的両マルチモーダル医療課題に対処する新しい枠組みを提案する。
Med-MoEの学習は、マルチモーダル医療アライメント、命令チューニングとルーティング、ドメイン固有のMoEチューニングの3つのステップで構成されている。
我々のモデルは最先端のベースラインに匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2024-04-16T02:35:17Z) - M3D: Advancing 3D Medical Image Analysis with Multi-Modal Large Language Models [49.5030774873328]
これまでの研究は主に2Dの医療画像に焦点を合わせてきた。
120K画像テキスト対と62K命令応答対からなる大規模3次元マルチモーダル医療データセットM3D-Dataを提案する。
また,新しい3次元マルチモーダル・メディカル・ベンチマークであるM3D-Benchを導入し,8つのタスクにまたがる自動評価を容易にする。
論文 参考訳(メタデータ) (2024-03-31T06:55:12Z) - CMViM: Contrastive Masked Vim Autoencoder for 3D Multi-modal Representation Learning for AD classification [8.843907586879475]
アルツハイマー病(英語: Alzheimer's disease, AD)は、認知機能低下につながる神経変性疾患である。
本稿では,3次元マルチモーダルデータに適した最初の効率的な表現学習法であるContrastive Masked Vim Autoencoder (CMViM)を提案する。
論文 参考訳(メタデータ) (2024-03-25T08:02:41Z) - An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Towards Medical Artificial General Intelligence via Knowledge-Enhanced
Multimodal Pretraining [121.89793208683625]
医療人工知能(MAGI)は、1つの基礎モデルで異なる医療課題を解くことができる。
我々は、Micical-knedge-enhanced mulTimOdal pretRaining (motoR)と呼ばれる新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-26T01:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。