論文の概要: Agentic Large Language Models for Training-Free Neuro-Radiological Image Analysis
- arxiv url: http://arxiv.org/abs/2604.16729v1
- Date: Fri, 17 Apr 2026 22:04:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.149339
- Title: Agentic Large Language Models for Training-Free Neuro-Radiological Image Analysis
- Title(参考訳): 学習自由な神経・放射線画像解析のためのエージェント型大規模言語モデル
- Authors: Ayhan Can Erdur, Daniel Scholz, Jiazhen Pan, Benedikt Wiestler, Daniel Rueckert, Jan C. Peeken,
- Abstract要約: Agentic AIは新しいソリューションを提供し、本質的な3D処理を必要としない。
自動脳MRI解析のための無トレーニングエージェントパイプラインを提案する。
この結果から,エージェントAIは,訓練や微調整を必要とせず,ツール使用による高次神経・放射線画像解析の課題を解決できることが示唆された。
- 参考スコア(独自算出の注目度): 19.715805184063168
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: State-of-the-art large language models (LLMs) show high performance in general visual question answering. However, a fundamental limitation remains: current architectures lack the native 3D spatial reasoning required for direct analysis of volumetric medical imaging, such as CT or MRI. Emerging agentic AI offers a new solution, eliminating the need for intrinsic 3D processing by enabling LLMs to orchestrate and leverage specialized external tools. Yet, the feasibility of such agentic frameworks in complex, multi-step radiological workflows remains underexplored. In this work, we present a training-free agentic pipeline for automated brain MRI analysis. Validating our methodology on several LLMs (GPT-5.1, Gemini 3 Pro, Claude Sonnet 4.5) with off-the-shelf domain-specific tools, our system autonomously executes complex end-to-end workflows, including preprocessing (skull stripping, registration), pathology segmentation (glioma, meningioma, metastases), and volumetric analysis. We evaluate our framework across increasingly complex radiological tasks, from single-scan segmentation and volumetric reporting to longitudinal response assessment requiring multi-timepoint comparisons. We analyze the impact of architectural design by comparing single-agent models against multi-agent "domain-expert" collaborations. Finally, to support rigorous evaluation of future agentic systems, we introduce and release a benchmark dataset of image-prompt-answer tuples derived from public BraTS data. Our results demonstrate that agentic AI can solve highly neuro-radiological image analysis tasks through tool use without the need for training or fine-tuning.
- Abstract(参考訳): 最先端の大規模言語モデル(LLM)は、一般的な視覚的質問応答において高い性能を示す。
現在のアーキテクチャでは、CTやMRIなどのボリューム医学画像の直接解析に必要な3次元空間推論が欠如している。
エージェントAIの進化は、LLMが特殊な外部ツールのオーケストレーションと活用を可能にすることによって、本質的な3D処理の必要性を排除し、新しいソリューションを提供する。
しかし、複雑で多段階の放射線学的ワークフローにおけるそのようなエージェント的フレームワークの実現可能性については、未解明のままである。
本研究では,脳MRI自動解析のためのトレーニングフリーエージェントパイプラインを提案する。
市販のドメイン固有ツールによるLCM(GPT-5.1, Gemini 3 Pro, Claude Sonnet 4.5)の方法論を検証するため,本システムでは,前処理(スカルストリップ,登録),病理セグメント化(グリオーマ,髄膜腫,転移),ボリューム解析など,複雑なエンドツーエンドのワークフローを自律的に実行する。
我々は, 単走査セグメンテーションやボリュームレポートから, 多点比較を必要とする長手応答評価まで, ますます複雑化する放射線学的な課題の枠組みを評価する。
単一エージェントモデルとマルチエージェント"ドメイン-エキスパート"のコラボレーションを比較し,アーキテクチャ設計の影響を分析した。
最後に、今後のエージェントシステムの厳密な評価を支援するため、パブリックBraTSデータから得られた画像プロンプト応答タプルのベンチマークデータセットを導入、リリースする。
この結果から,エージェントAIは,訓練や微調整を必要とせず,ツール使用による高次神経・放射線画像解析の課題を解決できることが示唆された。
関連論文リスト
- FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis [25.102840990979985]
包括的胎児US分析のための最初のマルチエージェントシステムであるFetalAgentsを提案する。
軽量でエージェント的な調整フレームワークを通じて、FetalAgentsは専門の視覚専門家を動的に編成し、診断、測定、セグメンテーションのパフォーマンスを最大化する。
さらに、FetalAgentsは、エンドツーエンドのビデオストリームの要約をサポートすることで、静的画像解析を超えて前進する。
論文 参考訳(メタデータ) (2026-03-10T14:37:28Z) - CT-Flow: Orchestrating CT Interpretation Workflow with Model Context Protocol Servers [14.499713300688555]
既存の3次元CT解析のアプローチのほとんどは、静的なシングルパス推論に大きく依存している。
Model Context Protocol (MCP)を活用することで、CT-Flowはクローズドボックス推論からオープンなツール認識パラダイムへとシフトする。
これに基づいてCT-Flowは、複雑な自然言語クエリを自動ツール使用シーケンスに分解できる臨床オーケストレータとして機能する。
論文 参考訳(メタデータ) (2026-02-23T07:19:30Z) - MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.37068897861388]
MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。
マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。
6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-03T09:47:49Z) - A co-evolving agentic AI system for medical imaging analysis [14.925000849408683]
TissueLabは、研究者が直接質問し、説明可能な結果を自動的に計画し、生成し、リアルタイム分析を行うことができるエージェントAIシステムである。
多様なツールのインプット、アウトプット、能力の標準化により、システムはいつ、どのように呼び出すかを決定し、研究や臨床上の問題に対処する。
tissueLabは、エンドツーエンドのビジョン言語モデル(VLM)や他のエージェントAIシステム(GPT-5)と比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-09-24T16:15:28Z) - AURA: A Multi-Modal Medical Agent for Understanding, Reasoning & Annotation [0.8397730500554048]
AURAは、医用画像の包括的分析、説明、評価のために特別に設計された最初の視覚的言語説明性エージェントである。
AURAは、より透明性があり、適応可能で、臨床的に整合したAIシステムに向けた大きな進歩を示している。
論文 参考訳(メタデータ) (2025-07-22T18:24:18Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Advancing AI Research Assistants with Expert-Involved Learning [84.30323604785646]
大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、生物医学的な発見を促進することを約束するが、その信頼性は未定である。
ARIEL(AI Research Assistant for Expert-in-the-Loop Learning)は,オープンソースの評価・最適化フレームワークである。
LMMは詳細な視覚的推論に苦しむのに対し、最先端のモデルでは流動性はあるが不完全な要約を生成する。
論文 参考訳(メタデータ) (2025-05-03T14:21:48Z) - A-IDE : Agent-Integrated Denoising Experts [0.46040036610482665]
textbfAgent-Integrated Denoising Experts (A-IDE) フレームワークを導入し、3つの解剖学的領域特定RED-CNNモデルを統合する。
A-IDEは、RMSE、PSNR、SSIMにおいて単一の統一デノイザに比べて優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-03-21T01:26:54Z) - MRGen: Segmentation Data Engine for Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では,データ合成における生成モデルの利用について検討する。
本稿では,テキストプロンプトとセグメンテーションマスクを条件とした医用画像合成のためのデータエンジンMRGenを提案する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - A unified 3D framework for Organs at Risk Localization and Segmentation
for Radiation Therapy Planning [56.52933974838905]
現在の医療ワークフローは、OAR(Organs-at-risk)のマニュアル記述を必要とする
本研究は,OARローカライゼーション・セグメンテーションのための統合された3Dパイプラインの導入を目的とする。
提案手法は医用画像に固有の3Dコンテキスト情報の活用を可能にする。
論文 参考訳(メタデータ) (2022-03-01T17:08:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。