論文の概要: A multi-agent system for spine MRI report generation from multi-sequence imaging
- arxiv url: http://arxiv.org/abs/2606.08897v1
- Date: Mon, 08 Jun 2026 00:50:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.508782
- Title: A multi-agent system for spine MRI report generation from multi-sequence imaging
- Title(参考訳): マルチシーケンスイメージングによる脊椎MRIレポート生成のためのマルチエージェントシステム
- Authors: Zhiping Xiao, Junwei Yang, Gongbo Sun, Han Zhang, Hanwen Xu, Yi Yao, Zachary D. Miller, William E. King, Mohammed M. Kanani, Jalal B. Andre, Sammy Chu, Ming Zhang, Paul E. Kinahan, Nathan M. Cross, Sheng Wang,
- Abstract要約: 脊椎病理は世界中で痛みと障害の主な原因である。
最近の自動MRI解析の進歩にもかかわらず、マルチシーケンスデータを効果的に組み合わせることは未解決の課題である。
SpineAgentは、マルチシーケンス基盤モデルに基づく、脊椎MRIレポート生成のためのマルチエージェントフレームワークである。
- 参考スコア(独自算出の注目度): 13.179616037269952
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Spinal pathology is a leading cause of pain and disability worldwide. Spine MRI is central to clinical evaluation, yet its interpretation remains complex and time-consuming, requiring integration of information across multiple imaging sequences and anatomical regions. Despite recent advances in automated MRI analysis, effectively combining multi-sequence data while preserving sequence-specific diagnostic information remains an open challenge. Here we present SpineAgent, a multi-agent framework for spine MRI report generation built upon a multi-sequence foundation model trained on routine clinical data from 32,047 patients and 453,683 MRI series, comprising a total of 13,441,191 MRI slices. To accommodate diverse modalities of sequences, we first pre-train two DINOv3-based encoders separately on T1- and T2-weighted sequences. We then introduce a continual training strategy that learns a synthesizer to embed images of other sequences using the T1 and T2 encoders, producing patient-level embedding that integrates various signals across MRI sequences. Using these embeddings, SpineAgent achieves state-of-the-art performance, and demonstrates strong generalizability under cross-manufacturer and cross-cohort evaluation. Beyond classification, SpineAgent enables pathology localization by identifying findings-relevant slices and segmenting pathological regions. It also supports multimodal image-report retrieval, providing a solid foundation for scalable and explainable MRI report generation. We further integrate these validated capabilities of SpineAgent into 37 specialized agents. Finally, we incorporate their outputs as structured tokens within a Medical Report Agent trained end-to-end for report generation. Through both automated metrics and expert evaluation by five radiologists, SpineAgent achieves leading performance in spine MRI report generation.
- Abstract(参考訳): 脊椎病理は世界中で痛みと障害の主な原因である。
spine MRIは臨床評価の中心であるが、その解釈は複雑で時間を要するため、複数の画像シーケンスと解剖学的領域の情報を統合する必要がある。
自動MRI解析の最近の進歩にもかかわらず、シーケンス固有の診断情報を保存しながら、複数のシーケンスデータを効果的に組み合わせることは、未解決の課題である。
SpineAgentは, 約13,441,191個のMRIスライスを含む32,047人の患者と453,683個のMRIシリーズの定期的な臨床データに基づいて訓練された多系列基礎モデルに基づいて構築された, 脊椎MRIレポート生成のためのマルチエージェントフレームワークである。
まず,T1-およびT2-重み付き配列上で2つのDINOv3ベースのエンコーダを個別に事前訓練した。
次に、T1エンコーダとT2エンコーダを用いて、他のシーケンスの画像を埋め込むシンセサイザーを学習し、MRIシーケンス間で様々な信号を統合する患者レベルの埋め込みを生成する連続的なトレーニング戦略を導入する。
これらの埋め込みを用いて、SpineAgentは最先端の性能を達成し、クロスマニュファクチャラーおよびクロスコホート評価の下で強力な一般化性を示す。
分類以外にも、SpineAgentは所見関連スライスを同定し、病理領域をセグメント化することで、病理の局在を可能にする。
また、マルチモーダルなイメージレポート検索をサポートし、スケーラブルで説明可能なMRIレポート生成の基盤を提供する。
我々は、SpineAgentのこれらの検証された能力を37の特殊エージェントに統合する。
最後に、医療報告エージェントがレポート生成のために訓練したエンドツーエンドに、それらの出力を構造化トークンとして組み込む。
SpineAgentは5人の放射線技師による自動測定と専門家による評価の両方を通じて、脊椎MRIレポート生成において先行的なパフォーマンスを実現している。
関連論文リスト
- Large-scale Multi-sequence Pretraining for Generalizable MRI Analysis in Versatile Clinical Applications [15.846703688846086]
本研究では,大規模MultI-Sequence MRIを用いた基礎モデルであるPRISMを提案する。
本稿では,MRIの配列特異的な変化から解剖学的に不変な特徴を引き離す新しい事前訓練パラダイムを提案する。
PRISMは、非事前のモデルと既存の基礎モデルの両方を一貫して上回った。
論文 参考訳(メタデータ) (2025-08-10T03:31:46Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Automated Classification of Body MRI Sequence Type Using Convolutional
Neural Networks [7.734037486455235]
胸部,腹部,骨盤のレベルで得られた3次元MRIの配列を自動分類する方法を提案する。
われわれは,胸部,腹部,骨盤のMRI画像の3次元分類法を初めて開発した。
論文 参考訳(メタデータ) (2024-02-12T22:34:57Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Synthesis-based Imaging-Differentiation Representation Learning for
Multi-Sequence 3D/4D MRI [16.725225424047256]
画像差分表現学習のためのシーケンス・ツー・シーケンス生成フレームワーク(Seq2Seq)を提案する。
本研究では、1つのモデル内で任意の3D/4Dシーケンスを生成し、任意のターゲットシーケンスを生成するだけでなく、各シーケンスの重要性をランク付けする。
我々は,2万名の模擬被験者のおもちゃデータセット,1,251名の脳MRIデータセット,2,101名の乳房MRIデータセットを含む3つのデータセットを用いて広範な実験を行った。
論文 参考訳(メタデータ) (2023-02-01T15:37:35Z) - Integrative Imaging Informatics for Cancer Research: Workflow Automation
for Neuro-oncology (I3CR-WANO) [0.12175619840081271]
我々は,多系列ニューロオンコロジーMRIデータの集約と処理のための人工知能ベースのソリューションを提案する。
エンド・ツー・エンドのフレームワーク i) アンサンブル分類器を用いてMRIの配列を分類し, i) 再現可能な方法でデータを前処理し, iv) 腫瘍組織サブタイプを規定する。
欠落したシーケンスに対して堅牢であり、専門的なループアプローチを採用しており、セグメンテーションの結果は放射線学者によって手動で洗練される可能性がある。
論文 参考訳(メタデータ) (2022-10-06T18:23:42Z) - SpineOne: A One-Stage Detection Framework for Degenerative Discs and
Vertebrae [54.751251046196494]
SpineOneと呼ばれる一段階検出フレームワークを提案し、MRIスライスから変性椎骨と椎骨を同時に局在化・分類する。
1)キーポイントの局所化と分類を促進するためのキーポイント・ヒートマップの新しい設計、2)ディスクと脊椎の表現をよりよく区別するためのアテンション・モジュールの使用、3)後期訓練段階における複数の学習目標を関連付けるための新しい勾配誘導客観的アソシエーション機構。
論文 参考訳(メタデータ) (2021-10-28T12:59:06Z) - Modality Completion via Gaussian Process Prior Variational Autoencoders
for Multi-Modal Glioma Segmentation [75.58395328700821]
本稿では,患者スキャンに欠落するサブモダリティを1つ以上のインプットするために,MGP-VAE(Multi-modal Gaussian Process Prior Variational Autoencoder)を提案する。
MGP-VAEは、変分オートエンコーダ(VAE)に先立ってガウス過程(GP)を利用して、被験者/患者およびサブモダリティ相関を利用することができる。
4つのサブモダリティのうち2つ、または3つが欠落している脳腫瘍に対するMGP-VAEの適用性を示す。
論文 参考訳(メタデータ) (2021-07-07T19:06:34Z) - M2Net: Multi-modal Multi-channel Network for Overall Survival Time
Prediction of Brain Tumor Patients [151.4352001822956]
生存時間(OS)の早期かつ正確な予測は、脳腫瘍患者に対するより良い治療計画を得るのに役立つ。
既存の予測手法は、磁気共鳴(MR)ボリュームの局所的な病変領域における放射能特性に依存している。
我々は,マルチモーダルマルチチャネルネットワーク(M2Net)のエンドツーエンドOS時間予測モデルを提案する。
論文 参考訳(メタデータ) (2020-06-01T05:21:37Z) - VerSe: A Vertebrae Labelling and Segmentation Benchmark for
Multi-detector CT Images [121.31355003451152]
大規模Vertebrae Challenge(VerSe)は、2019年と2020年に開催されたMICCAI(International Conference on Medical Image Computing and Computer Assisted Intervention)と共同で設立された。
本評価の結果を報告するとともに,脊椎レベル,スキャンレベル,および異なる視野での性能変化について検討した。
論文 参考訳(メタデータ) (2020-01-24T21:09:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。