論文の概要: Health system learning achieves generalist neuroimaging models
- arxiv url: http://arxiv.org/abs/2511.18640v1
- Date: Sun, 23 Nov 2025 22:34:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.945308
- Title: Health system learning achieves generalist neuroimaging models
- Title(参考訳): 健康システム学習は一般的な神経画像モデルを達成する
- Authors: Akhil Kondepudi, Akshay Rao, Chenhui Zhao, Yiwei Lyu, Samir Harake, Soumyanil Banerjee, Rushikesh Joshi, Anna-Katharina Meissner, Renly Hou, Cheng Jiang, Asadur Chowdury, Ashok Srinivasan, Brian Athey, Vikas Gulani, Aditya Pandey, Honglak Lee, Todd Hollon,
- Abstract要約: 我々は524万のMRIおよびCTボリュームに基づいてトレーニングされた視覚基盤モデルであるNeuroVFMを紹介する。
NeuroVFMは、脳解剖学と病理学の包括的表現を学び、複数の臨床的タスクで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 32.579819110032766
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Frontier artificial intelligence (AI) models, such as OpenAI's GPT-5 and Meta's DINOv3, have advanced rapidly through training on internet-scale public data, yet such systems lack access to private clinical data. Neuroimaging, in particular, is underrepresented in the public domain due to identifiable facial features within MRI and CT scans, fundamentally restricting model performance in clinical medicine. Here, we show that frontier models underperform on neuroimaging tasks and that learning directly from uncurated data generated during routine clinical care at health systems, a paradigm we call health system learning, yields high-performance, generalist neuroimaging models. We introduce NeuroVFM, a visual foundation model trained on 5.24 million clinical MRI and CT volumes using a scalable volumetric joint-embedding predictive architecture. NeuroVFM learns comprehensive representations of brain anatomy and pathology, achieving state-of-the-art performance across multiple clinical tasks, including radiologic diagnosis and report generation. The model exhibits emergent neuroanatomic understanding and interpretable visual grounding of diagnostic findings. When paired with open-source language models through lightweight visual instruction tuning, NeuroVFM generates radiology reports that surpass frontier models in accuracy, clinical triage, and expert preference. Through clinically grounded visual understanding, NeuroVFM reduces hallucinated findings and critical errors, offering safer clinical decision support. These results establish health system learning as a paradigm for building generalist medical AI and provide a scalable framework for clinical foundation models.
- Abstract(参考訳): OpenAIのGPT-5やMetaのDINOv3のようなフロンティア人工知能(AI)モデルは、インターネット規模の公開データのトレーニングを通じて急速に進歩している。
特にニューロイメージングは、MRIやCTスキャンの顔の特徴を識別し、臨床医学におけるモデルパフォーマンスを根本的に制限しているため、パブリックドメインでは表現が不足している。
ここでは、フロンティアモデルがニューロイメージングのタスクに不適であり、健康システムにおける定期的な臨床ケア中に生成した未計算データから直接学習することが、ハイパフォーマンスな一般のニューロイメージングモデルをもたらすことを示す。
我々は、スケーラブルな容積結合予測アーキテクチャを用いて、524万の臨床MRIおよびCTボリュームに基づいてトレーニングされた視覚基盤モデルであるNeuroVFMを紹介する。
NeuroVFMは、脳解剖学と病理学の包括的表現を学び、放射線診断や報告生成を含む複数の臨床タスクで最先端のパフォーマンスを達成する。
このモデルは、診断所見の創発的な神経解剖学的理解と解釈可能な視覚的基盤を示す。
軽量なビジュアルインストラクションチューニングを通じて、オープンソースの言語モデルと組み合わせることで、NeuroVFMは、フロンティアモデルを超える精度、臨床トリアージ、専門家の好みといった放射線学レポートを生成する。
臨床的に根ざした視覚的理解を通じて、NeuroVFMは幻覚所見と臨界誤差を減らし、より安全な臨床的決定支援を提供する。
これらの結果は、総合的な医療AI構築のパラダイムとしてヘルスシステム学習を確立し、臨床基礎モデルのためのスケーラブルなフレームワークを提供する。
関連論文リスト
- A Federated Learning Framework for Handling Subtype Confounding and Heterogeneity in Large-Scale Neuroimaging Diagnosis [22.017120252054625]
本稿では,ニューロイメージングCADシステムに適した新しいフェデレーション学習フレームワークを提案する。
私たちのアプローチには、最も適切なローカルモデルにサンプルをルーティングする動的ナビゲーションモジュールが含まれています。
1300名以上のMDD患者のfMRIデータと1100名の健常者を対象とした。
論文 参考訳(メタデータ) (2025-08-08T07:19:49Z) - Towards a general-purpose foundation model for fMRI analysis [58.06455456423138]
我々は,4次元fMRIボリュームから学習し,多様なアプリケーション間で効率的な知識伝達を可能にするフレームワークであるNeuroSTORMを紹介する。
NeuroSTORMは、複数のセンターにまたがる5万人以上の被験者から5歳から100歳までの28.65万fMRIフレーム(→9000時間)で事前トレーニングされている。
年齢/性別予測、表現型予測、疾患診断、fMRI-to-image検索、タスクベースのfMRIの5つのタスクにおいて、既存の手法よりも優れています。
論文 参考訳(メタデータ) (2025-06-11T23:51:01Z) - REMEMBER: Retrieval-based Explainable Multimodal Evidence-guided Modeling for Brain Evaluation and Reasoning in Zero- and Few-shot Neurodegenerative Diagnosis [6.446611581074913]
検索型マルチモーダル誘導型脳評価・推論モデルREMEMBERについて紹介する。
REMEMBERは、脳MRIスキャンを用いたゼロショットと少数ショットのアルツハイマーの診断を容易にする新しい機械学習フレームワークである。
実験結果から,REMEMBERはゼロショットと少数ショットの堅牢な性能を実現することが示された。
論文 参考訳(メタデータ) (2025-04-12T22:06:15Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Improving the Diagnosis of Psychiatric Disorders with Self-Supervised
Graph State Space Models [0.0]
静止機能磁気共鳴画像(rs-fMRI)から異種精神疾患の診断を改善するための枠組みを提案する。
rs-fMRIデータをモデル化するために、最近提案された状態空間モデルS4への拡張であるGraph-S4を開発した。
このフレームワークとGraph-S4を組み合わせることで、3つのオープンソースマルチセンター rs-fMRI 臨床データセットにおいて、MDD と ASD のニューロイメージングに基づく単体予測モデルの診断性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-06-07T14:15:43Z) - Deep and Statistical Learning in Biomedical Imaging: State of the Art in
3D MRI Brain Tumor Segmentation [1.7403133838762446]
脳画像研究における主要な統計・深層学習モデルとその応用を批判的にレビューする。
その結果、モデル駆動の古典統計とデータ駆動のディープラーニングは、臨床腫瘍学における自動化システムを開発するための強力な組み合わせであることを強調した。
論文 参考訳(メタデータ) (2021-03-09T16:15:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。