論文の概要: Pillar-0: A New Frontier for Radiology Foundation Models
- arxiv url: http://arxiv.org/abs/2511.17803v1
- Date: Fri, 21 Nov 2025 21:50:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.436135
- Title: Pillar-0: A New Frontier for Radiology Foundation Models
- Title(参考訳): Pillar-0: 放射線学の基礎モデルのための新たなフロンティア
- Authors: Kumar Krishna Agrawal, Longchao Liu, Long Lian, Michael Nercessian, Natalia Harguindeguy, Yufu Wu, Peter Mikhael, Gigin Lin, Lecia V. Sequist, Florian Fintelmann, Trevor Darrell, Yutong Bai, Maggie Chung, Adam Yala,
- Abstract要約: 腹部骨盤CT42,990例,胸部CT86,411例,頭部CT14,348例,胸部MRI11,543例にPillar-0を導入した。
Pillar-0は平均86.4、88.0、90.1、82.9のAUROCを達成し、MedGemma (Google)、MedImageInsight (Microsoft)、Lingshu (Alibaba)、Merlin (スタンフォード)を7.8-15.8のAUROCポイントで上回り、87.2% (319/366)タスクでランクインしている。
- 参考スコア(独自算出の注目度): 41.640120966890954
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Radiology plays an integral role in modern medicine, yet rising imaging volumes have far outpaced workforce growth. Foundation models offer a path toward assisting with the full spectrum of radiology tasks, but existing medical models remain limited: they process volumetric CT and MRI as low-fidelity 2D slices, discard critical grayscale contrast information, and lack evaluation frameworks that reflect real clinical practice. We introduce Pillar-0, a radiology foundation model pretrained on 42,990 abdomen-pelvis CTs, 86,411 chest CTs, 14,348 head CTs, and 11,543 breast MRIs from a large academic center, together with RATE, a scalable framework that extracts structured labels for 366 radiologic findings with near-perfect accuracy using LLMs. Across internal test sets of 14,230 abdomen-pelvis CTs, 10,646 chest CTs, 4,906 head CTs, and 1,585 breast MRIs, Pillar-0 establishes a new performance frontier, achieving mean AUROCs of 86.4, 88.0, 90.1, and 82.9, outperforming MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba), and Merlin (Stanford) by 7.8-15.8 AUROC points and ranking best in 87.2\% (319/366) tasks. Pillar-0 similarly outperforms all baselines in an external validation on the Stanford Abdominal CT dataset, including Merlin (82.2 vs 80.6 AUROC). Pillar-0 extends to tasks beyond its pretraining, such as long-horizon lung cancer risk prediction, where it improves upon the state-of-the-art Sybil by 3.0 C-index points on NLST, and generalizes with gains of 5.9 (MGH) and 1.9 (CGMH). In brain hemorrhage detection, Pillar-0 obtained a >95 AUROC when using only 1/20th of the data of the next most sample efficient baseline. Pillar-0 and RATE together provide an open, clinically rigorous foundation for building high-performance radiology systems, enabling applications that were previously infeasible due to computational, data, and evaluation constraints.
- Abstract(参考訳): 放射線医学は現代医学において重要な役割を担っているが、画像量の増加は労働力の伸びをはるかに上回っている。
基礎的なモデルは、放射線学のタスクの完全な範囲を支援するための道を提供するが、既存の医療モデルは、容積CTとMRIを低忠実な2Dスライスとして処理し、重要なグレースケールのコントラスト情報を破棄し、実際の臨床実践を反映する評価フレームワークを欠いている。
42,990個の腹部骨盤CT,86,411個の胸部CT,14,348個の頭部CT,11,543個の胸部MRIに事前トレーニングした放射線学基礎モデルであるPillar-0と,LLMを用いた366個のX線学的発見のための構造化ラベルを抽出するスケーラブルなフレームワークであるRATEを紹介する。
14,230個の腹部骨盤CT,10,646個の胸部CT,4,906個の頭部CT,1,585個の胸部MRIからなる内部テストセットを通じて、Pillar-0は、平均AUROC 86.4, 88.0, 90.1, 82.9を達成し、MedGemma (Google), MedImageInsight (Microsoft), Lingshu (Alibaba), Merlin (Stanford) を7.8-15.8個のAUROC で上回り、87.2\% (319/366) のタスクでランク付けした。
Pillar-0 も同様に、Merlin (82.2 vs 80.6 AUROC) を含む、スタンフォード腹部CTデータセットの外部検証において、すべてのベースラインを上回っている。
Pillar-0は、長期の肺がんリスク予測のような事前訓練以上のタスクに拡張され、NLSTの3.0Cインデクスポイントで最先端のSybilを改善し、5.9(MGH)と1.9(CGMH)のゲインを一般化する。
脳出血の検出において、Pillar-0は次の最も効率的なベースラインのデータの1/20だけを使用することで、95AUROCの値を得た。
Pillar-0 と RATE は共に、高性能な放射線学システムを構築するためのオープンで臨床的に厳格な基盤を提供する。
関連論文リスト
- Evaluating Large Language Models for Zero-Shot Disease Labeling in CT Radiology Reports Across Organ Systems [1.1373722549440357]
胸部,腹部,骨盤CTの多自由度ラベル付けのためのルールベースアルゴリズム(RBA),RadBERT,および3つの軽量オープンウェイトLCMを比較した。
コーエンのKappaとマイクロ/マクロ平均F1スコアを用いて評価した。
論文 参考訳(メタデータ) (2025-06-03T18:00:08Z) - Explainable Anatomy-Guided AI for Prostate MRI: Foundation Models and In Silico Clinical Trials for Virtual Biopsy-based Risk Assessment [3.5408411348831232]
MRIによる前立腺癌(PCa)のリスク階層化のための,完全に自動化された,解剖学的に指導されたディープラーニングパイプラインを提案する。
パイプラインは、前立腺とそのゾーンを軸方向のT2強調MRI上にセグメント化するためのnnU-Netモジュール、オプションの解剖学的先行と臨床データで3Dパッチに微調整されたDiceedPT Swin Transformer基盤モデルに基づく分類モジュール、決定駆動画像領域をローカライズする反ファクトなヒートマップを生成するVAE-GANフレームワークの3つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2025-05-23T14:40:09Z) - Towards a Holistic Framework for Multimodal Large Language Models in Three-dimensional Brain CT Report Generation [42.06416052431378]
2Dラジオグラフィーキャプションは、ボリューム3D解剖学における現実の診断課題を反映するものではない。
我々は18,885組の3D-BrainCTデータセットを収集し,臨床ビジュアルインストラクション・チューニングを用いて,脳波モデルを用いて放射線治療を施した3D脳CTレポートを作成した。
私たちの研究は、3Dの脳CTデータセットのキュレーション、微調整による解剖学的意味のある言語モデル、堅牢な放射線学評価指標の提案など、総合的な枠組みを具現化したものです。
論文 参考訳(メタデータ) (2024-07-02T12:58:35Z) - Quantifying uncertainty in lung cancer segmentation with foundation models applied to mixed-domain datasets [6.712251433139412]
医用画像基盤モデルは、極小調整で臓器や腫瘍を分割する能力を示している。
これらのモデルは通常、タスク固有の分散(ID)データセットで評価される。
我々は、自己教師付き学習(SSL)で訓練された複数の基礎モデルの性能を評価するために、計算的に高速なメトリクスの包括的セットを導入する。
SMITは最も高いF1スコア(LRAD: 0.60, 5Rater: 0.64)と低いエントロピー(LRAD: 0.06, 5Rater: 0.12)を生成し、高い腫瘍検出率と確実なセグメンテーションを示した。
論文 参考訳(メタデータ) (2024-03-19T19:36:48Z) - Attention-based Saliency Maps Improve Interpretability of Pneumothorax
Classification [52.77024349608834]
視覚変換器(ViT)の胸部X線撮影(CXR)分類性能と注意ベース唾液の解釈可能性について検討する。
ViTは、CheXpert、Chest X-Ray 14、MIMIC CXR、VinBigDataの4つの公開データセットを用いて、肺疾患分類のために微調整された。
ViTsは最先端のCNNと比べてCXR分類AUCに匹敵するものであった。
論文 参考訳(メタデータ) (2023-03-03T12:05:41Z) - TotalSegmentator: robust segmentation of 104 anatomical structures in CT
images [48.50994220135258]
身体CT画像の深層学習セグメント化モデルを提案する。
このモデルは、臓器の容積、疾患の特徴、外科的または放射線療法計画などのユースケースに関連する104の解剖学的構造を区分することができる。
論文 参考訳(メタデータ) (2022-08-11T15:16:40Z) - Open-radiomics: A Collection of Standardized Datasets and a Technical Protocol for Reproducible Radiomics Machine Learning Pipelines [0.0]
我々は,3つのオープンソースデータセット,高次グリオーマ(HGG)と低次グリオーマ(LGG)の分類と生存分析のためのBraTS 2020に基づいて,大規模放射線学データセットをキュレートした。
脳腫瘍369例(GG76例,HG293例)に本プロトコルを適用した。
binWidthや画像正規化とは異なり,腫瘍の亜領域と画像の配列はモデルの性能に大きく影響した。
論文 参考訳(メタデータ) (2022-07-29T16:37:46Z) - A self-supervised learning strategy for postoperative brain cavity
segmentation simulating resections [46.414990784180546]
畳み込みニューラルネットワーク(CNN)は最先端の画像セグメンテーション技術である。
CNNはトレーニングに大量の注釈付きデータセットを必要とする。
自己教師型学習戦略は、トレーニングにラベルのないデータを活用することができる。
論文 参考訳(メタデータ) (2021-05-24T12:27:06Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。