論文の概要: Benchmarking Foundation Models for Renal Lesion Stratification in CT
- arxiv url: http://arxiv.org/abs/2605.07749v1
- Date: Fri, 08 May 2026 13:56:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.085346
- Title: Benchmarking Foundation Models for Renal Lesion Stratification in CT
- Title(参考訳): CTにおける腎病変階層化のためのベンチマーク基礎モデル
- Authors: Hartmut Häntze, Sarah de Boer, Myrthe Buser, Alessa Hering, Bram van Ginneken, Mathias Prokop, Jawed Nawabi, Sebastian Ziegelmayer, Lisa Adams, Keno Bressem,
- Abstract要約: オープンソース医療基盤モデル(FM)は、医療画像モデルのトレーニングに使用することができる。
ここでは、FMと放射能を比較し、3D ResNet-50をゼロから訓練する。
FMは腎病変の成層化の確立したモデルを超えず、放射線を現在の最先端として残した。
- 参考スコア(独自算出の注目度): 2.051956285018868
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid proliferation of open-source medical foundation models (FMs) raises a practical question: how well do their pre-trained representations transfer to clinically relevant but data-scarce classification tasks? Particularly in CT-based renal lesion classification, a push toward greater generalizability would be meaningful, as the field is constrained by inherently limited training data. We addressed this through a benchmark of three medical FMs on this specific task. This six-class problem spans common entities like cysts and clear cell renal cell carcinoma, alongside rare subtypes. Using a frozen feature-probing protocol, we compared FM embeddings against a handcrafted radiomics classifier and a 3D ResNet-50 trained from scratch. Models were trained on a composite dataset of 2,854 lesions and evaluated on an external test set of 234 lesions from The Cancer Imaging Archive. Our results reveal two key findings. First, FM performance (AUC 0.70-0.77) matched the from-scratch ResNet (AUC 0.72) while drastically reducing hardware demand, requiring only seconds on a CPU after feature extraction. However, the conventional radiomics baseline significantly outperformed all deep learning approaches, achieving an AUC of 0.88 (all p $\leq$ 0.002). This suggests that current generalist FM embeddings do not yet capture the fine-grained texture and shape heterogeneity driving histological subtype discrimination. Despite their potential in data-scarce settings, medical FMs did not surpass established models for renal lesion stratification, leaving radiomics as the current state-of-the-art.
- Abstract(参考訳): オープンソース医療基盤モデル(FM)の急激な普及は、その事前訓練された表現が、臨床的に関連があるがデータスカースな分類タスクにどの程度うまく移行できるかという、実践的な疑問を提起する。
特にCTベースの腎病変分類では、フィールドは本質的に限られた訓練データによって制限されるため、より一般化性を高めることが有意義である。
我々は、この特定のタスクに関する3つの医療用FMのベンチマークを通じて、この問題に対処した。
この6種類の問題は、まれなサブタイプとともに、嚢胞や透明な細胞腎細胞癌のような一般的なエンティティにまたがる。
凍結した特徴探索プロトコルを用いて,手作りラジオミクス分類器と3D ResNet-50のスクラッチから訓練したFM埋め込みを比較した。
モデルは2,854病変の複合データセットで訓練され、The Cancer Imaging Archiveから234病変の外部テストセットで評価された。
以上の結果から2つの重要な結果が得られた。
まず、FM性能(AUC 0.70-0.77)は、オフスクラッチのResNet(AUC 0.72)と一致し、ハードウェアの需要を大幅に減らした。
しかし、従来の放射能のベースラインは深層学習のアプローチを著しく上回り、AUCは0.88(全てp$\leq$0.002)に達した。
これは、現在の一般FM埋め込みが、組織学的サブタイプ識別を駆動する微細なテクスチャや形状の不均一性をまだ捉えていないことを示唆している。
データスカース設定の可能性にもかかわらず、医療用FMは腎病変の成層化の確立したモデルを超えておらず、現在の最先端技術として放射線が残されている。
関連論文リスト
- Pillar-0: A New Frontier for Radiology Foundation Models [41.640120966890954]
腹部骨盤CT42,990例,胸部CT86,411例,頭部CT14,348例,胸部MRI11,543例にPillar-0を導入した。
Pillar-0は平均86.4、88.0、90.1、82.9のAUROCを達成し、MedGemma (Google)、MedImageInsight (Microsoft)、Lingshu (Alibaba)、Merlin (スタンフォード)を7.8-15.8のAUROCポイントで上回り、87.2% (319/366)タスクでランクインしている。
論文 参考訳(メタデータ) (2025-11-21T21:50:34Z) - Taylor-Series Expanded Kolmogorov-Arnold Network for Medical Imaging Classification [0.0]
本研究は,限られた多様なデータセットを用いた正確な医用画像分類のためのKAN(Kolmogorov-Arnold Networks)を紹介する。
モデルはSBTAYLOR-KAN、B-splinesとTaylorシリーズの統合、SBRBF-KAN、Morletウェーブレット変換にB-splinesを埋め込むSBWAVELET-KANである。
脳MRI,胸部X線,結核X線,皮膚病変画像を前処理なしで評価した。
論文 参考訳(メタデータ) (2025-09-17T04:33:54Z) - Multi-Attention Stacked Ensemble for Lung Cancer Detection in CT Scans [3.8121150313479655]
3つの事前訓練されたバックボーンは96 x 96ピクセルの入力に合わせたカスタム分類ヘッドで適合する。
2段階の注意機構は、ロジットからモデルワイドとクラスワイドの両方の重要点を学習する。
LIDC-IDRIデータセットの実験では、98.09の精度と0.9961 AUCを達成した。
論文 参考訳(メタデータ) (2025-07-27T11:03:07Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [56.99710477905796]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware Prostate Cancer Classification [42.75911994044675]
前立腺MRIの非対位画像翻訳のための新しいアプローチと臨床的に重要なPCaを分類するための不確実性認識トレーニングアプローチを提案する。
提案手法では,無ペアの3.0T多パラメータ前立腺MRIを1.5Tに翻訳し,利用可能なトレーニングデータを増強する。
実験の結果,提案手法は,従来の研究に比べてAUC(Area Under ROC Curve)を20%以上改善することがわかった。
論文 参考訳(メタデータ) (2023-07-02T05:26:54Z) - Deep Learning to Quantify Pulmonary Edema in Chest Radiographs [7.121765928263759]
肺浮腫の重症度を胸部X線写真で分類する機械学習モデルを開発した。
深層学習モデルは、大きな胸部X線写真データセットで訓練された。
論文 参考訳(メタデータ) (2020-08-13T15:45:44Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z) - Handling Missing MRI Input Data in Deep Learning Segmentation of Brain
Metastases: A Multi-Center Study [1.4463443378902883]
深層学習に基づくDropOutと呼ばれる脳転移の自動セグメンテーションのためのセグメンテーションモデルが、マルチシーケンスMRIで訓練された。
セグメンテーションの結果は、最先端のDeepLabV3モデルの性能と比較された。
DropOutモデルはDeepLabV3モデルに比べてかなり高いスコアを示した。
論文 参考訳(メタデータ) (2019-12-27T02:49:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。