論文の概要: Scanner-Induced Domain Shifts Undermine the Robustness of Pathology Foundation Models
- arxiv url: http://arxiv.org/abs/2601.04163v1
- Date: Wed, 07 Jan 2026 18:24:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-08 18:12:46.228347
- Title: Scanner-Induced Domain Shifts Undermine the Robustness of Pathology Foundation Models
- Title(参考訳): 走査型ドメインシフトは病理基礎モデルのロバスト性を損なう
- Authors: Erik Thiringer, Fredrik K. Gustafsson, Kajsa Ledesma Eriksson, Mattias Rantalainen,
- Abstract要約: 病理基盤モデル(PFM)は、計算病理学の中心となっている。
ベンチマーク性能は高いが、実世界の技術的ドメインシフトに対するPFMの堅牢性はよく分かっていない。
スキャナによる可変性に対する14個のPFMのロバスト性を評価する。
- 参考スコア(独自算出の注目度): 3.8310079617300876
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pathology foundation models (PFMs) have become central to computational pathology, aiming to offer general encoders for feature extraction from whole-slide images (WSIs). Despite strong benchmark performance, PFM robustness to real-world technical domain shifts, such as variability from whole-slide scanner devices, remains poorly understood. We systematically evaluated the robustness of 14 PFMs to scanner-induced variability, including state-of-the-art models, earlier self-supervised models, and a baseline trained on natural images. Using a multiscanner dataset of 384 breast cancer WSIs scanned on five devices, we isolated scanner effects independently from biological and laboratory confounders. Robustness is assessed via complementary unsupervised embedding analyses and a set of clinicopathological supervised prediction tasks. Our results demonstrate that current PFMs are not invariant to scanner-induced domain shifts. Most models encode pronounced scanner-specific variability in their embedding spaces. While AUC often remains stable, this masks a critical failure mode: scanner variability systematically alters the embedding space and impacts calibration of downstream model predictions, resulting in scanner-dependent bias that can impact reliability in clinical use cases. We further show that robustness is not a simple function of training data scale, model size, or model recency. None of the models provided reliable robustness against scanner-induced variability. While the models trained on the most diverse data, here represented by vision-language models, appear to have an advantage with respect to robustness, they underperformed on downstream supervised tasks. We conclude that development and evaluation of PFMs requires moving beyond accuracy-centric benchmarks toward explicit evaluation and optimisation of embedding stability and calibration under realistic acquisition variability.
- Abstract(参考訳): 病理基盤モデル(PFM)は,全スライディング画像(WSI)から特徴抽出を行う汎用エンコーダを提供することを目的として,計算病理の中心となっている。
ベンチマーク性能は高いが、全スライディングスキャナデバイスからの可変性など、実世界の技術的ドメインシフトに対するPFMの堅牢性はいまだによく分かっていない。
我々は,14個のPFMのスキャナによる可変性に対する頑健さを系統的に評価し,最新技術モデル,初期の自己監督モデル,自然画像に基づいて訓練されたベースラインについて検討した。
WSIは5つのデバイスでスキャンされた384個の乳がんのマルチスキャナーデータセットを用いて,生物学的・実験共同設立者と独立にスキャナー効果を分離した。
ロバストネスは、補完的な教師なし埋め込み分析と臨床病理学的教師付き予測タスクのセットを通じて評価される。
以上の結果から,現在のPFMはスキャナによるドメインシフトに不変ではないことが明らかとなった。
ほとんどのモデルは、埋め込み空間におけるスキャナ固有の可変性をエンコードする。
スキャナ変数は、埋め込み空間を体系的に変更し、下流モデル予測のキャリブレーションに影響を与える。
さらに、ロバスト性は、データスケール、モデルサイズ、モデルの信頼性をトレーニングする単純な機能ではないことも示しています。
いずれのモデルも、スキャナによる可変性に対する信頼性の高い堅牢性を提供していなかった。
最も多様なデータに基づいてトレーニングされたモデルは、ここではビジョン言語モデルによって表現されているが、ロバスト性に関して利点があるように見えるが、下流の教師付きタスクではパフォーマンスが低かった。
我々は, PFMの開発と評価は, 精度中心のベンチマークを超えて, 現実的な取得変数下での埋め込み安定性とキャリブレーションの明示的評価と最適化を行う必要があると結論付けた。
関連論文リスト
- Pathology Foundation Models are Scanner Sensitive: Benchmark and Mitigation with Contrastive ScanGen Loss [6.310092608526967]
ファンデーションモデル(FM)は依然としてスキャナーバイアスに悩まされている。
ScanGenは,タスク固有の微調整時に適用され,スキャナのバイアスを軽減する。
肺がんにおける上皮成長因子受容体(EGFR)変異予測のマルチインスタンス学習タスクに本手法を適用した。
論文 参考訳(メタデータ) (2025-07-29T12:35:08Z) - SCORPION: Addressing Scanner-Induced Variability in Histopathology [7.091734389835427]
様々な領域にわたる信頼性の高いモデル性能を保証することは、計算病理学において重要な課題である。
我々は、スキャナの可変性の下でモデル信頼性を評価するために明示的に設計された新しいデータセットであるSCORPIONをリリースする。
拡張型ドメイン一般化技術と整合性損失を組み合わせたフレキシブルなフレームワークであるSimConsを提案する。
論文 参考訳(メタデータ) (2025-07-28T15:00:49Z) - CNS-Bench: Benchmarking Image Classifier Robustness Under Continuous Nuisance Shifts [78.79936076607373]
我々は,連続ニュアンスシフトベンチマークであるCNS-Benchを導入し,連続かつ現実的なニュアンスシフトのための画像分類器の堅牢性を定量化する。
本稿では,従来の手法よりも優れたフィルタリング機構を提案し,生成モデルによる信頼性の高いベンチマークを可能にする。
論文 参考訳(メタデータ) (2025-07-23T16:15:48Z) - Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - Improving Robustness and Reliability in Medical Image Classification with Latent-Guided Diffusion and Nested-Ensembles [4.249986624493547]
一度展開すると、医用画像解析法は予期せぬ画像の破損やノイズの摂動に直面することが多い。
LaDiNEは、視覚変換器のロバスト性と拡散に基づく生成モデルを組み合わせた、新しいアンサンブル学習手法である。
結核胸部X線とメラノーマ皮膚がんデータセットの実験により、LaDiNEは幅広い最先端の方法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-10-24T15:53:07Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Improved inter-scanner MS lesion segmentation by adversarial training on
longitudinal data [0.0]
ホワイトマター病変進展の評価は,MS患者の経過観察において重要なバイオマーカーである。
現在の自動病変分割アルゴリズムは、MRIスキャナーやプロトコルの違いに関連する画像特性の変化の影響を受けやすい。
スキャン間研究におけるMS病変のセグメンテーションの整合性を改善するモデルを提案する。
論文 参考訳(メタデータ) (2020-02-03T16:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。