論文の概要: Validation of Whole-Slide Foundation Models for Image Retrieval in TCGA Data
- arxiv url: http://arxiv.org/abs/2605.00902v1
- Date: Tue, 28 Apr 2026 19:19:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.467276
- Title: Validation of Whole-Slide Foundation Models for Image Retrieval in TCGA Data
- Title(参考訳): TCGAデータにおける画像検索のための全すべり基礎モデルの検証
- Authors: Tianhao Lei, Parsa Esmaeilkhani, Saghir Alfasly, Wataru Uegami, Judy C. Boughey, Matthew P. Goetz, Krishna R. Kalari, H. R. Tizhoosh,
- Abstract要約: 私たちはThe Cancer Genome Atlasの17の臓器と60の診断にまたがる9,387の診断スライドで10のパイプラインをベンチマークした。
方法としては、4つの事前訓練されたスライド基盤モデル、パッチ埋め込みのための注意ベースの多重インスタンス学習(ABMIL)アグリゲータ、パッチレベルの検索がある。
- 参考スコア(独自算出の注目度): 1.834937230572996
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Foundation models are reshaping computational histopathology, yet their value for whole-slide image retrieval relative to strong patch-based and supervised aggregation baselines remains unclear. We benchmarked ten pipelines on 9,387 diagnostic slides spanning 17 organs and 60 diagnoses from The Cancer Genome Atlas (TCGA) using patient-level leave-one-patient-out evaluation. Methods included four pre-trained slide foundation models, a supervised attention-based multiple instance learning (ABMIL) aggregator on patch embeddings, and patch-level retrieval across five sampling densities. Performance varied more across organs and diagnoses than across architectures. Although the slide foundation model TITAN achieved the strongest overall results, its advantage was modest; ABMIL and patch-based methods reached comparable Top-1 and Top-3 accuracy, with no model consistently dominant. Morphologically distinctive entities approached ceiling performance, while rare, heterogeneous, and closely related subtypes remained challenging. Misclassifications aligned with organs exhibiting known inter-observer variability, suggesting an intrinsic ceiling for morphology-only retrieval. Performance was driven primarily by patch-level feature representations, with limited benefit from slide-level aggregation, indicating aggregation may be unnecessary in many settings. These findings argue against a universally optimal architecture and instead support organ-resolved benchmarking, diagnosis-aware or ensemble strategies, stronger feature representations, and multimodal retrieval frameworks. Notably, even the best model achieved only $\approx 68\% \pm 21\%$ retrieval accuracy on TCGA, and some subtypes showed $0\%$ accuracy across all methods, highlighting fundamental limitations of morphology-based representations and the need for substantial progress before reliable clinical deployment.
- Abstract(参考訳): 基礎モデルは計算病理学を再構築しているが、強いパッチベースと教師あり集約ベースラインに対する全スライディング画像検索の値はまだ不明である。
The Cancer Genome Atlas (TCGA) の臓器と60の診断を対象とし, 9,387の診断スライドで10のパイプラインをベンチマークした。
方法は、4つの事前訓練されたスライド基礎モデル、パッチ埋め込みにおける注意に基づく多重インスタンス学習(ABMIL)アグリゲータ、そして5つのサンプリング密度にわたるパッチレベルの検索である。
パフォーマンスは、建築全体よりも、臓器や診断によって異なっていた。
スライド基礎モデルであるTITANは、最も優れた総合的な結果を得たが、その利点は控えめであり、AMMILとパッチベースの手法はTop-1とTop-3の精度に匹敵し、モデルは一貫して支配的ではなかった。
形態学的に特異な実体は天井性能に近づいたが、希少で異質で近縁なサブタイプは困難なままであった。
異型化は、既知のサーバ間変動を示す臓器と一致し、形態のみの検索に固有の天井が示唆された。
パフォーマンスは、主にパッチレベルの特徴表現によって駆動され、スライドレベルのアグリゲーションのメリットは限られており、多くの設定でアグリゲーションが不要である可能性があることを示している。
これらの結果は、普遍的に最適なアーキテクチャに反対し、代わりにオルガン解決ベンチマーク、診断・認識・アンサンブル戦略、より強力な特徴表現、マルチモーダル検索フレームワークをサポートする。
特に、最良のモデルでさえ、TCGA上での検索精度が$\approx 68\% \pm 21\%しか達成せず、いくつかのサブタイプでは、すべてのメソッドで$0\%$の精度を示し、形態学に基づく表現の基本的な制限と、信頼性の高い臨床展開の前に実質的な進歩の必要性を強調している。
関連論文リスト
- Semantic Segmentation for Histopathology using Learned Regularization based on Global Proportions [36.19647813139097]
本稿では,大域比から高密度なセグメンテーションを推定する2段階のフレームワークであるVSLP(Label Proportions)について紹介する。
エンド・ツー・エンドのネットワークとは異なり、我々の変分法はフィデリティ・正則化エネルギーを可視化し、より解釈可能なセグメンテーションをもたらす。
既存の教師なしおよび教師なしの手法よりも優れた性能を達成し、2つの公開データセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2026-04-27T11:42:56Z) - GOLDMARK: Governed Outcome-Linked Diagnostic Model Assessment Reference Kit [7.891604152731754]
CB(Computational Biomarker)は、ヘマトキシリン・エオシン(H&E)全スライディング画像(WSI)から抽出した組織由来のパターンで、治療効果や予後を予測する。
臨床応用可能な OncoKB レベル1-3 バイオマーカーラベルを持つTCGAコーホート上に構築された標準化されたベンチマークフレームワークである GOLDMARK を紹介する。
論文 参考訳(メタデータ) (2026-03-21T15:09:06Z) - Benchmarking Computational Pathology Foundation Models For Semantic Segmentation [0.0]
CONCH、PathDino、CellViTのコンカレント機能は、すべてのデータセットで個々のモデルのパフォーマンスを7.95%向上させた。
視覚言語基盤モデルであるCONCHは,視覚のみの基礎モデルと比較して,データセット間で最高の性能を示した。
論文 参考訳(メタデータ) (2026-02-21T08:00:46Z) - LapFM: A Laparoscopic Segmentation Foundation Model via Hierarchical Concept Evolving Pre-training [39.51756689308245]
ラプFM(LapFM)は、大規模な未ラベルの手術画像から、堅牢なセグメンテーション能力を進化させるために設計された基礎モデルである。
本稿では,階層的一貫性に基づいて疑似ラベルを反復的に生成・フィルタリングする信頼駆動進化ラベルを提案する。
このプロセスは114Kのイメージマスク対からなる大規模ベンチマークであるLapBench-114Kを生成する。
論文 参考訳(メタデータ) (2025-12-09T10:09:31Z) - Foundation Models in Dermatopathology: Skin Tissue Classification [0.05397680436511065]
本研究では,UNIとVirchhow2の2つの基礎モデルの性能を,全スライディング画像の分類のための特徴抽出器として評価する。
平均アグリゲーション戦略を用いて, パッチレベルの埋め込みをスライドレベルの特徴に集約した。
その結果、Virchow2を用いて抽出したパッチレベルの特徴は、ほとんどのスライドレベルの分類器でUNIを介して抽出した特徴よりも優れていた。
論文 参考訳(メタデータ) (2025-10-24T17:21:43Z) - AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - FundusGAN: A Hierarchical Feature-Aware Generative Framework for High-Fidelity Fundus Image Generation [35.46876389599076]
FundusGANは、高忠実度ファンドス画像合成用に特別に設計された新しい階層的特徴認識生成フレームワークである。
我々は、FundusGANが複数のメトリクスにわたって最先端のメソッドを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-03-22T18:08:07Z) - A deep learning framework for efficient pathology image analysis [0.0]
本稿では,情報領域を選択的に解析することで病理学者をエミュレートするフレームワークであるEagleを紹介する。
スライドを2.27秒で処理し、既存のモデルと比較して計算時間を99%以上削減する。
堅牢で解釈可能なアウトプットを提供し、高速なスライド検索、マルチオミクスパイプラインへの統合、新たな臨床基盤モデルをサポートする。
論文 参考訳(メタデータ) (2025-02-18T16:45:01Z) - Towards A Generalizable Pathology Foundation Model via Unified Knowledge Distillation [41.25398139658467]
現在の基礎モデルは限定型とタスク数でのみ評価されており、その一般化能力と全体的な性能は不明確である。
本研究は,6つの異なる臨床タスクタイプにわたる既成基礎モデルの性能を評価するためのベンチマークを構築した。
本稿では, エキスパートと自己知識の双方からなる統合された知識蒸留フレームワークを提案し, モデルが複数のエキスパートモデルの知識から学べるようにした。
論文 参考訳(メタデータ) (2024-07-26T01:12:54Z) - Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective [32.93871326428446]
人工知能(AI)の最近の進歩は、医療画像と計算病理に革命をもたらしている。
デジタル全スライド画像(WSI)の解析における一定の課題は、何万ものタイルレベルの画像埋め込みをスライドレベルの表現に集約する問題である。
本研究は,9つの臨床的課題を対象とした10種類のスライドレベルのアグリゲーション手法のベンチマーク分析を行った。
論文 参考訳(メタデータ) (2024-07-10T17:00:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。