論文の概要: Mixed Magnification Aggregation for Generalizable Region-Level Representations in Computational Pathology
- arxiv url: http://arxiv.org/abs/2602.22176v1
- Date: Wed, 25 Feb 2026 18:23:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.947136
- Title: Mixed Magnification Aggregation for Generalizable Region-Level Representations in Computational Pathology
- Title(参考訳): 計算病理における一般化可能な領域レベル表現のための混合拡大集合
- Authors: Eric Zimmermann, Julian Viret, Michal Zelechowski, James Brian Hall, Neil Tenenholtz, Adam Casson, George Shaikovski, Eugene Vorontsov, Siqi Liu, Kristen A Severson,
- Abstract要約: そこで本研究では,スライド毎の表現数を削減できる領域レベルの混合エンコーダを提案する。
本手法は混合倍率基礎モデルの画像タイル表現を融合する。
その結果,癌による予測性能の改善が示された。
- 参考スコア(独自算出の注目度): 3.5825162237675787
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, a standard computational pathology workflow has emerged where whole slide images are cropped into tiles, these tiles are processed using a foundation model, and task-specific models are built using the resulting representations. At least 15 different foundation models have been proposed, and the vast majority are trained exclusively with tiles using the 20$\times$ magnification. However, it is well known that certain histologic features can only be discerned with larger context windows and requires a pathologist to zoom in and out when analyzing a whole slide image. Furthermore, creating 224$\times$224 pixel crops at 20$\times$ leads to a large number of tiles per slide, which can be gigapixel in size. To more accurately capture multi-resolution features and investigate the possibility of reducing the number of representations per slide, we propose a region-level mixing encoder. Our approach jointly fuses image tile representations of a mixed magnification foundation model using a masked embedding modeling pretraining step. We explore a design space for pretraining the proposed mixed-magnification region aggregators and evaluate our models on transfer to biomarker prediction tasks representing various cancer types. Results demonstrate cancer dependent improvements in predictive performance, highlighting the importance of spatial context and understanding.
- Abstract(参考訳): 近年,スライド画像全体をタイルに分解する標準的な計算病理ワークフローが出現し,これらのタイルは基礎モデルを用いて処理され,結果の表現を用いてタスク固有のモデルが構築されている。
少なくとも15の異なる基礎モデルが提案されており、大多数は20$\times$の倍率を使ってタイルでのみ訓練されている。
しかし、特定の組織学的特徴がより大きなコンテキストウィンドウでのみ識別できることはよく知られており、スライド画像全体を解析する際には、病理医がズームイン・アンド・アウトする必要がある。
さらに、224$\times$224ピクセルの作物を20$\times$で作成すると、スライド毎に多数のタイルが生成される。
マルチレゾリューションの特徴をより正確に捉え,スライド毎の表現回数を減らす可能性を検討するために,領域レベルの混合エンコーダを提案する。
本手法は,マスク埋め込みモデルプレトレーニングステップを用いて,混合倍率基礎モデルの画像タイル表現を融合する。
提案する混合磁化領域アグリゲータを事前学習するための設計空間を探索し, 種々のがん型を表すバイオマーカー予測タスクへの転移モデルの評価を行った。
その結果、がんによる予測性能の向上が示され、空間的文脈と理解の重要性が強調された。
関連論文リスト
- Prompt-Free Conditional Diffusion for Multi-object Image Augmentation [45.92182911052815]
マルチオブジェクト画像拡張のためのプロンプトフリー条件付き拡散フレームワークを提案する。
具体的には、画像から意味を抽出し、テキストを置換するローカル・グローバル・セマンティック・フュージョン戦略を導入する。
また、モデルトレーニングにおける従来の再建損失を支援するために、報酬モデルに基づく計数損失を設計する。
論文 参考訳(メタデータ) (2025-07-08T16:27:48Z) - PATHS: A Hierarchical Transformer for Efficient Whole Slide Image Analysis [9.862551438475666]
計算病理学におけるスライドレベルタスクにおける階層的弱教師付き表現学習のための新しいトップダウン手法を提案する。
PATHSは、人間の病理医がスライドを検査し、各倍率レベルでパッチを診断に関連する小さなサブセットにフィルタリングする、クロスマグニフィケーションの方法にインスパイアされている。
PATHSをThe Cancer Genome Atlas(TCGA)の5つのデータセットに適用し、スライドレベルの予測タスクにおいて優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-11-27T11:03:38Z) - ZoomLDM: Latent Diffusion Model for multi-scale image generation [57.639937071834986]
複数のスケールで画像を生成するための拡散モデルZoomLDMを提案する。
我々のアプローチの中心は、自己教師あり学習(SSL)埋め込みを利用した、新たな拡大対応条件付け機構である。
ZoomLDMは、コンテキスト的に正確であり、異なるズームレベルで詳細なコヒーレントな病理像を合成する。
論文 参考訳(メタデータ) (2024-11-25T22:39:22Z) - Multi-stream Cell Segmentation with Low-level Cues for Multi-modality
Images [66.79688768141814]
我々は,顕微鏡画像のラベル付けを行うセル分類パイプラインを開発した。
次に、分類ラベルに基づいて分類モデルを訓練する。
2種類のセグメンテーションモデルを、丸みを帯びた形状と不規則な形状のセグメンテーションセルに展開する。
論文 参考訳(メタデータ) (2023-10-22T08:11:08Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - An End-to-End Breast Tumour Classification Model Using Context-Based
Patch Modelling- A BiLSTM Approach for Image Classification [19.594639581421422]
我々は, この関係を, 特定の腫瘍領域から抽出したパッチ間の特徴に基づく相関関係と統合しようと試みている。
我々は、顕微鏡画像とWSI腫瘍領域の2つのデータセットでモデルをトレーニングし、テストした。
CNN機能付きBiLSTMは、パッチをエンドツーエンドの画像分類ネットワークにモデル化する上で、はるかに優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-05T10:43:58Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - Gigapixel Histopathological Image Analysis using Attention-based Neural
Networks [7.1715252990097325]
圧縮経路と学習経路からなるCNN構造を提案する。
本手法は,グローバル情報とローカル情報の両方を統合し,入力画像のサイズに関して柔軟であり,弱い画像レベルラベルのみを必要とする。
論文 参考訳(メタデータ) (2021-01-25T10:18:52Z) - Segmentation of Cellular Patterns in Confocal Images of Melanocytic
Lesions in vivo via a Multiscale Encoder-Decoder Network (MED-Net) [2.0487455621441377]
マルチスケールデコーダネットワーク(MED-Net)は,パターンのクラスに定量的なラベル付けを行う。
メラノサイト病変の117個の反射共焦点顕微鏡(RCM)モザイクの非重畳分割について,本モデルを訓練・試験した。
論文 参考訳(メタデータ) (2020-01-03T22:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。