論文の概要: DaX: Learning General Pathology Representations Across Scales
- arxiv url: http://arxiv.org/abs/2606.06983v1
- Date: Fri, 05 Jun 2026 07:21:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.607864
- Title: DaX: Learning General Pathology Representations Across Scales
- Title(参考訳): DaX: スケール全体にわたる一般的な病理表現の学習
- Authors: Bokai Zhao, Yiyang Zhang, Long Bai, Tai Ma, Hanqing Chao, Minfeng Xu,
- Abstract要約: DaXは、DINOv3スタイルの自己教師型学習を全身的な病理組織学に適用する、病理視覚基盤モデルである。
44の公開データセットから161の臨床的意義のあるタスクからなるWSIレベルのベンチマークを構築した。
DaXはタスク間で最高の平均パフォーマンスを達成し、タスクレベルのスコアは一貫して高い。
- 参考スコア(独自算出の注目度): 11.473742972775455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computational pathology requires visual representations that transfer across diverse clinical endpoints and remain robust to variation in magnification, staining, scanner type, slide preparation, and input resolution. We present DaX, a pathology vision foundation model that adapts DINOv3-style self-supervised learning to whole-slide histopathology. DaX is initialized from natural-image DINOv3 weights and incorporates continuous magnification training, cross-scale tissue views, orientation-agnostic and acquisition-robust augmentation, multi-input-size training, and Gram-anchored dense consistency. These designs aim to connect local cellular morphology with global tissue architecture while stabilizing dense token-level representations across input scales. We further construct a WSI-level benchmark comprising 161 clinically meaningful tasks from 44 public datasets, covering 28,182 patients and 34,394 slides across four clinical domains and nine task categories. All models are evaluated under a fixed patient-level cross-validation protocol with fold-level statistical ranking, enabling reproducible comparisons that are less sensitive to split-dependent variation. Across this benchmark, DaX achieves the highest mean performance across tasks and consistently strong task-level ranking scores, with gains spanning diagnostic pathology, biomarker and molecular profiling, tissue/specimen context, and risk, response, and prognosis. These results support DaX as a transferable visual encoder for computational pathology and provide a standardized evaluation framework for future pathology foundation models. Project page: https://alibaba-damo-academy.github.io/DaX/benchboard/.
- Abstract(参考訳): コンピュータ病理学は、様々な臨床エンドポイントを横断する視覚的表現を必要とし、拡大、染色、スキャナータイプ、スライド準備、入力解像度の変動に頑健なままである。
本稿では,DINOv3スタイルの自己指導型病理組織学に適応する病理視覚基盤モデルDaXを提案する。
DaXは、自然像のDINOv3重みから初期化され、連続倍率トレーニング、クロススケール組織ビュー、配向非依存および獲得ロバスト増強、マルチインプットサイズトレーニング、グラムアンカレート密度一貫性を取り入れている。
これらの設計は、局所的な細胞形態とグローバルな組織構造を結びつけることを目的としており、入力スケールにわたって密度の高いトークンレベルの表現を安定化することを目的としている。
さらに、44の公開データセットから161の臨床的意義のあるタスクからなるWSIレベルのベンチマークを構築し、4つの臨床領域と9つのタスクカテゴリにわたる28,182の患者と34,394のスライドをカバーした。
全てのモデルは、折りたたみレベルの統計ランキングを持つ固定された患者レベルのクロスバリデーションプロトコルで評価され、分割依存性のばらつきに敏感でない再現可能な比較を可能にする。
このベンチマーク全体では、DaXはタスク間での最高の平均パフォーマンスと、一貫して強いタスクレベルのランキングスコアを達成し、診断病理、バイオマーカーと分子プロファイリング、組織/専門のコンテキスト、リスク、応答、予後にまたがるゲインを得た。
これらの結果はDaxをコンピュータ病理学のための伝達可能なビジュアルエンコーダとしてサポートし、将来の病理基盤モデルのための標準化された評価フレームワークを提供する。
プロジェクトページ:https://alibaba-damo-academy.github.io/DaX/benchboard/.com
関連論文リスト
- HistoViT: Vision Transformer for Accurate and Scalable Histopathological Cancer Diagnosis [1.5939351525664014]
マルチクラス腫瘍分類のためのトランスフォーマーに基づくディープラーニングフレームワークを提案する。
本手法は従来の畳み込みニューラルネットワークの限界に対処する。
アプローチ分類では, 乳がん, 前立腺癌, 骨癌, 頸部癌が99.32%, 96.92%, 95.28%, 96.94%であった。
論文 参考訳(メタデータ) (2025-08-15T03:10:52Z) - Towards Accurate and Interpretable Neuroblastoma Diagnosis via Contrastive Multi-scale Pathological Image Analysis [16.268045905735818]
病理画像分類に適したコントラスト学習に基づくマルチスケール機能融合モデルであるCMSwinKANを提案する。
マルチスケールの特徴を融合させ、対照的な学習戦略を活用することで、CMSwinKANは臨床医の包括的なアプローチを模倣する。
その結果、CMSwinKANは、既存の最先端の病理モデルよりも、大規模なデータセットで事前訓練されたモデルよりもパフォーマンスがよいことが示された。
論文 参考訳(メタデータ) (2025-04-18T15:39:46Z) - Revisiting Automatic Data Curation for Vision Foundation Models in Digital Pathology [41.34847597178388]
視覚基盤モデル(FM)は、全スライディング画像から抽出された高度に異質なタイルの組織学的特徴を表現することを学ぶ。
タイルレベルでの教師なし自動データキュレーションの可能性について検討し,3億5000万個のタイルを考慮に入れた。
論文 参考訳(メタデータ) (2025-03-24T14:23:48Z) - Fairness Evolution in Continual Learning for Medical Imaging [47.52603262576663]
本研究では、ドメイン固有の公平度指標を用いてタスク間でバイアスがどのように進化し、異なるCL戦略がこの進化にどのように影響するかを検討する。
以上の結果から,擬似ラベルと擬似ラベルの学習は最適分類性能を実現するが,擬似ラベルの偏りは小さいことが示唆された。
論文 参考訳(メタデータ) (2024-04-10T09:48:52Z) - MedFMC: A Real-world Dataset and Benchmark For Foundation Model
Adaptation in Medical Image Classification [41.16626194300303]
ファンデーションモデルは、多くの場合、大規模なデータで事前訓練されているが、様々なビジョンや言語アプリケーションのジャンプ開始において、最も成功している。
最近の進歩により、下流タスクにおける基礎モデルの適応は、少数のトレーニングサンプルだけで効率的に行えるようになった。
しかし, 医用画像解析におけるそのような学習パラダイムの適用は, 一般に公開されているデータやベンチマークが不足しているため, 依然として少ない。
論文 参考訳(メタデータ) (2023-06-16T01:46:07Z) - Application of Transfer Learning and Ensemble Learning in Image-level
Classification for Breast Histopathology [9.037868656840736]
CAD(Computer-Aided Diagnosis)では、従来の分類モデルでは、主に1つのネットワークを使って特徴を抽出する。
本稿では良性病変と悪性病変のバイナリ分類のための画像レベルラベルに基づく深層アンサンブルモデルを提案する。
結果: アンサンブルネットワークモデルにおいて、画像レベルのバイナリ分類は9,8.90%の精度を達成する。
論文 参考訳(メタデータ) (2022-04-18T13:31:53Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - Co-Heterogeneous and Adaptive Segmentation from Multi-Source and
Multi-Phase CT Imaging Data: A Study on Pathological Liver and Lesion
Segmentation [48.504790189796836]
我々は,新しいセグメンテーション戦略,コヘテロジネティック・アダプティブセグメンテーション(CHASe)を提案する。
本稿では,外見に基づく半スーパービジョン,マスクに基づく対向ドメイン適応,擬似ラベルを融合した多目的フレームワークを提案する。
CHASeは4.2% sim 9.4%$の範囲で、病理的な肝臓マスクDice-Sorensen係数をさらに改善することができる。
論文 参考訳(メタデータ) (2020-05-27T06:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。