論文の概要: Streamline pathology foundation model by cross-magnification distillation
- arxiv url: http://arxiv.org/abs/2509.23097v2
- Date: Wed, 01 Oct 2025 13:30:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-02 14:33:21.79902
- Title: Streamline pathology foundation model by cross-magnification distillation
- Title(参考訳): 断熱蒸留による流線型病理基礎モデル
- Authors: Ziyu Su, Abdul Rehman Akbar, Usama Sajjad, Anil V. Parwani, Muhammad Khalid Khan Niazi,
- Abstract要約: ファンデーションモデル(FM)は、計算病理を変容させたが、臨床展開では計算が禁じられている。
本稿では, コース磁化蒸留により開発された軽量FMであるXMAGを紹介する。
XMAGはコンパクトなバックボーンを採用しており、全スライド画像の11.3倍のパッチを必要とする。
- 参考スコア(独自算出の注目度): 0.9786690381850356
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Foundation models (FM) have transformed computational pathology but remain computationally prohibitive for clinical deployment due to their massive parameter counts and high-magnification processing requirements. Here, we introduce XMAG, a lightweight FM developed through corss-magnification distillation that transfers knowledge from state-of-the-art 20x magnification teacher to an efficient 5x magnification student architecture. XMAG employs a compact backbone and operates entirely at 5x, requiring 11.3 times fewer patches per whole slide image (WSI) compared to existing approaches. Our Novel distillation framework incorporates dual-level knowledge transfer, aligning both global image representations and local spatial token mapping. We trained XMAG on 3.49 million images curated from publicly available datasets and evaluated performance across six clinically relevant histopathology analysis tasks spanning multiple cancer types. XMAG achieved diagnostic accuracy within 1% of substantially larger foundation models while delivering 30-fold processing acceleration, reaching 8.8 WSIs per minute processing speed. Our cross-institutional validation confirmed robust generalization. Further, we developed an end-to-end training strategy to further boost our model's performance to approach the larger FMs' performance. These results establish cross-magnification distillation as a viable approach for deploying FM capabilities in resource-constrained clinical environments, potentially enabling real-time pathology AI integration.
- Abstract(参考訳): ファンデーションモデル(FM)は、計算病理を変容させたが、膨大なパラメータ数と高い磁化処理要求のため、臨床展開では計算が禁じられている。
本稿では,最新の20倍の倍率教師から効率的な5倍の倍率学生アーキテクチャへ知識を伝達する,コルスマグニフィケーション蒸留により開発された軽量FMであるXMAGを紹介する。
XMAGはコンパクトなバックボーンを採用しており、全スライド画像(WSI)の11.3倍のパッチを必要とする。
我々の新しい蒸留フレームワークは,グローバルな画像表現と局所的な空間トークンマッピングの両方を整合させて,二段階の知識伝達を取り入れている。
我々はXMAGを公開データセットから3,49万枚の画像で訓練し、複数のがんタイプにまたがる6つの臨床病理組織学的解析タスクのパフォーマンスを評価した。
XMAGは30倍の処理加速を実現し、1分間の処理速度で8.8 WSIに達した。
施設間検証の結果,堅牢な一般化が確認された。
さらに,我々のモデルの性能をさらに向上し,より大きなFMの性能にアプローチするためのエンドツーエンドのトレーニング戦略を開発した。
これらの結果は、資源制約された臨床環境にFM機能を展開するための有効なアプローチとして、クロスマグニフィケーション蒸留を確立し、リアルタイムの病理AI統合を可能にする可能性がある。
関連論文リスト
- A bag of tricks for real-time Mitotic Figure detection [0.0]
我々は,RTMDet単段物体検出装置の効率的な構築を行い,臨床展開に適した高推論速度を実現する。
偽陽性を減少させるために, ターゲット型, 硬い負のマイニングを壊死組織, 破片組織に適用した。
Mitosis DOmain Generalization (MIDOG) 2025の予備試験セットでは, RTMDet-Sをベースとした一段法が0.81に到達した。
論文 参考訳(メタデータ) (2025-08-27T11:45:44Z) - ClinicalFMamba: Advancing Clinical Assessment using Mamba-based Multimodal Neuroimaging Fusion [7.0879234284391455]
マルチモーダル医療画像融合は、診断精度と治療計画を高めるために、異なる画像モダリティからの相補的な情報を統合する。
CNNは局所的な特徴抽出に優れるが、グローバルなコンテキストを効果的にモデル化するのは難しい。
変換器は2次計算の複雑さを犠牲にしてより優れた長距離モデリングを実現する。
最近のステートスペースモデル(SSM)は有望な代替手段を提供する。
我々は,新しいエンドツーエンドCNN-MambaハイブリッドアーキテクチャであるCityicFMambaを提案する。
論文 参考訳(メタデータ) (2025-08-05T02:25:53Z) - Towards a general-purpose foundation model for fMRI analysis [58.06455456423138]
我々は,4次元fMRIボリュームから学習し,多様なアプリケーション間で効率的な知識伝達を可能にするフレームワークであるNeuroSTORMを紹介する。
NeuroSTORMは、複数のセンターにまたがる5万人以上の被験者から5歳から100歳までの28.65万fMRIフレーム(→9000時間)で事前トレーニングされている。
年齢/性別予測、表現型予測、疾患診断、fMRI-to-image検索、タスクベースのfMRIの5つのタスクにおいて、既存の手法よりも優れています。
論文 参考訳(メタデータ) (2025-06-11T23:51:01Z) - X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography [89.84588038174721]
Computed Tomographyは臨床において必須のツールであり、内部解剖学的構造を非侵襲的に可視化する。
既存のCT再構成作業は、小さなキャパシティモデルアーキテクチャと非フレキシブルボリューム表現に限られている。
スパースビュー2次元X線プロジェクションから3次元CTボリュームを再構成する大規模なフィードフォワードモデルであるX-GRMを提案する。
論文 参考訳(メタデータ) (2025-05-21T08:14:10Z) - Radiologist-in-the-Loop Self-Training for Generalizable CT Metal Artifact Reduction [34.83421198668549]
シミュレーションデータセットを用いてトレーニングされた金属アーティファクト削減法(MAR)は、しばしば実際の臨床CT画像でうまく機能するのに苦労する。
放射線技師のフィードバックを半教師付き学習プロセスに統合するRISE-MARを提案する。
品質保証のために,放射線技師の評価をエミュレートする臨床品質評価モデルを導入する。
量保証のために、我々の自己学習フレームワークは、付加的な高品質な擬似地下構造を反復的に生成する。
論文 参考訳(メタデータ) (2025-01-26T17:32:58Z) - A Cascaded Dilated Convolution Approach for Mpox Lesion Classification [0.0]
Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
本稿では,これらの課題に対処するためのCascaded Atrous Group Attentionフレームワークを紹介する。
論文 参考訳(メタデータ) (2024-12-13T12:47:30Z) - Unsupervised Training of Neural Cellular Automata on Edge Devices [2.5462695047893025]
携帯電話上でのセルラーオートマタトレーニングを, アクセス可能なX線肺セグメンテーションのために直接実施する。
5つのAndroidデバイスにこれらの高度なモデルをデプロイし、トレーニングする実用性と実現可能性を確認します。
デジタルコピーが入手できず、X線ライトボックスやモニターから画像を撮影しなければならない極端な場合、VWSLはDiceの精度を5-20%向上させる。
論文 参考訳(メタデータ) (2024-07-25T15:21:54Z) - Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware Prostate Cancer Classification [42.75911994044675]
前立腺MRIの非対位画像翻訳のための新しいアプローチと臨床的に重要なPCaを分類するための不確実性認識トレーニングアプローチを提案する。
提案手法では,無ペアの3.0T多パラメータ前立腺MRIを1.5Tに翻訳し,利用可能なトレーニングデータを増強する。
実験の結果,提案手法は,従来の研究に比べてAUC(Area Under ROC Curve)を20%以上改善することがわかった。
論文 参考訳(メタデータ) (2023-07-02T05:26:54Z) - Orientation-Shared Convolution Representation for CT Metal Artifact
Learning [63.67718355820655]
X線CT(CT)スキャン中、患者を乗せた金属インプラントは、しばしば有害なアーティファクトに繋がる。
既存のディープラーニングベースの手法は、有望な再構築性能を得た。
本稿では,人工物の物理的事前構造に適応するために,配向型畳み込み表現戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T13:56:12Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。