論文の概要: Enhanced Diagnostic Performance via Large-Resolution Inference Optimization for Pathology Foundation Models
- arxiv url: http://arxiv.org/abs/2601.12150v1
- Date: Sat, 17 Jan 2026 19:50:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.486933
- Title: Enhanced Diagnostic Performance via Large-Resolution Inference Optimization for Pathology Foundation Models
- Title(参考訳): 病理基礎モデルに対する大分解能推論最適化による診断性能の向上
- Authors: Mengxuan Hu, Zihan Guan, John Kang, Sheng Li, Zhongliang Zhou,
- Abstract要約: 単純な戦略は、インプットを拡大するか、スライディング全体像をダウンサンプリングすることである。
本研究では,空間的に認識された隣接ブロックを用いて注意を分散させる空間的・時間的推論手法を提案する。
この設計により、高分解能WSI推論時のGPUメモリとランタイムを大幅に削減できる。
- 参考スコア(独自算出の注目度): 12.8452590947141
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Despite their prominent performance on tasks such as ROI classification and segmentation, many pathology foundation models remain constrained by a specific input size e.g. 224 x 224, creating substantial inefficiencies when applied to whole-slide images (WSIs), which span thousands of resolutions. A naive strategy is to either enlarge inputs or downsample the WSIs. However, enlarging inputs results in prohibitive GPU memory consumption, while downsampling alters the microns-per-pixel resolution and obscures critical morphological details. To overcome these limitations, we propose an space- and time- efficient inference strategy that sparsifies attention using spatially aware neighboring blocks and filters out non-informative tokens through global attention scores. This design substantially reduces GPU memory and runtime during high-resolution WSI inference while preserving and even improving the downstream performance, enabling inference at higher resolutions under the same GPU budget. The experimental results show that our method can achieves up to an 7.67% improvement in the ROI classification and compatible results in segmentation.
- Abstract(参考訳): ROI分類やセグメンテーションなどのタスクにおいて顕著な性能を示したにもかかわらず、多くの病理基盤モデルは、特定の入力サイズ e g 224 x 224 で制約され続けており、数千の解像度にまたがる全スライディング画像(WSI)に適用した場合、かなりの非効率が生じる。
単純な戦略は、インプットを拡大するか、WSIをダウンサンプすることです。
しかし、入力を拡大するとGPUのメモリ消費が禁じられるが、ダウンサンプリングではマイクロン/ピクセルの解像度が変化し、批判的な形態的詳細が曖昧になる。
これらの制約を克服するために,空間的に認識された隣接ブロックを用いて注意を分散させ,グローバルな注目スコアを通じて非情報的トークンをフィルタリングする空間的・時間的推論手法を提案する。
この設計は、高解像度のWSI推論中のGPUメモリとランタイムを大幅に削減すると同時に、下流のパフォーマンスも向上し、同じGPU予算下での高解像度での推論を可能にする。
実験の結果,ROI分類では最大7.67%の改善が達成され,セグメンテーションでは相容れない結果が得られた。
関連論文リスト
- Cross-Layer Attentive Feature Upsampling for Low-latency Semantic Segmentation [52.01210390327581]
本稿では,高精細度特徴とセマンティック特徴を適応的に補間するためのガイド付き注意補間(GAI)を提案する。
GAIは、解像度の異なる特徴から画素の空間的関係と意味的関係を判定し、これらの関係を利用してリッチな意味論で高解像度特徴を補間する。
実験では、GAINと呼ばれるGAIベースのセマンティックセグメンテーションネットワークは、Cityscapesで22.3 FPSの78.8 mIoU、CamVidで64.5の80.6 mIoUをNVIDIA 1080Ti GPUで達成できる。
論文 参考訳(メタデータ) (2026-01-03T12:09:49Z) - RARE-UNet: Resolution-Aligned Routing Entry for Adaptive Medical Image Segmentation [0.0]
本稿では,入力の空間分解能にその推論経路を適応させる,分解能を考慮したマルチスケールセグメンテーションアーキテクチャを提案する。
RARE-UNetは、海馬と腫瘍のセグメンテーションのための2つのベンチマーク脳イメージングタスクでテストされている。
本モデルでは,高精細度における平均Diceスコアが0.84と0.65であり,一貫した性能を維持しつつ,低精細度での推論時間を著しく短縮する。
論文 参考訳(メタデータ) (2025-07-21T11:49:20Z) - HRSeg: High-Resolution Visual Perception and Enhancement for Reasoning Segmentation [74.1872891313184]
HRSegは高精細な知覚を持つ効率的なモデルである。
高分解能知覚(HRP)と高分解能増強(HRE)の2つの重要な革新を特徴としている。
論文 参考訳(メタデータ) (2025-07-17T08:09:31Z) - HRDecoder: High-Resolution Decoder Network for Fundus Image Lesion Segmentation [12.606794661369959]
骨盤病変分割のための簡易高分解能デコーダネットワークHRDecoderを提案する。
高精細な局所的特徴を捉えるための高精細な表現学習モジュールと、マルチスケールの予測を融合する高精細な融合モジュールを統合している。
本手法は, 適正なメモリと計算オーバーヘッドを消費し, 推論速度の満足度を維持しながら, 足底部病変の全体的なセグメンテーション精度を効果的に向上させる。
論文 参考訳(メタデータ) (2024-11-06T15:13:31Z) - Learning to Be a Transformer to Pinpoint Anomalies [12.442574943138794]
最近の産業異常検出およびIADS(Industrial Anomaly Detection and (IADS))は、224x224ピクセルなどの低解像度画像を処理する。
本稿では,高精細な入力画像を非常に効率的に処理しながら,強い事前学習機能を活用する新しい教師-学生パラダイムを提案する。
提案手法では,高解像度画像から異常を検出でき,競合他社よりも高速に動作可能である。
論文 参考訳(メタデータ) (2024-07-04T17:59:26Z) - Memory-Constrained Semantic Segmentation for Ultra-High Resolution UAV
Imagery [35.96063342025938]
本稿では,超高解像度UAV画像の高効率・高効率セグメンテーションを実現するための複雑な課題について検討する。
本稿では、ローカルパッチ以外のコンテキストにアクセスすることなく、ローカル推論のためのGPUメモリ効率が高く効果的なフレームワークを提案する。
基礎となる高解像度情報の潜在的な意味バイアスを補正するために,効率的なメモリベースインタラクション方式を提案する。
論文 参考訳(メタデータ) (2023-10-07T07:44:59Z) - ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to
Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。
実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-02T10:39:29Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。