論文の概要: Revisiting Data Challenges of Computational Pathology: A Pack-based Multiple Instance Learning Framework
- arxiv url: http://arxiv.org/abs/2509.20923v1
- Date: Thu, 25 Sep 2025 09:05:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.807031
- Title: Revisiting Data Challenges of Computational Pathology: A Pack-based Multiple Instance Learning Framework
- Title(参考訳): 計算病理学におけるデータ課題の再考 - Pack-based Multiple Instance Learning Framework
- Authors: Wenhao Tang, Heng Fang, Ge Wu, Xiang Li, Ming-Ming Cheng,
- Abstract要約: コンピュータ病理学(CPath)は、病理スライドを全スライド画像(WSI)にデジタル化する
WSIは、非常に長いシーケンス長(最大200K)、相当な長さのバリエーション(200Kから200K)、限られた監督を持っている。
これらの課題に対処するためのパックベースのMILフレームワークを提案する。
- 参考スコア(独自算出の注目度): 47.035885218675126
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computational pathology (CPath) digitizes pathology slides into whole slide images (WSIs), enabling analysis for critical healthcare tasks such as cancer diagnosis and prognosis. However, WSIs possess extremely long sequence lengths (up to 200K), significant length variations (from 200 to 200K), and limited supervision. These extreme variations in sequence length lead to high data heterogeneity and redundancy. Conventional methods often compromise on training efficiency and optimization to preserve such heterogeneity under limited supervision. To comprehensively address these challenges, we propose a pack-based MIL framework. It packs multiple sampled, variable-length feature sequences into fixed-length ones, enabling batched training while preserving data heterogeneity. Moreover, we introduce a residual branch that composes discarded features from multiple slides into a hyperslide which is trained with tailored labels. It offers multi-slide supervision while mitigating feature loss from sampling. Meanwhile, an attention-driven downsampler is introduced to compress features in both branches to reduce redundancy. By alleviating these challenges, our approach achieves an accuracy improvement of up to 8% while using only 12% of the training time in the PANDA(UNI). Extensive experiments demonstrate that focusing data challenges in CPath holds significant potential in the era of foundation models. The code is https://github.com/FangHeng/PackMIL
- Abstract(参考訳): 計算病理学(CPath)は、病理学のスライドを全スライド画像(WSI)にデジタル化し、がん診断や予後などの重要な医療タスクの分析を可能にする。
しかし、WSIは、非常に長いシーケンス長(200Kまで)、かなりの長さのバリエーション(200Kから200Kまで)、限られた監督を持っている。
これらの配列長の極端な変化は、高いデータの均一性と冗長性をもたらす。
従来の手法では、限られた監督下での不均一性を維持するために、訓練効率と最適化を妥協することが多い。
これらの課題に包括的に対処するために、パックベースのMILフレームワークを提案する。
複数のサンプル、可変長の特徴シーケンスを固定長にまとめ、データの不均一性を保ちながらバッチトレーニングを可能にする。
さらに,複数のスライドから捨てられた特徴をハイパースライダーに分解し,ラベルを調整した残差分枝を導入する。
サンプリングによる特徴損失を軽減しつつ、マルチスライダーの監視を提供する。
一方、両枝の特徴を圧縮して冗長性を低減するために、注目駆動のダウンサンプラーが導入された。
これらの課題を緩和することにより,PANDA(UNI)のトレーニング時間のわずか12%を使用しながら,最大8%の精度向上を実現した。
CPathにおけるデータ課題の集中化は、基礎モデルの時代において大きな可能性を秘めている。
コードはhttps://github.com/FangHeng/PackMIL
関連論文リスト
- PHEATPRUNER: Interpretable Data-centric Feature Selection for Multivariate Time Series Classification through Persistent Homology [0.0937465283958018]
PHeatPrunerは時系列分類における性能と解釈可能性のバランスをとる方法である。
永続ホモロジーは、適用変数の最大45%のプルーニングを促進する。
シーフ理論は、データの構造的ニュアンスに関する深い洞察を提供する説明ベクトルに寄与する。
論文 参考訳(メタデータ) (2025-04-25T13:14:11Z) - Reshaping the Online Data Buffering and Organizing Mechanism for Continual Test-Time Adaptation [49.53202761595912]
継続的なテスト時間適応は、訓練済みのソースモデルを適用して、教師なしのターゲットドメインを継続的に変更する。
我々は、オンライン環境、教師なしの自然、エラー蓄積や破滅的な忘れのリスクなど、このタスクの課題を分析する。
教師なしシングルパスデータストリームから重要サンプルを高い確実性で識別・集約する不確実性を考慮したバッファリング手法を提案する。
論文 参考訳(メタデータ) (2024-07-12T15:48:40Z) - TSLANet: Rethinking Transformers for Time Series Representation Learning [19.795353886621715]
時系列データは、その固有の長短の依存関係によって特徴づけられる。
本稿では,時系列タスクの普遍的畳み込みモデルとして,新しい時系列軽量ネットワーク(TSLANet)を導入する。
我々の実験では、TSLANetは分類、予測、異常検出にまたがる様々なタスクにおいて最先端のモデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-04-12T13:41:29Z) - Primal Dual Continual Learning: Balancing Stability and Plasticity through Adaptive Memory Allocation [86.8475564814154]
制約付き最適化問題を直接実行することは可能かつ有益であることを示す。
メモリベースのメソッドでは、以前のタスクからのサンプルの小さなサブセットをリプレイバッファに格納できる。
両変数は,制約摂動に対する連続学習問題の最適値の感度を示す。
論文 参考訳(メタデータ) (2023-09-29T21:23:27Z) - MUSTANG: Multi-Stain Self-Attention Graph Multiple Instance Learning
Pipeline for Histopathology Whole Slide Images [1.127806343149511]
Whole Slide Images (WSIs)は、ギガピクセルサイズとアーティファクトの存在により、コンピュータビジョンの課題を提示している。
実世界の臨床データセットは、患者レベルにラベルがある異種WSIのセットとして提供され、アノテーションが不足している。
本稿では,エンドツーエンドのマルチスタンプ・セルフアテンション・グラフ(MUSTANG)マルチインスタンス学習パイプラインを提案する。
論文 参考訳(メタデータ) (2023-09-19T14:30:14Z) - ScoreMix: A Scalable Augmentation Strategy for Training GANs with
Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。
ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文 参考訳(メタデータ) (2022-10-27T02:55:15Z) - Mixed-Precision Neural Network Quantization via Learned Layer-wise
Importance [50.00102219630088]
混合精度量子化(MPQ)は各層に対して最適なビット幅を決定するのを難しくする。
本稿では,すべての指標を同時に取得できる共同学習手法を提案する。
例えば、ResNet18上のインデックスによるMPQ検索は、わずか0.06秒しかかからない。
論文 参考訳(メタデータ) (2022-03-16T03:23:50Z) - Pattern Discovery in Time Series with Byte Pair Encoding [12.338599136651261]
そこで本研究では,時系列の共通パターンに基づいて時系列の表現を学習するための教師なし手法を提案する。
このようにして、この方法は、データに存在する長期的および短期的な依存関係の両方をキャプチャすることができる。
論文 参考訳(メタデータ) (2021-05-30T00:47:19Z) - Brain Image Synthesis with Unsupervised Multivariate Canonical
CSC$\ell_4$Net [122.8907826672382]
我々は,新しいCSC$ell_4$Netを用いて,イントレとイントラモーダルの両方にまたがる専用特徴を学習することを提案する。
論文 参考訳(メタデータ) (2021-03-22T05:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。