論文の概要: Revisiting End-to-End Learning with Slide-level Supervision in Computational Pathology
- arxiv url: http://arxiv.org/abs/2506.02408v1
- Date: Tue, 03 Jun 2025 03:46:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.216491
- Title: Revisiting End-to-End Learning with Slide-level Supervision in Computational Pathology
- Title(参考訳): コンピュータ病理学におけるスライドレベルのスーパービジョンによるエンド・ツー・エンド学習の再考
- Authors: Wenhao Tang, Rong Qin, Heng Fang, Fengtao Zhou, Hao Chen, Xiang Li, Ming-Ming Cheng,
- Abstract要約: 教師付きエンドツーエンド学習(E2E)は,高い計算要求や準最適結果などの課題に直面していることを示す。
この問題を軽減するために, ABMILX と呼ばれる新しい MIL を提案する。
E2EトレーニングされたResNetとAMMILXは、2段階のパラダイムの下でSOTA基盤モデルを上回る。
- 参考スコア(独自算出の注目度): 47.45485718033888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pre-trained encoders for offline feature extraction followed by multiple instance learning (MIL) aggregators have become the dominant paradigm in computational pathology (CPath), benefiting cancer diagnosis and prognosis. However, performance limitations arise from the absence of encoder fine-tuning for downstream tasks and disjoint optimization with MIL. While slide-level supervised end-to-end (E2E) learning is an intuitive solution to this issue, it faces challenges such as high computational demands and suboptimal results. These limitations motivate us to revisit E2E learning. We argue that prior work neglects inherent E2E optimization challenges, leading to performance disparities compared to traditional two-stage methods. In this paper, we pioneer the elucidation of optimization challenge caused by sparse-attention MIL and propose a novel MIL called ABMILX. It mitigates this problem through global correlation-based attention refinement and multi-head mechanisms. With the efficient multi-scale random patch sampling strategy, an E2E trained ResNet with ABMILX surpasses SOTA foundation models under the two-stage paradigm across multiple challenging benchmarks, while remaining computationally efficient (<10 RTX3090 hours). We show the potential of E2E learning in CPath and calls for greater research focus in this area. The code is https://github.com/DearCaat/E2E-WSI-ABMILX.
- Abstract(参考訳): オフライン機能抽出のための訓練済みエンコーダとマルチインスタンスラーニング(MIL)アグリゲータが計算病理学(CPath)において主要なパラダイムとなり、がん診断と予後の恩恵を受けている。
しかし、性能上の制限は、下流タスクのエンコーダの微調整が無く、MILとの非結合最適化が原因である。
スライドレベルの教師付きエンドツーエンド学習(E2E)はこの問題に対する直感的な解決策であるが、高い計算要求や準最適結果といった課題に直面している。
これらの制限は、E2E学習を再考する動機となります。
これまでの作業ではE2E最適化の課題は無視され、従来の2段階の手法と比較してパフォーマンスの相違が生じている、と我々は主張する。
本稿では,スパースアテンションMILによる最適化課題の解明を開拓し,ABMILXと呼ばれる新しいMILを提案する。
グローバルな相関に基づく注意改善とマルチヘッド機構によってこの問題を緩和する。
効率的なマルチスケールのランダムパッチサンプリング戦略により、E2EトレーニングされたResNetは、複数の挑戦的なベンチマークでSOTAの基礎モデルを2段階のパラダイムで越え、計算効率を保ちながら(10 RTX3090時間)。
CPathにおけるE2E学習の可能性を示し、この分野にもっと研究の焦点をあてることを求めている。
コードはhttps://github.com/DearCaat/E2E-WSI-ABMILX。
関連論文リスト
- EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference [49.94169109038806]
本稿では,既存の並列処理方式を超越したMoE用パイプラインスケジューラであるEPS-MoEを紹介する。
その結果,既存の並列推論手法と比較して,プリフィルスループットは52.4%向上した。
論文 参考訳(メタデータ) (2024-10-16T05:17:49Z) - MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z) - Feature Re-Embedding: Towards Foundation Model-Level Performance in Computational Pathology [11.840041304518516]
マルチプル・インスタンス・ラーニング(MIL)は、計算病理学において最も広く使われているフレームワークである。
既存のMILパラダイムは、通常、トレーニング済みのResNetやファンデーションモデルのようなオフラインのインスタンス機能抽出器を必要とする。
本稿では,インスタンス機能を再埋め込みするR$2$T(Re-embedded Regional Transformer)を提案する。
論文 参考訳(メタデータ) (2024-02-27T05:42:38Z) - E2E-AT: A Unified Framework for Tackling Uncertainty in Task-aware
End-to-end Learning [9.741277008050927]
本稿では,機械学習モデルの入力特徴空間と制約付き最適化モデルの両方で生じる不確実性をカバーする統一フレームワークを提案する。
トレーニング中にCOの不確かさを無視することは、一般化エラーの新たな引き金となる。
このフレームワークはロバストな最適化問題として記述され、エンド・ツー・エンドの対角訓練(E2E-AT)によって現実的に解決されている。
論文 参考訳(メタデータ) (2023-12-17T02:23:25Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Planning for Sample Efficient Imitation Learning [52.44953015011569]
現在の模倣アルゴリズムは、高い性能と高環境サンプル効率を同時に達成するのに苦労している。
本研究では,環境内サンプルの効率と性能を同時に達成できる計画型模倣学習手法であるEfficientImitateを提案する。
実験結果から,EIは性能と試料効率の両立を図った。
論文 参考訳(メタデータ) (2022-10-18T05:19:26Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。