論文の概要: Continual Multiple Instance Learning with Enhanced Localization for Histopathological Whole Slide Image Analysis
- arxiv url: http://arxiv.org/abs/2507.02395v1
- Date: Thu, 03 Jul 2025 07:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:15.877453
- Title: Continual Multiple Instance Learning with Enhanced Localization for Histopathological Whole Slide Image Analysis
- Title(参考訳): 組織学的全スライド画像解析のための局所化を増強した連続多重学習
- Authors: Byung Hyun Lee, Wongi Jeong, Woojae Han, Kyoungbun Lee, Se Young Chun,
- Abstract要約: MIL(Multiple Case Learning)は、大規模な画像に対するバッグレベルの弱いラベルによるアノテーションコストを大幅に削減する。
最小限の忘れを伴って局所化と適応性を両立するMILフレームワークを提案する。
CoMELは,(1)効率的なインスタンスエンコーディングのためのグループ二重注意変換器,(2)バグプロトタイプに基づく擬似ラベル,(3)直交重み付き低ランク適応からなる。
- 参考スコア(独自算出の注目度): 10.323037126616692
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multiple instance learning (MIL) significantly reduced annotation costs via bag-level weak labels for large-scale images, such as histopathological whole slide images (WSIs). However, its adaptability to continual tasks with minimal forgetting has been rarely explored, especially on instance classification for localization. Weakly incremental learning for semantic segmentation has been studied for continual localization, but it focused on natural images, leveraging global relationships among hundreds of small patches (e.g., $16 \times 16$) using pre-trained models. This approach seems infeasible for MIL localization due to enormous amounts ($\sim 10^5$) of large patches (e.g., $256 \times 256$) and no available global relationships such as cancer cells. To address these challenges, we propose Continual Multiple Instance Learning with Enhanced Localization (CoMEL), an MIL framework for both localization and adaptability with minimal forgetting. CoMEL consists of (1) Grouped Double Attention Transformer (GDAT) for efficient instance encoding, (2) Bag Prototypes-based Pseudo-Labeling (BPPL) for reliable instance pseudo-labeling, and (3) Orthogonal Weighted Low-Rank Adaptation (OWLoRA) to mitigate forgetting in both bag and instance classification. Extensive experiments on three public WSI datasets demonstrate superior performance of CoMEL, outperforming the prior arts by up to $11.00\%$ in bag-level accuracy and up to $23.4\%$ in localization accuracy under the continual MIL setup.
- Abstract(参考訳): マルチプル・インスタンス・ラーニング(MIL)は、病理組織学的全スライド画像(WSI)のような大規模画像のバッグレベルの弱いラベルによるアノテーションコストを著しく削減した。
しかし、最小限の忘れ込みを伴う連続的タスクへの適応性は、特に局所化の事例分類において研究されることは稀である。
セマンティックセグメンテーションのための弱い漸進的な学習は、連続的なローカライゼーションのために研究されてきたが、これは自然画像に焦点を当て、事前訓練されたモデルを用いて数百の小さなパッチ(例:16ドル16セント)のグローバルな関係を利用する。
このアプローチは、大量のパッチ(例えば、$256 \times 256$)や、がん細胞のようなグローバルな関係がないため、MILのローカライゼーションには有効ではないように思われる。
これらの課題に対処するため、最小限の忘れを伴って、局所化と適応性の両方を兼ね備えたMILフレームワークCoMEL(Continuous Multiple Instance Learning with Enhanced Localization)を提案する。
CoMELは,(1)効率的なインスタンスエンコーディングのためのGDAT(Grouped Double Attention Transformer),(2)信頼性のあるインスタンス擬似ラベルのためのBag PrototypesベースのPseudo-Labeling(BPPL),(3)バッグとインスタンスの分類における忘れを軽減するためのORLORA(Orthogonal Weighted Low-Rank Adaptation)で構成される。
3つの公開WSIデータセットの大規模な実験は、CoMELの優れた性能を示し、バッグレベルの精度で最大11.00\%、連続的なMILセットアップで最大23.4\%のローカライゼーション精度で先行技術を上回っている。
関連論文リスト
- Unbiased Max-Min Embedding Classification for Transductive Few-Shot Learning: Clustering and Classification Are All You Need [83.10178754323955]
わずかなショットラーニングにより、モデルがいくつかのラベル付き例から一般化できる。
本稿では,Unbiased Max-Min Embedding Classification (UMMEC)法を提案する。
本手法は最小ラベル付きデータを用いて分類性能を著しく向上させ, 注釈付きLの最先端化を推し進める。
論文 参考訳(メタデータ) (2025-03-28T07:23:07Z) - Sm: enhanced localization in Multiple Instance Learning for medical imaging classification [11.727293641333713]
マルチ・インスタンス・ラーニング(MIL)は医療画像分類において、ラベル付けの労力を減らすために広く用いられている。
ローカル依存関係をモデル化するための,新しい,原則付き,フレキシブルなメカニズムを提案する。
我々のモジュールは、最先端のローカライゼーションにおいて、競争力や優越性を保ちながら、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-10-04T09:49:28Z) - MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:02:13Z) - DilateFormer: Multi-Scale Dilated Transformer for Visual Recognition [62.95223898214866]
我々は,視覚変換器の有効性を探究し,参加する受容領域の計算複雑性とサイズとのトレードオフを追求する。
ピラミッドアーキテクチャを用いて,MSDAブロックを低レベルに積み重ねたマルチスケールDilated Transformer (DilateFormer) と,高レベルにグローバルなマルチヘッド自己保持ブロックを構築する。
実験の結果,DilateFormerは様々な視覚タスクで最先端のパフォーマンスを実現していることがわかった。
論文 参考訳(メタデータ) (2023-02-03T14:59:31Z) - Hierarchical Transformer for Survival Prediction Using Multimodality
Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。
本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。
より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文 参考訳(メタデータ) (2022-11-29T23:47:56Z) - ReMix: A General and Efficient Framework for Multiple Instance Learning
based Whole Slide Image Classification [14.78430890440035]
ワイルスライド画像(WSI)分類は、ギガピクセル解像度画像とスライドレベルのラベルを扱うために弱教師付き多重インスタンス学習(MIL)法に依存することが多い。
MILに基づくWSI分類のための汎用的で効率的なフレームワークであるReMixを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:21:35Z) - Feature Re-calibration based MIL for Whole Slide Image Classification [7.92885032436243]
全スライド画像(WSI)分類は疾患の診断と治療の基本的な課題である。
本稿では,WSI バッグ (インスタンス) の分布を,最大インスタンス (クリティカル) 特性の統計値を用いて再校正することを提案する。
位置符号化モジュール(PEM)を用いて空間・形態情報をモデル化し,マルチヘッド自己アテンション(PSMA)をトランスフォーマーエンコーダでプーリングする。
論文 参考訳(メタデータ) (2022-06-22T07:00:39Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。