論文の概要: ScoreNet: Learning Non-Uniform Attention and Augmentation for
Transformer-Based Histopathological Image Classification
- arxiv url: http://arxiv.org/abs/2202.07570v1
- Date: Tue, 15 Feb 2022 16:55:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-16 15:04:46.950096
- Title: ScoreNet: Learning Non-Uniform Attention and Augmentation for
Transformer-Based Histopathological Image Classification
- Title(参考訳): ScoreNet: Transformer-based Histopathological Image Classificationのための非一様注意と拡張の学習
- Authors: Thomas Stegm\"uller, Antoine Spahr, Behzad Bozorgtabar, Jean-Philippe
Thiran
- Abstract要約: 高解像度画像はデジタル病理の進歩を妨げる。
パッチベースの処理は、しばしば複数のインスタンス学習(MIL)を組み込んで、画像レベルの予測をもたらす局所的なパッチレベルの表現を集約する。
本稿では,組織像分類に適したトランスフォーマーアーキテクチャを提案する。
局所的なきめ細かな注意と粗いグローバルな注意機構を組み合わせることで、高解像度画像の意味的な表現を効率的な計算コストで学習する。
- 参考スコア(独自算出の注目度): 11.680355561258427
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Progress in digital pathology is hindered by high-resolution images and the
prohibitive cost of exhaustive localized annotations. The commonly used
paradigm to categorize pathology images is patch-based processing, which often
incorporates multiple instance learning (MIL) to aggregate local patch-level
representations yielding image-level prediction. Nonetheless, diagnostically
relevant regions may only take a small fraction of the whole tissue, and
MIL-based aggregation operation assumes that all patch representations are
independent and thus mislays the contextual information from adjacent cell and
tissue microenvironments. Consequently, the computational resources dedicated
to a specific region are independent of its information contribution. This
paper proposes a transformer-based architecture specifically tailored for
histopathological image classification, which combines fine-grained local
attention with a coarse global attention mechanism to learn meaningful
representations of high-resolution images at an efficient computational cost.
More importantly, based on the observation above, we propose a novel
mixing-based data-augmentation strategy, namely ScoreMix, by leveraging the
distribution of the semantic regions of images during the training and
carefully guiding the data mixing via sampling the locations of discriminative
image content. Thorough experiments and ablation studies on three challenging
representative cohorts of Haematoxylin & Eosin (H&E) tumour regions-of-interest
(TRoIs) datasets have validated the superiority of our approach over existing
state-of-the-art methods and effectiveness of our proposed components, e.g.,
data augmentation in improving classification performance. We also demonstrate
our method's interpretability, robustness, and cross-domain generalization
capability.
- Abstract(参考訳): デジタル病理の進歩は、高解像度画像と徹底的な局所アノテーションの禁止コストによって妨げられている。
病理画像の分類によく使われるパラダイムはパッチベースの処理であり、複数のインスタンス学習(MIL)を組み込んで、画像レベルの予測をもたらす局所的なパッチレベルの表現を集約する。
にもかかわらず、診断に関連のある領域は組織全体のごく一部しか取らず、MILベースのアグリゲーション操作は全てのパッチ表現が独立していると仮定し、隣接する細胞や組織の微小環境からのコンテキスト情報を誤る。
したがって、特定の領域専用の計算資源は、その情報寄与とは独立である。
本稿では,詳細な局所的注意と粗い大域的注意機構を組み合わせて,高分解能画像の有意義な表現を効率的な計算コストで学習する,病理組織像分類に特化したトランスフォーマアーキテクチャを提案する。
さらに,上述の観察に基づいて,訓練中の画像の意味領域の分布を活用し,識別画像コンテンツの位置をサンプリングし,データ混合を慎重に指導することにより,新たな混合型データ提示戦略「スコアミックス」を提案する。
Haematoxylin & Eosin (H&E) のTRoIsデータセットの3つの挑戦的コホートに関する詳細な実験およびアブレーション研究は、既存の最先端手法よりも、我々のアプローチの優位性と、提案したコンポーネント(例えば、データ拡張による分類性能の向上)の有効性を検証した。
また,本手法の解釈可能性,堅牢性,ドメイン間一般化能力を示す。
関連論文リスト
- Revisiting Adaptive Cellular Recognition Under Domain Shifts: A Contextual Correspondence View [49.03501451546763]
生物学的文脈における暗黙の対応の重要性を明らかにする。
モデル構成成分間のインスタンス認識トレードオフを確保するために, 自己適応型動的蒸留を提案する。
論文 参考訳(メタデータ) (2024-07-14T04:41:16Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - A2V: A Semi-Supervised Domain Adaptation Framework for Brain Vessel Segmentation via Two-Phase Training Angiography-to-Venography Translation [4.452428104996953]
画像の異なる脳血管セグメンテーションのための半教師付きドメイン適応フレームワークを提案する。
本フレームワークは,注釈付血管造影と限られた数の血管造影に頼り,画像から画像への翻訳とセマンティックセグメンテーションを実現する。
論文 参考訳(メタデータ) (2023-09-12T09:12:37Z) - Self-supervised Semantic Segmentation: Consistency over Transformation [3.485615723221064]
Inception Large Kernel Attention (I-LKA) モジュールをベースとしたロバストなフレームワークを統合した新しい自己教師型アルゴリズム textbfS$3$-Net を提案する。
我々は、変形可能な畳み込みを積分成分として利用し、優れた物体境界定義のための歪み変形を効果的に捕捉し、デライン化する。
皮膚病変および肺臓器の分節タスクに関する実験結果から,SOTA法と比較して,本手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-08-31T21:28:46Z) - Improving Mitosis Detection Via UNet-based Adversarial Domain
Homogenizer [1.7298084639157258]
本稿では,入力画像の対角的再構成による組織像の領域差を軽減するため,有糸分裂検出のためのドメインホモジェナイザを提案する。
我々は,前処理した画像間の領域差の低減を観察することにより,ドメインホモジェナイザの有効性を示す。
このホモジェナイザーと後続の網膜-網状物体検出器を用いて、検出されたミオティックな図形の平均精度で2021 MIDOGチャレンジのベースラインを上回りました。
論文 参考訳(メタデータ) (2022-09-15T11:15:57Z) - Cross-level Contrastive Learning and Consistency Constraint for
Semi-supervised Medical Image Segmentation [46.678279106837294]
半教師型医用画像セグメンテーションにおける局所特徴の表現能力を高めるためのクロスレベルコンストラシティブ学習手法を提案する。
クロスレベルなコントラスト学習と一貫性制約の助けを借りて、非ラベル付きデータを効果的に探索してセグメンテーション性能を向上させることができる。
論文 参考訳(メタデータ) (2022-02-08T15:12:11Z) - Self-Attentive Spatial Adaptive Normalization for Cross-Modality Domain
Adaptation [9.659642285903418]
放射線科医の費用負担を軽減するための医用画像のクロスモダリティ合成
本稿では,教師なしまたは教師なし(非ペア画像データ)の設定が可能な医用画像における画像から画像への変換手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T16:22:31Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。