Fugu-MT 論文翻訳(概要): BROW: Better featuRes fOr Whole slide image based on self-distillation

論文の概要: BROW: Better featuRes fOr Whole slide image based on self-distillation

arxiv url: http://arxiv.org/abs/2309.08259v1
Date: Fri, 15 Sep 2023 09:11:09 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-18 15:12:56.585818
Title: BROW: Better featuRes fOr Whole slide image based on self-distillation
Title（参考訳）: BROW: 自己蒸留による全スライド画像の精度向上
Authors: Yuanfeng Wu, Shaojie Li, Zhiqiang Du, Wentao Zhu
Abstract要約: 各種疾患の標準診断において,WSI処理が重要な要素となっている。ほとんどのWSI関連タスクのパフォーマンスは、WSIパッチの特徴表現を抽出するバックボーンの有効性に依存します。我々は、WSIのより良い特徴表現を抽出するための基礎モデルBROWを提案し、微調整を伴わずに下流タスクに便利に適用できることを示した。
参考スコア（独自算出の注目度）: 19.295596638166536
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Whole slide image (WSI) processing is becoming part of the key components of standard clinical diagnosis for various diseases. However, the direct application of conventional image processing algorithms to WSI faces certain obstacles because of WSIs' distinct property: the super-high resolution. The performance of most WSI-related tasks relies on the efficacy of the backbone which extracts WSI patch feature representations. Hence, we proposed BROW, a foundation model for extracting better feature representations for WSIs, which can be conveniently adapted to downstream tasks without or with slight fine-tuning. The model takes transformer architecture, pretrained using self-distillation framework. To improve model's robustness, techniques such as patch shuffling have been employed. Additionally, the model leverages the unique properties of WSIs, utilizing WSI's multi-scale pyramid to incorporate an additional global view, thereby further enhancing its performance. We used both private and public data to make up a large pretraining dataset, containing more than 11000 slides, over 180M extracted patches, encompassing WSIs related to various organs and tissues. To assess the effectiveness of \ourmodel, we run a wide range of downstream tasks, including slide-level subtyping, patch-level classification and nuclei instance segmentation. The results confirmed the efficacy, robustness and good generalization ability of the proposed model. This substantiates its potential as foundation model for WSI feature extraction and highlights promising prospects for its application in WSI processing.
Abstract（参考訳）: whole slide image (wsi)処理は、様々な疾患の標準的な臨床診断において重要な要素となっている。しかし、従来の画像処理アルゴリズムのWSIへの直接適用は、WSIの異なる特性である超高分解能のため、ある種の障害に直面している。ほとんどのWSI関連タスクのパフォーマンスは、WSIパッチの特徴表現を抽出するバックボーンの有効性に依存します。そこで我々は,WSI のより優れた特徴表現を抽出する基盤モデル BROW を提案した。このモデルは自己蒸留フレームワークを使って事前訓練されたトランスフォーマーアーキテクチャを採用している。モデルの堅牢性を改善するためにパッチシャッフルなどの技術が採用されている。さらに、このモデルはwsisのユニークな特性を利用し、wsiのマルチスケールピラミッドを利用して、さらなるグローバルビューを取り入れ、パフォーマンスをさらに向上させる。 11000以上のスライド,180万以上の抽出パッチ,さまざまな臓器や組織に関連するWSIを含む,大規模な事前トレーニングデータセットを構成するために,プライベートデータとパブリックデータの両方を使用しました。モデルの有効性を評価するために、スライドレベルのサブタイプ、パッチレベルの分類、核インスタンスのセグメンテーションなど、幅広いダウンストリームタスクを実行する。その結果, モデルの有効性, 頑健性, 一般化性が確認できた。これは、wsi機能抽出の基礎モデルとしての可能性を示し、wsi処理におけるアプリケーションの将来性を強調している。

関連論文リスト

Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology [2.0088541799100392]
計算病理学においてWSI(Whole Slide Images)を効率的に統合するための重要なステップは、1つの高品質な特徴ベクトル、すなわち1つの埋め込みを各WSIに割り当てることである。本稿では,最近開発された複数の集約手法のWSI検索性能を評価する。
論文参考訳（メタデータ） (2025-01-29T18:14:51Z)
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文参考訳（メタデータ） (2025-01-16T18:59:46Z)
Promptable Representation Distribution Learning and Data Augmentation for Gigapixel Histopathology WSI Analysis [7.823674912857107]
本稿では,パッチレベルの表現学習とWSIレベルのデータ拡張のためのPRDL(Promptable Representation Distribution Learning)を提案する。提案手法は最先端の手法よりも安定して性能を向上する。
論文参考訳（メタデータ） (2024-12-19T02:47:17Z)
EXAONEPath 1.0 Patch-level Foundation Model for Pathology [12.179645627327428]
自己教師付きモデルから抽出された特徴は、個々のスライド画像(WSI)によってクラスタリングされる傾向がある EXAONEPathは,染色正規化を施したパッチをトレーニングした新しい基礎モデルである。 EXAONEPath は使用した WSI の数とモデルパラメータ数に対して優れた性能を示す。
論文参考訳（メタデータ） (2024-08-01T08:41:13Z)
FALFormer: Feature-aware Landmarks self-attention for Whole-slide Image Classification [4.064178811354613]
全スライド画像(WSI)のスライドレベル分類は、デジタルおよび計算病理学において重要な問題として広く認識されている。本稿では,WSI全体を処理可能な効率的なスライドレベル分類モデルFALFormerを提案する。
論文参考訳（メタデータ） (2024-07-10T03:24:40Z)
TSI-Bench: Benchmarking Time Series Imputation [52.27004336123575]
TSI-Benchは、ディープラーニング技術を利用した時系列計算のための総合ベンチマークスイートである。 TSI-Benchパイプラインは、実験的な設定を標準化し、計算アルゴリズムの公平な評価を可能にする。 TSI-Benchは、計算目的のために時系列予測アルゴリズムを調整するための体系的なパラダイムを革新的に提供する。
論文参考訳（メタデータ） (2024-06-18T16:07:33Z)
MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.37780601189795]
本稿では,WSI分析のためのフレームワークMamMILを提案する。私たちは各WSIを非指向グラフとして表現します。マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文参考訳（メタデータ） (2024-03-08T09:02:13Z)
A self-supervised framework for learning whole slide representations [52.774822784847565]
我々は、全スライド画像のギガピクセルスケールの自己スーパービジョンのためのSlide Pre-trained Transformer (SPT)を提案する。バイオメディカル・マイクロスコープ・データセットを用いて,5つの診断課題におけるSPT視覚表現のベンチマークを行った。
論文参考訳（メタデータ） (2024-02-09T05:05:28Z)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (2023-12-19T08:14:14Z)
ConSlide: Asynchronous Hierarchical Interaction Transformer with Breakup-Reorganize Rehearsal for Continual Whole Slide Image Analysis [24.078490055421852]
医用画像コミュニティではWSI解析がますます重要になっている。本稿では,WSI分析のためのFIRST連続学習フレームワークであるConSlideを提案する。
論文参考訳（メタデータ） (2023-08-25T11:58:25Z)
Task-specific Fine-tuning via Variational Information Bottleneck for Weakly-supervised Pathology Whole Slide Image Classification [10.243293283318415]
MIL(Multiple Instance Learning)は、デジタル・パスロジー・ホール・スライド・イメージ(WSI)分類において有望な結果を示している。本稿では,Information Bottleneck 理論を動機とした効率的な WSI 微調整フレームワークを提案する。我々のフレームワークは、様々なWSIヘッド上の5つの病理WSIデータセットで評価される。
論文参考訳（メタデータ） (2023-03-15T08:41:57Z)
Hierarchical Transformer for Survival Prediction Using Multimodality Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文参考訳（メタデータ） (2022-11-29T23:47:56Z)
Pay Attention with Focus: A Novel Learning Scheme for Classification of Whole Slide Images [8.416553728391309]
スライド画像全体(WSI)を解析するための新しい2段階アプローチを提案する。まず、WSIから代表パッチ(モザイクと呼ばれる)を抽出する。モザイクの各パッチは、ディープネットワークを用いて特徴ベクトルに符号化される。第2段階では、WSIから符号化されたパッチレベルの一連の特徴を用いて、一次診断確率を算出する。
論文参考訳（メタデータ） (2021-06-11T21:59:02Z)
Adversarial Feature Augmentation and Normalization for Visual Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文参考訳（メタデータ） (2021-03-22T20:36:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。