Fugu-MT 論文翻訳(概要): Dual Attention Model with Reinforcement Learning for Classification of Histology Whole-Slide Images

論文の概要: Dual Attention Model with Reinforcement Learning for Classification of Histology Whole-Slide Images

arxiv url: http://arxiv.org/abs/2302.09682v2
Date: Thu, 21 Nov 2024 16:29:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:28.656316
Title: Dual Attention Model with Reinforcement Learning for Classification of Histology Whole-Slide Images
Title（参考訳）: ストライディング画像の分類のための強化学習による二重注意モデル
Authors: Manahil Raza, Ruqayya Awan, Raja Muhammad Saad Bashir, Talha Qaiser, Nasir M. Rajpoot,
Abstract要約: デジタル全スライド画像(WSI)は一般に顕微鏡分解能で撮影され、広い空間データを包含する。本稿では,病理医の視覚検査に触発された2つの主成分からなる新しい二重注意アプローチを提案する。提案手法は,WSIの10%未満を高い倍率で処理しながら,最先端の手法に匹敵する性能を実現する。
参考スコア（独自算出の注目度）: 8.404881822414898
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Digital whole slide images (WSIs) are generally captured at microscopic resolution and encompass extensive spatial data. Directly feeding these images to deep learning models is computationally intractable due to memory constraints, while downsampling the WSIs risks incurring information loss. Alternatively, splitting the WSIs into smaller patches may result in a loss of important contextual information. In this paper, we propose a novel dual attention approach, consisting of two main components, both inspired by the visual examination process of a pathologist: The first soft attention model processes a low magnification view of the WSI to identify relevant regions of interest, followed by a custom sampling method to extract diverse and spatially distinct image tiles from the selected ROIs. The second component, the hard attention classification model further extracts a sequence of multi-resolution glimpses from each tile for classification. Since hard attention is non-differentiable, we train this component using reinforcement learning to predict the location of the glimpses. This approach allows the model to focus on essential regions instead of processing the entire tile, thereby aligning with a pathologist's way of diagnosis. The two components are trained in an end-to-end fashion using a joint loss function to demonstrate the efficacy of the model. The proposed model was evaluated on two WSI-level classification problems: Human epidermal growth factor receptor 2 scoring on breast cancer histology images and prediction of Intact/Loss status of two Mismatch Repair biomarkers from colorectal cancer histology images. We show that the proposed model achieves performance better than or comparable to the state-of-the-art methods while processing less than 10% of the WSI at the highest magnification and reducing the time required to infer the WSI-level label by more than 75%.
Abstract（参考訳）: デジタル全スライド画像(WSI)は一般に顕微鏡分解能で撮影され、広い空間データを包含する。深層学習モデルにこれらの画像を直接供給することは、情報損失のリスクを低く抑えながら、メモリ制約のために計算的に引き起こすことができる。あるいは、WSIを小さなパッチに分割すると、重要なコンテキスト情報が失われる可能性がある。本稿では,病理医の視覚的診察プロセスにインスパイアされた2つの主成分からなる新しい二重注意アプローチを提案する。第1のソフトアテンションモデルでは,WSIの低倍率ビューを処理して関心領域を識別し,次いで選択されたROIから多様で空間的に異なる画像タイルを抽出するカスタムサンプリング手法を提案する。第2のコンポーネントであるハードアテンション分類モデルは、分類のために各タイルから多重解像度のスリープ列を抽出する。注意は区別できないため、強化学習を用いてこの成分を訓練し、視線の位置を予測する。このアプローチにより、モデルはタイル全体を処理するのではなく、必須領域に集中することができ、それによって病理学者の診断方法と整合する。 2つのコンポーネントは、モデルの有効性を示すために、ジョイントロス関数を用いてエンドツーエンドで訓練される。乳がん組織像から評価したヒト上皮成長因子受容体2と,大腸癌組織像から得られた2つのMismatch修復バイオマーカーのIntact/Loss状態の予測を行った。提案手法は,WSIの10%未満を最大倍率で処理し,WSIレベルのラベルを75%以上推論するのに要する時間を削減しながら,最先端の手法に匹敵する性能を実現する。

関連論文リスト

A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。 CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文参考訳（メタデータ） (2025-12-15T10:22:43Z)
AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。 2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文参考訳（メタデータ） (2025-08-07T07:47:16Z)
Cross-Modal Clustering-Guided Negative Sampling for Self-Supervised Joint Learning from Medical Images and Reports [11.734906190235066]
本稿では,2次元のアイデアを用いたCross-Modal Cluster-Guided Negative Smpling (CM-CGNS)法を提案する。まず、シングルモーダルドメインのローカルテキスト機能に使用されるk-meansクラスタリングを、クロスモーダルアテンションを通じてマルチモーダルドメインに拡張する。第2に、マスクされた局所画像領域を再構成するために、クロスモーダルアテンションによって得られたローカルテキストと画像の特徴を利用する、CM-MIR(Cross-Modal Masked Image Reconstruction)モジュールを導入する。
論文参考訳（メタデータ） (2025-06-13T11:08:16Z)
PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文参考訳（メタデータ） (2025-04-09T14:58:21Z)
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文参考訳（メタデータ） (2024-03-19T09:28:19Z)
Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文参考訳（メタデータ） (2023-12-26T12:56:31Z)
Active Learning Enhances Classification of Histopathology Whole Slide Images with Attention-based Multiple Instance Learning [48.02011627390706]
我々は、注意に基づくMILをトレーニングし、データセット内の各画像に対する信頼度を算出し、専門家のアノテーションに対して最も不確実なWSIを選択する。新たな注意誘導損失により、各クラスにアノテートされた領域がほとんどない、トレーニングされたモデルの精度が向上する。将来的には、病理組織学における癌分類の臨床的に関連する文脈において、MILモデルのトレーニングに重要な貢献をする可能性がある。
論文参考訳（メタデータ） (2023-03-02T15:18:58Z)
Rethinking Semi-Supervised Medical Image Segmentation: A Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。 5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文参考訳（メタデータ） (2023-02-03T13:50:25Z)
Enhanced Sharp-GAN For Histopathology Image Synthesis [63.845552349914186]
病理組織像合成は、正確ながん検出のためのディープラーニングアプローチの訓練において、データ不足の問題に対処することを目的としている。核トポロジと輪郭正則化を用いて合成画像の品質を向上させる新しい手法を提案する。提案手法は、Sharp-GANを2つのデータセット上の4つの画像品質指標すべてで上回る。
論文参考訳（メタデータ） (2023-01-24T17:54:01Z)
Hierarchical Transformer for Survival Prediction Using Multimodality Whole Slide Images and Genomics [63.76637479503006]
下流タスクのためのギガピクセルレベルのスライド病理画像(WSI)の良質な表現を学習することが重要である。本稿では,病理画像と対応する遺伝子間の階層的マッピングを学習する階層型マルチモーダルトランスフォーマーフレームワークを提案する。より優れたWSI表現能力を維持しながら、ベンチマーク手法と比較してGPUリソースが少ないアーキテクチャです。
論文参考訳（メタデータ） (2022-11-29T23:47:56Z)
Joint localization and classification of breast tumors on ultrasound images using a novel auxiliary attention-based framework [7.6620616780444974]
本稿では,注意機構と半教師付き半教師付き学習戦略に基づく,新しい共同局所化と分類モデルを提案する。提案されたモジュール化フレームワークは、様々なアプリケーションに対して柔軟なネットワーク置換を可能にする。
論文参考訳（メタデータ） (2022-10-11T20:14:13Z)
Dynamic Sub-Cluster-Aware Network for Few-Shot Skin Disease Classification [31.539129126161978]
本稿では,まれな皮膚疾患の診断における精度を高めるためのサブクラスタ・アウェア・ネットワーク(SCAN)という新しいアプローチを提案する。 SCANの設計を動機づける重要な洞察は、クラス内の皮膚疾患の画像が複数のサブクラスタを示すことが多いという観察である。数発の皮膚疾患分類のための2つのパブリックデータセットに対する提案手法の評価を行った。
論文参考訳（メタデータ） (2022-07-03T16:06:04Z)
Mixed-UNet: Refined Class Activation Mapping for Weakly-Supervised Semantic Segmentation with Multi-scale Inference [28.409679398886304]
我々は、デコードフェーズに2つの並列分岐を持つMixed-UNetという新しいモデルを開発する。地域病院や公開データセットから収集したデータセットに対して,いくつかの一般的なディープラーニングに基づくセグメンテーションアプローチに対して,設計したMixed-UNetを評価した。
論文参考訳（メタデータ） (2022-05-06T08:37:02Z)
Pay Attention with Focus: A Novel Learning Scheme for Classification of Whole Slide Images [8.416553728391309]
スライド画像全体(WSI)を解析するための新しい2段階アプローチを提案する。まず、WSIから代表パッチ(モザイクと呼ばれる)を抽出する。モザイクの各パッチは、ディープネットワークを用いて特徴ベクトルに符号化される。第2段階では、WSIから符号化されたパッチレベルの一連の特徴を用いて、一次診断確率を算出する。
論文参考訳（メタデータ） (2021-06-11T21:59:02Z)
An End-to-End Breast Tumour Classification Model Using Context-Based Patch Modelling- A BiLSTM Approach for Image Classification [19.594639581421422]
我々は, この関係を, 特定の腫瘍領域から抽出したパッチ間の特徴に基づく相関関係と統合しようと試みている。我々は、顕微鏡画像とWSI腫瘍領域の2つのデータセットでモデルをトレーニングし、テストした。 CNN機能付きBiLSTMは、パッチをエンドツーエンドの画像分類ネットワークにモデル化する上で、はるかに優れた性能を示した。
論文参考訳（メタデータ） (2021-06-05T10:43:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。