論文の概要: FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification
- arxiv url: http://arxiv.org/abs/2411.14743v1
- Date: Fri, 22 Nov 2024 05:36:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:03:40.109956
- Title: FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification
- Title(参考訳): FOCUS:Few-shot Whole Slide画像分類のための知識強化型適応型視覚圧縮
- Authors: Zhengrui Guo, Conghao Xiong, Jiabo Ma, Qichen Sun, Lishuang Feng, Jinzhuo Wang, Hao Chen,
- Abstract要約: 少ないショット学習は、計算病理学における癌診断の重要な解決策である。
このパラダイムにおける重要な課題は、スライド画像全体(WSI)の限られたトレーニングセットと膨大な数のパッチとの間の固有の相違に起因する。
我々は、診断関連領域の集中分析を可能にするために、知識強化型適応型視覚圧縮フレームワーク、FOCUSを紹介した。
- 参考スコア(独自算出の注目度): 4.148491257542209
- License:
- Abstract: Few-shot learning presents a critical solution for cancer diagnosis in computational pathology (CPath), addressing fundamental limitations in data availability, particularly the scarcity of expert annotations and patient privacy constraints. A key challenge in this paradigm stems from the inherent disparity between the limited training set of whole slide images (WSIs) and the enormous number of contained patches, where a significant portion of these patches lacks diagnostically relevant information, potentially diluting the model's ability to learn and focus on critical diagnostic features. While recent works attempt to address this by incorporating additional knowledge, several crucial gaps hinder further progress: (1) despite the emergence of powerful pathology foundation models (FMs), their potential remains largely untapped, with most approaches limiting their use to basic feature extraction; (2) current language guidance mechanisms attempt to align text prompts with vast numbers of WSI patches all at once, struggling to leverage rich pathological semantic information. To this end, we introduce the knowledge-enhanced adaptive visual compression framework, dubbed FOCUS, which uniquely combines pathology FMs with language prior knowledge to enable a focused analysis of diagnostically relevant regions by prioritizing discriminative WSI patches. Our approach implements a progressive three-stage compression strategy: we first leverage FMs for global visual redundancy elimination, and integrate compressed features with language prompts for semantic relevance assessment, then perform neighbor-aware visual token filtering while preserving spatial coherence. Extensive experiments on pathological datasets spanning breast, lung, and ovarian cancers demonstrate its superior performance in few-shot pathology diagnosis. Code will be made available at https://github.com/dddavid4real/FOCUS.
- Abstract(参考訳): 少ないショットラーニングは、計算病理学(CPath)におけるがん診断の重要な解決策を示し、データ可用性の基本的な制限、特に専門家アノテーションの不足と患者のプライバシ制約に対処する。
このパラダイムにおける重要な課題は、スライド画像全体(WSI)の限られたトレーニングセットと膨大な数のパッチとの間の固有の相違に起因する。
1) 強力な病理基盤モデル(FM)の出現にもかかわらず、ほとんどのアプローチでは基本的な特徴抽出に使用を制限しているため、そのポテンシャルは未解決のままであり、(2) 現在の言語指導メカニズムは、テキストプロンプトを膨大な数のWSIパッチと組み合わせようと試み、リッチな病理学的意味情報を活用するのに苦労している。
この目的のために我々は,病的FMと言語先行知識を一意に組み合わせ,識別性WSIパッチの優先順位付けによる診断関連領域の集中分析を可能にする知識強化適応型視覚圧縮フレームワークFOCUSを紹介した。
提案手法では,まずFMをグローバルな視覚的冗長性除去に活用し,セマンティック・レバレンス・アセスメントのための言語プロンプトと圧縮機能を統合し,空間コヒーレンスを保ちながら隣接する視覚的トークンフィルタリングを行う。
乳がん,肺がん,卵巣癌にまたがる病理組織学的データセットの広範囲にわたる実験は,数発の病理診断において優れた成績を示した。
コードはhttps://github.com/dddavid4real/FOCUS.comで公開される。
関連論文リスト
- ViKL: A Mammography Interpretation Framework via Multimodal Aggregation of Visual-knowledge-linguistic Features [54.37042005469384]
MVKLは,マルチビュー画像,詳細な表示,報告を含む最初のマルチモーダルマンモグラフィーデータセットである。
このデータセットに基づいて、教師なし事前学習のチャラリングタスクに焦点を当てる。
視覚,知識,言語機能を相乗化するフレームワークであるViKLを提案する。
論文 参考訳(メタデータ) (2024-09-24T05:01:23Z) - Pathology-knowledge Enhanced Multi-instance Prompt Learning for Few-shot Whole Slide Image Classification [19.070685830687285]
臨床環境では、患者のプライバシ上の懸念や、稀な疾患や新興疾患の流行により、病的スライドへのアクセスが制限されることは避けられない。
本稿では,病理知識によって強化されたマルチインスタンス・プロンプト学習フレームワークを提案する。
本手法は,3つの困難な臨床課題において優れた成績を示し,比較数ショット法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-15T15:31:55Z) - Hierarchical Salient Patch Identification for Interpretable Fundus Disease Localization [4.714335699701277]
階層型サルエントパッチ同定法 (HSPI) を考案した。
HSPIは、画像レベルのラベルとニューラルネットワーク分類器(NNC)のみを用いて、解釈可能な疾患の局在を達成できる
本研究は,眼底画像データセットの病巣局所化実験を行い,従来の解釈可能な帰属法と比較して,複数の評価指標の最良の性能を実現する。
論文 参考訳(メタデータ) (2024-05-23T09:07:21Z) - Semantics-Aware Attention Guidance for Diagnosing Whole Slide Images [5.856390270089738]
我々はSemantics-Aware Attention Guidance(SAG)という新しいフレームワークを紹介する。
SAGは,1) 診断関連エンティティを注意信号に変換する技術,2) 意味的に重要な情報を効率的に統合する柔軟な注意損失を含む。
2つの異なるがんデータセットに対する実験は、精度、精度、リコールにおいて一貫した改善を示す。
論文 参考訳(メタデータ) (2024-04-16T20:37:14Z) - Shifting Focus: From Global Semantics to Local Prominent Features in Swin-Transformer for Knee Osteoarthritis Severity Assessment [42.09313885494969]
我々はSwin Transformerの能力を利用して階層的な枠組みを通じて画像内の空間的依存関係を識別する。
我々の新しい貢献は、局所的な特徴表現を精細化し、分類器の最終的な分布に特化することにある。
Knee osteoArthritis (KOA) グレード分類のための2つの確立されたベンチマークを広範囲に検証した結果,本モデルは有意な堅牢性と精度を示した。
論文 参考訳(メタデータ) (2024-03-15T01:09:58Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Unsupervised deep learning techniques for powdery mildew recognition
based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。
マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。
本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文 参考訳(メタデータ) (2021-12-20T13:29:13Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Explaining Clinical Decision Support Systems in Medical Imaging using
Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。
臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。
そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2020-10-09T14:39:27Z) - Potential Features of ICU Admission in X-ray Images of COVID-19 Patients [8.83608410540057]
本稿では,患者ICU入院ラベルを用いたデータセットから,重症度と相関する意味的特徴を抽出する手法を提案する。
この手法は、肺の病態を認識して意味的特徴を抽出するために訓練されたニューラルネットワークを使用する。
この方法では、学習した特徴の画像を選択でき、肺内の一般的な位置に関する情報を翻訳することができる。
論文 参考訳(メタデータ) (2020-09-26T13:48:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。