Fugu-MT 論文翻訳(概要): FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification

論文の概要: FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification

arxiv url: http://arxiv.org/abs/2411.14743v1
Date: Fri, 22 Nov 2024 05:36:38 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:50.096974
Title: FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification
Title（参考訳）: FOCUS:Few-shot Whole Slide画像分類のための知識強化型適応型視覚圧縮
Authors: Zhengrui Guo, Conghao Xiong, Jiabo Ma, Qichen Sun, Lishuang Feng, Jinzhuo Wang, Hao Chen,
Abstract要約: 少ないショット学習は、計算病理学における癌診断の重要な解決策である。このパラダイムにおける重要な課題は、スライド画像全体(WSI)の限られたトレーニングセットと膨大な数のパッチとの間の固有の相違に起因する。我々は、診断関連領域の集中分析を可能にするために、知識強化型適応型視覚圧縮フレームワーク、FOCUSを紹介した。
参考スコア（独自算出の注目度）: 4.148491257542209
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Few-shot learning presents a critical solution for cancer diagnosis in computational pathology (CPath), addressing fundamental limitations in data availability, particularly the scarcity of expert annotations and patient privacy constraints. A key challenge in this paradigm stems from the inherent disparity between the limited training set of whole slide images (WSIs) and the enormous number of contained patches, where a significant portion of these patches lacks diagnostically relevant information, potentially diluting the model's ability to learn and focus on critical diagnostic features. While recent works attempt to address this by incorporating additional knowledge, several crucial gaps hinder further progress: (1) despite the emergence of powerful pathology foundation models (FMs), their potential remains largely untapped, with most approaches limiting their use to basic feature extraction; (2) current language guidance mechanisms attempt to align text prompts with vast numbers of WSI patches all at once, struggling to leverage rich pathological semantic information. To this end, we introduce the knowledge-enhanced adaptive visual compression framework, dubbed FOCUS, which uniquely combines pathology FMs with language prior knowledge to enable a focused analysis of diagnostically relevant regions by prioritizing discriminative WSI patches. Our approach implements a progressive three-stage compression strategy: we first leverage FMs for global visual redundancy elimination, and integrate compressed features with language prompts for semantic relevance assessment, then perform neighbor-aware visual token filtering while preserving spatial coherence. Extensive experiments on pathological datasets spanning breast, lung, and ovarian cancers demonstrate its superior performance in few-shot pathology diagnosis. Code will be made available at https://github.com/dddavid4real/FOCUS.
Abstract（参考訳）: 少ないショットラーニングは、計算病理学(CPath)におけるがん診断の重要な解決策を示し、データ可用性の基本的な制限、特に専門家アノテーションの不足と患者のプライバシ制約に対処する。このパラダイムにおける重要な課題は、スライド画像全体(WSI)の限られたトレーニングセットと膨大な数のパッチとの間の固有の相違に起因する。 1) 強力な病理基盤モデル(FM)の出現にもかかわらず、ほとんどのアプローチでは基本的な特徴抽出に使用を制限しているため、そのポテンシャルは未解決のままであり、(2) 現在の言語指導メカニズムは、テキストプロンプトを膨大な数のWSIパッチと組み合わせようと試み、リッチな病理学的意味情報を活用するのに苦労している。この目的のために我々は,病的FMと言語先行知識を一意に組み合わせ,識別性WSIパッチの優先順位付けによる診断関連領域の集中分析を可能にする知識強化適応型視覚圧縮フレームワークFOCUSを紹介した。提案手法では,まずFMをグローバルな視覚的冗長性除去に活用し,セマンティック・レバレンス・アセスメントのための言語プロンプトと圧縮機能を統合し,空間コヒーレンスを保ちながら隣接する視覚的トークンフィルタリングを行う。乳がん,肺がん,卵巣癌にまたがる病理組織学的データセットの広範囲にわたる実験は,数発の病理診断において優れた成績を示した。コードはhttps://github.com/dddavid4real/FOCUS.comで公開される。

関連論文リスト

Anatomical Region-Guided Contrastive Decoding: A Plug-and-Play Strategy for Mitigating Hallucinations in Medical VLMs [20.507007953026346]
Anatomical Region-Guided Contrastive Decoding (ARCD) は、目標とする地域固有のガイダンスを提供することで幻覚を緩和するプラグアンドプレイ戦略である。本手法は, 地域理解の向上, 幻覚の低減, 総合的診断精度の向上に有効である。
論文参考訳（メタデータ） (2025-12-19T03:11:20Z)
A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。 CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文参考訳（メタデータ） (2025-12-15T10:22:43Z)
MIRNet: Integrating Constrained Graph-Based Reasoning with Pre-training for Diagnostic Medical Imaging [67.74482877175797]
MIRNetは、自己教師付き事前学習と制約付きグラフベースの推論を統合する新しいフレームワークである。 TongueAtlas-4Kは,22の診断ラベルを付した4,000枚の画像からなるベンチマークである。
論文参考訳（メタデータ） (2025-11-13T06:30:41Z)
Efficient Multi-Slide Visual-Language Feature Fusion for Placental Disease Classification [20.137166016134636]
本研究では,EMmPDと命名された患者レベルの胎盤疾患診断のための効率的なマルチモーダルフレームワークを提案する。本稿では,パラメータフリーと学習可能な圧縮戦略を組み合わせた2段階のパッチ選択モジュールを提案する。我々は適応的なグラフ学習を活用して病理的特徴表現を強化するハイブリッドマルチモーダル融合モジュールを開発した。
論文参考訳（メタデータ） (2025-08-05T09:56:12Z)
UGPL: Uncertainty-Guided Progressive Learning for Evidence-Based Classification in Computed Tomography [0.0]
現在のアプローチでは、画像が一様に処理され、局所的な異常を検出する能力が制限される。グローバル-ローカル分析を行う不確実性誘導型プログレッシブラーニングフレームワークであるUGPLを紹介する。 3つのCTデータセットに対する実験により、UGPLは最先端のメソッドを一貫して上回っていることが示された。
論文参考訳（メタデータ） (2025-07-18T17:30:56Z)
Towards Accurate and Interpretable Neuroblastoma Diagnosis via Contrastive Multi-scale Pathological Image Analysis [16.268045905735818]
CMSwinKANは、病理画像分類に適したコントラスト学習に基づくマルチスケール機能融合モデルである。臨床所見から導かれるソフト投票機構を導入し,パッチレベルの予測をスライド画像全体の分類にシームレスにブリッジする。その結果、CMSwinKANは、既存の最先端の病理モデルよりも、大規模なデータセットで事前訓練されたモデルよりもパフォーマンスがよいことが示された。
論文参考訳（メタデータ） (2025-04-18T15:39:46Z)
From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation [48.45209969191245]
視覚言語モデル(VLM)は、テキスト記述を通して意味的コンテキストを提供するが、説明精度は欠如している。本稿では,その補完的強みを活かし,視線と言語指導を統合した教師教育フレームワークを提案する。本手法は,8.78%,80.53%,84.22%のDiceスコアをそれぞれ達成し,アノテーション負担を増大させることなく視線ベースラインよりも3.5%向上した。
論文参考訳（メタデータ） (2025-04-15T16:32:15Z)
Vision Transformers with Autoencoders and Explainable AI for Cancer Patient Risk Stratification Using Whole Slide Imaging [3.6940298700319065]
PATH-Xは、視覚変換器(ViT)と自動エンコーダをSHAP(Shapley Additive Explanations)と統合し、患者の成層化とリスク予測のモデル化性を高めるフレームワークである。代表画像スライスを各WSIから選択し、Googleの事前訓練されたViTを用いて数値的特徴埋め込みを抽出する。カプラン・マイアー生存分析を用いて,2つのリスク群と3つのリスク群に層状化を評価する。
論文参考訳（メタデータ） (2025-04-07T05:48:42Z)
From Pixels to Histopathology: A Graph-Based Framework for Interpretable Whole Slide Image Analysis [81.19923502845441]
我々はWSIグラフ表現を構成するグラフベースのフレームワークを開発する。任意のパッチではなく生物学的境界に従う組織表現(ノード)を構築します。本手法の最終段階として,グラフアテンションネットワークを用いて診断課題を解決する。
論文参考訳（メタデータ） (2025-03-14T20:15:04Z)
Leveraging Vision-Language Embeddings for Zero-Shot Learning in Histopathology Images [7.048241543461529]
ゼロショット組織像分類におけるこれらの課題に対処するため, MR-PHE(Multi-Resolution Prompt-Guided Hybrid Embedding)と呼ばれる新しいフレームワークを提案する。我々は,グローバルな画像埋め込みと重み付けされたパッチ埋め込みを統合したハイブリッドな埋め込み戦略を導入する。類似性に基づくパッチ重み付け機構は、クラス埋め込みとの関連性に基づいて、アテンションのような重み付けをパッチに割り当てる。
論文参考訳（メタデータ） (2025-03-13T12:18:37Z)
Pathological Prior-Guided Multiple Instance Learning For Mitigating Catastrophic Forgetting in Breast Cancer Whole Slide Image Classification [50.899861205016265]
乳癌のWSI分類における破滅的忘れを緩和する新しい枠組みであるPaGMILを提案する。私たちのフレームワークでは、共通のMILモデルアーキテクチャに2つの重要なコンポーネントを導入しています。複数の乳がんデータセットを対象としたPaGMILの連続学習性能の評価を行った。
論文参考訳（メタデータ） (2025-03-08T04:51:58Z)
ViKL: A Mammography Interpretation Framework via Multimodal Aggregation of Visual-knowledge-linguistic Features [54.37042005469384]
MVKLは,マルチビュー画像,詳細な表示,報告を含む最初のマルチモーダルマンモグラフィーデータセットである。このデータセットに基づいて、教師なし事前学習のチャラリングタスクに焦点を当てる。視覚,知識,言語機能を相乗化するフレームワークであるViKLを提案する。
論文参考訳（メタデータ） (2024-09-24T05:01:23Z)
Pathology-knowledge Enhanced Multi-instance Prompt Learning for Few-shot Whole Slide Image Classification [19.070685830687285]
臨床環境では、患者のプライバシ上の懸念や、稀な疾患や新興疾患の流行により、病的スライドへのアクセスが制限されることは避けられない。本稿では,病理知識によって強化されたマルチインスタンス・プロンプト学習フレームワークを提案する。本手法は,3つの困難な臨床課題において優れた成績を示し,比較数ショット法よりも優れていた。
論文参考訳（メタデータ） (2024-07-15T15:31:55Z)
Hierarchical Salient Patch Identification for Interpretable Fundus Disease Localization [4.714335699701277]
階層型サルエントパッチ同定法 (HSPI) を考案した。 HSPIは、画像レベルのラベルとニューラルネットワーク分類器(NNC)のみを用いて、解釈可能な疾患の局在を達成できる本研究は,眼底画像データセットの病巣局所化実験を行い,従来の解釈可能な帰属法と比較して,複数の評価指標の最良の性能を実現する。
論文参考訳（メタデータ） (2024-05-23T09:07:21Z)
Semantics-Aware Attention Guidance for Diagnosing Whole Slide Images [5.856390270089738]
我々はSemantics-Aware Attention Guidance(SAG)という新しいフレームワークを紹介する。 SAGは,1) 診断関連エンティティを注意信号に変換する技術,2) 意味的に重要な情報を効率的に統合する柔軟な注意損失を含む。 2つの異なるがんデータセットに対する実験は、精度、精度、リコールにおいて一貫した改善を示す。
論文参考訳（メタデータ） (2024-04-16T20:37:14Z)
Shifting Focus: From Global Semantics to Local Prominent Features in Swin-Transformer for Knee Osteoarthritis Severity Assessment [42.09313885494969]
我々はSwin Transformerの能力を利用して階層的な枠組みを通じて画像内の空間的依存関係を識別する。我々の新しい貢献は、局所的な特徴表現を精細化し、分類器の最終的な分布に特化することにある。 Knee osteoArthritis (KOA) グレード分類のための2つの確立されたベンチマークを広範囲に検証した結果,本モデルは有意な堅牢性と精度を示した。
論文参考訳（メタデータ） (2024-03-15T01:09:58Z)
Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。 PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文参考訳（メタデータ） (2024-02-16T05:16:20Z)
Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites: A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文参考訳（メタデータ） (2023-08-31T00:36:10Z)
Unsupervised deep learning techniques for powdery mildew recognition based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文参考訳（メタデータ） (2021-12-20T13:29:13Z)
Inheritance-guided Hierarchical Assignment for Clinical Automatic Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文参考訳（メタデータ） (2021-01-27T13:16:51Z)
Explaining Clinical Decision Support Systems in Medical Imaging using Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文参考訳（メタデータ） (2020-10-09T14:39:27Z)
Potential Features of ICU Admission in X-ray Images of COVID-19 Patients [8.83608410540057]
本稿では,患者ICU入院ラベルを用いたデータセットから,重症度と相関する意味的特徴を抽出する手法を提案する。この手法は、肺の病態を認識して意味的特徴を抽出するために訓練されたニューラルネットワークを使用する。この方法では、学習した特徴の画像を選択でき、肺内の一般的な位置に関する情報を翻訳することができる。
論文参考訳（メタデータ） (2020-09-26T13:48:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。