論文の概要: The Next Layer: Augmenting Foundation Models with Structure-Preserving and Attention-Guided Learning for Local Patches to Global Context Awareness in Computational Pathology
- arxiv url: http://arxiv.org/abs/2508.19914v1
- Date: Wed, 27 Aug 2025 14:19:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.662576
- Title: The Next Layer: Augmenting Foundation Models with Structure-Preserving and Attention-Guided Learning for Local Patches to Global Context Awareness in Computational Pathology
- Title(参考訳): 次のレイヤ:計算病理におけるグローバルコンテキスト認識に対する局所的パッチのための構造保存学習と注意誘導学習による基礎モデルの拡張
- Authors: Muhammad Waqas, Rukhmini Bandyopadhyay, Eman Showkatian, Amgad Muneer, Anas Zafar, Frank Rojas Alvarez, Maricel Corredor Marin, Wentao Li, David Jaffray, Cara Haymaker, John Heymach, Natalie I Vokes, Luisa Maren Solis Soto, Jianjun Zhang, Jia Wu,
- Abstract要約: 本稿では,予測と解釈性の向上を目的とした構造保存型注意誘導型MILアーキテクチャであるEAGLE-Netを提案する。
3種類のがんタイプ(10,260スライド)と7種類のがんタイプ(4,172スライド)を含む大規模な膵がんデータセットでベンチマークを行った。
- 参考スコア(独自算出の注目度): 23.32822092398391
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models have recently emerged as powerful feature extractors in computational pathology, yet they typically omit mechanisms for leveraging the global spatial structure of tissues and the local contextual relationships among diagnostically relevant regions - key elements for understanding the tumor microenvironment. Multiple instance learning (MIL) remains an essential next step following foundation model, designing a framework to aggregate patch-level features into slide-level predictions. We present EAGLE-Net, a structure-preserving, attention-guided MIL architecture designed to augment prediction and interpretability. EAGLE-Net integrates multi-scale absolute spatial encoding to capture global tissue architecture, a top-K neighborhood-aware loss to focus attention on local microenvironments, and background suppression loss to minimize false positives. We benchmarked EAGLE-Net on large pan-cancer datasets, including three cancer types for classification (10,260 slides) and seven cancer types for survival prediction (4,172 slides), using three distinct histology foundation backbones (REMEDIES, Uni-V1, Uni2-h). Across tasks, EAGLE-Net achieved up to 3% higher classification accuracy and the top concordance indices in 6 of 7 cancer types, producing smooth, biologically coherent attention maps that aligned with expert annotations and highlighted invasive fronts, necrosis, and immune infiltration. These results position EAGLE-Net as a generalizable, interpretable framework that complements foundation models, enabling improved biomarker discovery, prognostic modeling, and clinical decision support
- Abstract(参考訳): 基礎モデルは、最近、計算病理学において強力な特徴抽出器として登場したが、一般的に、組織の全空間構造と診断関連領域間の局所的文脈的関係(腫瘍の微小環境を理解するための重要な要素)を活用するメカニズムを省略する。
複数インスタンス学習(MIL)は基礎モデルに続く重要な次のステップであり、パッチレベルの機能をスライドレベルの予測に集約するフレームワークを設計する。
本稿では,予測と解釈性の向上を目的とした構造保存型注意誘導型MILアーキテクチャであるEAGLE-Netを提案する。
EAGLE-Netは、マルチスケールの絶対空間符号化を統合して、グローバル組織アーキテクチャーをキャプチャし、局所的なミクロ環境に注意を向けるトップK地区認識損失と、偽陽性を最小化するためのバックグラウンド抑制損失を計測する。
EAGLE-Netは3種類のがんタイプ(10,260スライド)と7種類のがんタイプ(4,172スライド)を含む大規模な膵がんデータセット上で,3つの異なる組織基盤バックボーン(REMEDIES,Uni-V1,Uni2-h)を用いてベンチマークを行った。
タスク全体で、ERGLE-Netは7種類の癌タイプのうち、最大3%の分類精度とトップコンコーダンス指標を達成し、スムーズで生物学的にコヒーレントな注意マップを作成し、専門家のアノテーションに一致し、侵入フロント、壊死、免疫浸潤をハイライトした。
これらの結果は、EAGLE-Netを基礎モデルを補完し、改良されたバイオマーカー発見、予後モデリング、臨床決定支援を可能にする一般化可能な解釈可能なフレームワークとして位置づけている。
関連論文リスト
- Topology-Constrained Learning for Efficient Laparoscopic Liver Landmark Detection [46.2391319253146]
肝のランドマークは腹腔鏡下肝手術中に外科医に重要な解剖学的ガイダンスを提供する。
TopoNetは腹腔鏡下肝ランドマーク検出のための新しいトポロジ制約学習フレームワークである。
我々のフレームワークは、スネーク・CNNデュアルパス・エンコーダを用いて、詳細なRGBテクスチャ情報と深さインフォームドトポロジ構造を同時に取得する。
論文 参考訳(メタデータ) (2025-07-01T07:35:36Z) - HieraEdgeNet: A Multi-Scale Edge-Enhanced Framework for Automated Pollen Recognition [10.159338629617919]
自動花粉認識のためのマルチスケールエッジエンハンスメントフレームワークであるHieraEdgeNetを紹介する。
フレームワークの中核となる革新は3つの相乗的モジュールの導入である。
大規模なデータセットでは、HieraEdgeNetは平均平均精度(mAP@.5)が0.9501に達し、最先端のベースラインモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2025-06-09T11:03:31Z) - Leveraging Vision-Language Embeddings for Zero-Shot Learning in Histopathology Images [7.048241543461529]
ゼロショット組織像分類におけるこれらの課題に対処するため, MR-PHE(Multi-Resolution Prompt-Guided Hybrid Embedding)と呼ばれる新しいフレームワークを提案する。
我々は,グローバルな画像埋め込みと重み付けされたパッチ埋め込みを統合したハイブリッドな埋め込み戦略を導入する。
類似性に基づくパッチ重み付け機構は、クラス埋め込みとの関連性に基づいて、アテンションのような重み付けをパッチに割り当てる。
論文 参考訳(メタデータ) (2025-03-13T12:18:37Z) - Comparative Analysis of Multi-Omics Integration Using Advanced Graph Neural Networks for Cancer Classification [40.45049709820343]
マルチオミクスデータ統合は、高次元性、データ複雑さ、および様々なオミクスタイプの異なる特徴により、大きな課題を生じさせる。
本研究では、グラフ畳み込みネットワーク(GCN)、グラフアテンションネットワーク(GAT)、グラフトランスフォーマーネットワーク(GTN)に基づくマルチオミクス(MO)統合のための3つのグラフニューラルネットワークアーキテクチャを評価する。
論文 参考訳(メタデータ) (2024-10-05T16:17:44Z) - Shifting Focus: From Global Semantics to Local Prominent Features in Swin-Transformer for Knee Osteoarthritis Severity Assessment [42.09313885494969]
我々はSwin Transformerの能力を利用して階層的な枠組みを通じて画像内の空間的依存関係を識別する。
我々の新しい貢献は、局所的な特徴表現を精細化し、分類器の最終的な分布に特化することにある。
Knee osteoArthritis (KOA) グレード分類のための2つの確立されたベンチマークを広範囲に検証した結果,本モデルは有意な堅牢性と精度を示した。
論文 参考訳(メタデータ) (2024-03-15T01:09:58Z) - HistGen: Histopathology Report Generation via Local-Global Feature Encoding and Cross-modal Context Interaction [16.060286162384536]
HistGenは、病理組織学レポート生成のための学習可能なフレームワークである。
スライド画像全体(WSI)と局所的およびグローバルな粒度からの診断レポートを整列させることで、レポート生成を促進することを目的としている。
WSIレポート生成実験の結果,提案手法は最先端モデル(SOTA)よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2024-03-08T15:51:43Z) - Neural Distance Embeddings for Biological Sequences [43.07977514121458]
幾何ベクトル空間に配列を埋め込むためのフレームワークであるNeuroSEEDを提案する。
階層構造を捉えた双曲空間の有効性を示し, RMSEの埋め込みにおける平均22%の還元効果を示す。
提案手法は,実世界のデータセットに対して,大幅な精度向上と実行時改善を示す。
論文 参考訳(メタデータ) (2021-09-20T17:30:58Z) - Whole Slide Images are 2D Point Clouds: Context-Aware Survival
Prediction using Patch-based Graph Convolutional Networks [6.427108174481534]
Patch-GCNは、コンテキスト対応で空間分解されたパッチベースのグラフ畳み込みネットワークで、階層的にインスタンスレベルのヒストロジーの特徴を集約する。
我々は、Patch-GCNが以前の弱教師付きアプローチを3.58-9.46%上回っていることを示した。
論文 参考訳(メタデータ) (2021-07-27T19:17:37Z) - Topology-Aware Segmentation Using Discrete Morse Theory [38.65353702366932]
深部画像セグメンテーションネットワークを訓練し、位相精度を向上させる新しい手法を提案する。
1次元骨格や2次元パッチなど,位相的精度に重要なグローバル構造を明らかにする。
多様なデータセットに対して,DICEスコアとトポロジカルメトリクスの両方で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-18T02:47:21Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。