論文の概要: ReconMIL: Synergizing Latent Space Reconstruction with Bi-Stream Mamba for Whole Slide Image Analysis
- arxiv url: http://arxiv.org/abs/2603.19925v1
- Date: Fri, 20 Mar 2026 13:09:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.146628
- Title: ReconMIL: Synergizing Latent Space Reconstruction with Bi-Stream Mamba for Whole Slide Image Analysis
- Title(参考訳): ReconMIL:全スライド画像解析のための2ストリームマンバを用いた遅延空間再構成
- Authors: Lubin Gan, Jing Zhang, Heng Zhang, Xin Di, Zhifeng Wang, Wenke Huang, Xiaoyan Sun,
- Abstract要約: 全スライド画像(WSI)解析は、MIL(Multiple Case Learning)に大きく依存している。
このドメインギャップを埋め、グローバルな機能アグリゲーションのバランスをとるために設計された新しいフレームワークであるReconMILを紹介します。
提案手法では,ジェネリックな特徴をコンパクトなタスク固有多様体に適応的に射影するラテント空間再構成モジュールを提案する。
- 参考スコア(独自算出の注目度): 29.765137795042804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Whole slide image (WSI) analysis heavily relies on multiple instance learning (MIL). While recent methods benefit from large-scale foundation models and advanced sequence modeling to capture long-range dependencies, they still struggle with two critical issues. First, directly applying frozen, task-agnostic features often leads to suboptimal separability due to the domain gap with specific histological tasks. Second, relying solely on global aggregators can cause over-smoothing, where sparse but critical diagnostic signals are overshadowed by the dominant background context. In this paper, we present ReconMIL, a novel framework designed to bridge this domain gap and balance global-local feature aggregation. Our approach introduces a Latent Space Reconstruction module that adaptively projects generic features into a compact, task-specific manifold, improving boundary delineation. To prevent information dilution, we develop a bi-stream architecture combining a Mamba-based global stream for contextual priors and a CNN-based local stream to preserve subtle morphological anomalies. A scale-adaptive selection mechanism dynamically fuses these two streams, determining when to rely on overall architecture versus local saliency. Evaluations across multiple diagnostic and survival prediction benchmarks show that ReconMIL consistently outperforms current state-of-the-art methods, effectively localizing fine-grained diagnostic regions while suppressing background noise. Visualization results confirm the models superior ability to localize diagnostic regions by effectively balancing global structure and local granularity.
- Abstract(参考訳): 全体スライド画像(WSI)解析は、マルチインスタンス学習(MIL)に大きく依存している。
最近の手法は、長距離依存関係をキャプチャする大規模な基礎モデルと高度なシーケンスモデリングの恩恵を受けているが、それでも2つの重要な問題に悩まされている。
第一に、凍結したタスクに依存しない特徴を直接適用すると、特定の組織学的タスクとのドメインギャップにより、しばしば最適以下のセパビリティが生じる。
第二に、グローバルアグリゲータのみに依存すると、スムーズだが重要な診断信号が支配的な背景状況によって過度に隠蔽される、過剰なスムーシングを引き起こす可能性がある。
本稿では、このドメインギャップを埋め、グローバルな特徴集約のバランスをとるために設計された新しいフレームワークであるReconMILを提案する。
提案手法では,汎用的特徴をコンパクトなタスク固有多様体に適応的に射影するラテント空間再構成モジュールを導入し,境界線を改良する。
情報希釈を防止するため,マンバ型グローバルストリームとCNN型ローカルストリームを組み合わせたバイストリームアーキテクチャを構築し,微妙な形態的異常を保存する。
スケール適応選択機構は、これらの2つのストリームを動的に融合させ、アーキテクチャ全体とローカルサリエンシをいつ依存するかを決定する。
複数の診断および生存予測ベンチマークによる評価は、ReconMILが常に最先端の手法より優れており、背景雑音を抑えつつ、より微細な診断領域を効果的に局所化していることを示している。
可視化の結果,グローバルな構造と局所的な粒度を効果的にバランスさせることにより,診断領域の局所化能力に優れるモデルが確認された。
関連論文リスト
- SPEGC: Continual Test-Time Adaptation via Semantic-Prompt-Enhanced Graph Clustering for Medical Image Segmentation [12.0982298854338]
Continual Test-Time Adaptation (CTTA)は、トレーニング済みのモデルが、ラベルなしドメインの継続的な変更に適応できるようにすることを目的としている。
医用画像セグメンテーションのためのセマンティック・プロンプト拡張グラフクラスタリング(SPEGC)によるCTTAを提案する。
論文 参考訳(メタデータ) (2026-03-12T03:22:43Z) - MacNet: An End-to-End Manifold-Constrained Adaptive Clustering Network for Interpretable Whole Slide Image Classification [9.952997875404634]
クラスタリングに基づくアプローチは、説明可能な意思決定プロセスを提供するが、高次元の特徴と意味的にあいまいなセントロイドに悩まされる。
本稿では、グラスマン再埋め込みと多様体適応クラスタリングを統合したエンドツーエンドMILフレームワークを提案する。
マルチセントのWSIデータセットの実験では、1) クラスタを組み込んだモデルは、グレーディング精度と解釈可能性の両方において優れたパフォーマンスを実現し、2) エンドツーエンドの学習は、より良い特徴表現を洗練し、許容できるリソースを必要とします。
論文 参考訳(メタデータ) (2026-02-16T06:43:36Z) - OCTOPUS: Enhancing the Spatial-Awareness of Vision SSMs with Multi-Dimensional Scans and Traversal Selection [20.717476762904038]
我々は,大域的コンテキストと画像内の局所空間構造の両方を保存する新しいアーキテクチャであるOCTOPUSを紹介する。
OCTOPUSは8つの主方向に沿って個別に再起し、水平方向、垂直方向、対角方向を前方または後方に進む。
分類とセグメンテーションのベンチマークでは、OCTOPUSは境界保存と領域の整合性において顕著な改善を示した。
論文 参考訳(メタデータ) (2026-01-31T21:12:59Z) - MMAP: A Multi-Magnification and Prototype-Aware Architecture for Predicting Spatial Gene Expression [1.083137038945176]
空間転写学(Spatial Transcriptomics:ST)は、空間情報を保存しながら遺伝子発現の測定を可能にする。
近年、ヘマトキシリンとエオシン(H&E)による全スライディング画像(WSI)を用いて、ディープニューラルネットワークによる転写産物全体の遺伝子発現プロファイルを予測する研究が進められている。
しかし, 組織像から空間遺伝子発現を予測することは, 視覚的特徴と分子信号との差が大きいため, 依然として難しい問題である。
本研究では,MMAP (Multi-Magnification and Prototype-enhanced Architecture) という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-13T12:41:09Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - CodeBrain: Towards Decoupled Interpretability and Multi-Scale Architecture for EEG Foundation Model [52.466542039411515]
EEGファウンデーションモデル(EFM)は、タスク固有のモデルのスケーラビリティ問題に対処するために登場した。
このギャップを埋めるために設計された2段階のEMFであるCodeBrainを紹介します。
第1段階では、異種時間・周波数の脳波信号を離散トークンに分解するTFDual-Tokenizerを導入する。
第2段階では、構造化されたグローバル畳み込みとスライディングウインドウの注意を結合したマルチスケールEEGSSMアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-06-10T17:20:39Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization [85.18995948334592]
単一のドメインの一般化(単一DG)は、単一のトレーニングドメインからのみ見えないドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
最先端のアプローチは、主に新しいデータを合成するために、敵対的な摂動やスタイルの強化といったデータ拡張に頼っている。
データ拡張の過程で、ソースと擬似ドメインのアライメントを明示的に考慮したemphStyDeStyを提案する。
論文 参考訳(メタデータ) (2024-06-01T02:41:34Z) - DGMamba: Domain Generalization via Generalized State Space Model [80.82253601531164]
ドメイン一般化(DG)は、様々な場面における分散シフト問題を解決することを目的としている。
Mambaは、新興状態空間モデル(SSM)として、より優れた線形複雑性と大域的受容場を持つ。
本稿では,DGMamba という新たな DG フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-11T14:35:59Z) - Cross-modal Local Shortest Path and Global Enhancement for
Visible-Thermal Person Re-Identification [2.294635424666456]
本稿では,局所的特徴とグローバル的特徴の同時学習に基づく2ストリームネットワークであるCM-LSP-GE(Cross-modal Local Shortest Path and Global Enhancement)モジュールを提案する。
2つの典型的なデータセットの実験結果は、我々のモデルは明らかに最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T10:27:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。