論文の概要: Dino-NestedUNet: Unlocking Foundation Vision Encoders for Pathology Tumor Bulk Segmentation via Dense Decoding
- arxiv url: http://arxiv.org/abs/2605.00894v1
- Date: Mon, 27 Apr 2026 23:22:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.457194
- Title: Dino-NestedUNet: Unlocking Foundation Vision Encoders for Pathology Tumor Bulk Segmentation via Dense Decoding
- Title(参考訳): Dino-NestedUNet:Dense Decodingによる病理腫瘍バルクセグメンテーションのためのファンデーションビジョンエンコーダのアンロック
- Authors: Tianyang Wang, Ziyu Su, Abdul Rehman Akbar, Usama Sajjad, Usman Afzaal, Lina Gokhale, Charles Rabolli, Wei Chen, Anil Parwani, Muhammad Khalid Khan Niazi,
- Abstract要約: 本稿では,Nested Dense Decoderと事前学習したDINOv3エンコーダを結合するフレームワークであるDino-NestedUNetを提案する。
UNet++と標準のDino-UNetに対する一貫した改善を観察する。
以上の結果から,高密度復号化は境界感応性病理領域の基盤エンコーダをアンロックするための重要な要素であることが示唆された。
- 参考スコア(独自算出の注目度): 7.637787421453472
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Vision foundation models (VFMs), such as DINOv3, provide rich semantic representations that are promising for computational pathology. However, many current adaptations pair frozen VFMs with lightweight decoders, creating a capacity mismatch that often limits boundary fidelity for infiltrative tumor bulk segmentation. This paper presents Dino-NestedUNet, a framework that couples a pre-trained DINOv3 encoder with a Nested Dense Decoder. Instead of sparse skip connections and linear upsampling, the proposed decoder forms a dense grid of intermediate pathways to enable continuous feature reuse and multi-scale recalibration, aligning high-level semantics with low-level morphological textures during reconstruction. We evaluate Dino-NestedUNet on three histopathology cohorts (multi-center CHTN, institutional OSU, and CAMELYON16) and observe consistent improvements over UNet++ and standard Dino-UNet variants, particularly under cross-domain shift. To further assess external generalization, we perform zero-shot evaluation by training on CHTN and directly testing on unseen TIGER WSIBULK and OSU CRC cohorts without fine-tuning. These results suggest that dense decoding is a key ingredient for unlocking foundation encoders in boundary-sensitive pathology segmentation.
- Abstract(参考訳): DINOv3のようなビジョン基礎モデル(VFM)は、計算病理学に有望なリッチな意味表現を提供する。
しかし、現在の多くの適応は、凍結したVFMと軽量デコーダを組み合わせ、しばしば浸潤性腫瘍のバルクセグメンテーションの境界密度を制限するキャパシティミスマッチを生成する。
本稿では,Nested Dense Decoderと事前学習したDINOv3エンコーダを結合するフレームワークであるDino-NestedUNetを提案する。
提案するデコーダは,ススパーススキップ接続や線形アップサンプリングではなく,連続的な特徴の再利用とマルチスケールのリカレーションを実現するために,中間経路の高密度グリッドを形成し,再構築時に低レベルな形態的テクスチャと高レベルなセマンティクスを整合させる。
我々はDino-NestedUNetを3つの病理組織コホート(マルチセンターCHTN、機関OSU、CAMELYON16)で評価し、UNet++と標準Dino-UNetの変種に対する一貫した改善を観察した。
外部一般化をさらに評価するため,CHTNを訓練し,未確認のTIGER WSIBULKとOSU CRCコホートを微調整せずに直接試験することによりゼロショット評価を行う。
以上の結果から,高密度復号化は境界感応性病理領域の基盤エンコーダをアンロックするための重要な要素であることが示唆された。
関連論文リスト
- GRAFNet: Multiscale Retinal Processing via Guided Cortical Attention Feedback for Enhancing Medical Image Polyp Segmentation [6.834321209531585]
本稿では,人間の視覚システムの階層構造を模倣する生物学的にインスパイアされたアーキテクチャであるGRAFNetを提案する。
GRAFNetは,(1)方向調整された皮質ニューロンをポリプ境界に模倣するガイド非対称注意モジュール(GAAM),(2)平行多機能解析のために網膜神経節細胞経路を複製するマルチスケール網膜モジュール(MSRM),(3)反復精製に予測符号化を適用するガイド非対称注意フィードバックモジュール(GCAFM)の3つの重要なモジュールを統合する。
論文 参考訳(メタデータ) (2026-02-15T17:29:37Z) - DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation [47.409626500688866]
本稿では,DINO Spherical Autoencoder(DINO-SAE)について述べる。
提案手法は, 既修のVFMと強いセマンティックアライメントを維持しつつ, 0.37 rFID と 26.2 dB PSNR に到達し, 最先端の再現性を実現する。
論文 参考訳(メタデータ) (2026-01-30T12:25:34Z) - Decoder-Free Supervoxel GNN for Accurate Brain-Tumor Localization in Multi-Modal MRI [1.209913077217557]
SVGFormerはデコーダフリーのパイプラインで、ボリュームをスーパーボクセルのセマンティックグラフに分割する。
その階層エンコーダは、パッチレベルのトランスフォーマーとスーパーボクセルレベルのグラフアテンションネットワークを組み合わせることで、リッチなノード表現を学習する。
以上の結果から,グラフベースのエンコーダのみのパラダイムが,3次元医用画像表現の正確かつ本質的に解釈可能な代替手段であることが明らかとなった。
論文 参考訳(メタデータ) (2026-01-20T15:13:04Z) - Meta-cognitive Multi-scale Hierarchical Reasoning for Motor Imagery Decoding [43.32839547082765]
本研究では,4クラス脳波(EEG)信号の階層的,メタ認知的デコードフレームワークについて検討する。
バックボーンの特徴を時間的マルチスケール表現に再構成するマルチスケール階層型信号処理モジュールを提案する。
我々は,このフレームワークを3つの標準脳波バックボーン上でインスタンス化し,BCIコンペティションIV-2aデータセットを用いて4クラスMIデコーディングを評価する。
論文 参考訳(メタデータ) (2025-11-11T06:32:23Z) - Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion [12.839049648094893]
冠動脈セグメンテーションは冠動脈疾患(CAD)のコンピュータ診断に重要である
並列符号化アーキテクチャを用いて,視覚基盤モデル(VFM)のパワーを利用する新しいフレームワークを提案する。
提案手法は, 精度の高い冠動脈セグメンテーションにおいて, 最先端の手法よりも優れ, 優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-07-17T09:25:00Z) - Topology-Constrained Learning for Efficient Laparoscopic Liver Landmark Detection [46.2391319253146]
肝のランドマークは腹腔鏡下肝手術中に外科医に重要な解剖学的ガイダンスを提供する。
TopoNetは腹腔鏡下肝ランドマーク検出のための新しいトポロジ制約学習フレームワークである。
我々のフレームワークは、スネーク・CNNデュアルパス・エンコーダを用いて、詳細なRGBテクスチャ情報と深さインフォームドトポロジ構造を同時に取得する。
論文 参考訳(メタデータ) (2025-07-01T07:35:36Z) - TransNuSeg: A Lightweight Multi-Task Transformer for Nuclei Segmentation [6.369485141013728]
我々は、TransNuSegと呼ばれる核セグメンテーションのための純粋なトランスフォーマーフレームワークの最初の試みを行う。
従来の研究で異なる枝から分岐予測を除去するために、枝間の一貫性を明示的に規定する新たな自己蒸留損失を導入する。
MoNuSegを含む2つのデータセットの実験により、我々の手法は、パラメータを30%減らして、最先端のDiceを2-3%向上させることができることが示された。
論文 参考訳(メタデータ) (2023-07-16T14:12:54Z) - From NeurODEs to AutoencODEs: a mean-field control framework for
width-varying Neural Networks [68.8204255655161]
本稿では,動的に駆動する制御フィールドをベースとした,AutoencODEと呼ばれる新しいタイプの連続時間制御システムを提案する。
損失関数が局所凸な領域では,多くのアーキテクチャが復元可能であることを示す。
論文 参考訳(メタデータ) (2023-07-05T13:26:17Z) - Omni-supervised Point Cloud Segmentation via Gradual Receptive Field
Component Reasoning [41.83979510282989]
提案した RFCR (Receptive Field Component Reasoning) を通したクラウドセグメンテーションに,最初のオムニスケール監視手法を導入する。
提案手法は,S3DIS と Semantic3D に対して新たな最先端性能を実現し,ScanNet ベンチマークの1位にランクインする。
論文 参考訳(メタデータ) (2021-05-21T08:32:02Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。