論文の概要: Learning with Geometric Priors in U-Net Variants for Polyp Segmentation
- arxiv url: http://arxiv.org/abs/2601.17331v1
- Date: Sat, 24 Jan 2026 06:27:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.597193
- Title: Learning with Geometric Priors in U-Net Variants for Polyp Segmentation
- Title(参考訳): ポリプセグメンテーションのためのU-Net変数の幾何学的事前学習
- Authors: Fabian Vazquez, Jose A. Nuñez, Diego Adame, Alissen Moreno, Augustin Zhan, Huimin Li, Jinghao Yang, Haoteng Tang, Bin Fu, Pengfei Gu,
- Abstract要約: 本稿では,ポリプセグメンテーションのためのU-Netアーキテクチャに明示的な幾何学的先行を注入する新しい幾何学的事前誘導モジュール(GPM)を提案する。
具体的には、シミュレーションしたColonDepthデータセット上にVisual Geometry Grounded Transformer(VGGT)を微調整し、内視鏡領域に合わせたポリプ画像の深さマップを推定する。
GPMはプラグイン・アンド・プレイであり、様々なU-Netにシームレスに統合できる。
- 参考スコア(独自算出の注目度): 11.412362266277675
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and robust polyp segmentation is essential for early colorectal cancer detection and for computer-aided diagnosis. While convolutional neural network-, Transformer-, and Mamba-based U-Net variants have achieved strong performance, they still struggle to capture geometric and structural cues, especially in low-contrast or cluttered colonoscopy scenes. To address this challenge, we propose a novel Geometric Prior-guided Module (GPM) that injects explicit geometric priors into U-Net-based architectures for polyp segmentation. Specifically, we fine-tune the Visual Geometry Grounded Transformer (VGGT) on a simulated ColonDepth dataset to estimate depth maps of polyp images tailored to the endoscopic domain. These depth maps are then processed by GPM to encode geometric priors into the encoder's feature maps, where they are further refined using spatial and channel attention mechanisms that emphasize both local spatial and global channel information. GPM is plug-and-play and can be seamlessly integrated into diverse U-Net variants. Extensive experiments on five public polyp segmentation datasets demonstrate consistent gains over three strong baselines. Code and the generated depth maps are available at: https://github.com/fvazqu/GPM-PolypSeg
- Abstract(参考訳): 早期大腸癌の検出およびコンピュータ支援診断には,高精度で堅牢なポリープセグメンテーションが不可欠である。
畳み込みニューラルネットワーク、Transformer-およびMambaベースのU-Netは高い性能を達成しているが、特に低コントラストまたは散在した大腸内視鏡シーンにおいて、幾何学的および構造的手がかりを捉えるのに苦戦している。
この課題に対処するために,ポリプセグメンテーションのためのU-Netアーキテクチャに明示的な幾何学的先行を注入する新しいGeometric Prior-Guided Module (GPM)を提案する。
具体的には、シミュレーションしたColonDepthデータセット上にVisual Geometry Grounded Transformer(VGGT)を微調整し、内視鏡領域に合わせたポリプ画像の深さマップを推定する。
これらの深度マップはGPMによって処理され、幾何学的先行情報をエンコーダの特徴マップにエンコードする。
GPMはプラグイン・アンド・プレイであり、様々なU-Netにシームレスに統合できる。
5つのパブリックなポリプセグメンテーションデータセットに対する大規模な実験は、3つの強いベースラインに対して一貫した利得を示している。
コードと生成された深度マップは、https://github.com/fvazqu/GPM-PolypSegで入手できる。
関連論文リスト
- MEGANet: Multi-Scale Edge-Guided Attention Network for Weak Boundary
Polyp Segmentation [11.190960453535542]
医療における効率的なポリープセグメンテーションは、早期に大腸癌を診断する上で重要な役割を担っている。
大腸内視鏡画像中のポリプセグメンテーションに適したマルチスケールエッジガイド注意ネットワーク(MEGANet)を提案する。
MEGANetはエンドツーエンドのフレームワークとして設計されており、エンコーダ、デコーダ、エッジガイドアテンションモジュール(EGA)という3つの主要なモジュールを含んでいる。
論文 参考訳(メタデータ) (2023-09-06T19:19:12Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Adaptive Context Selection for Polyp Segmentation [99.9959901908053]
本稿では,ローカルコンテキストアテンション(LCA)モジュール,グローバルコンテキストモジュール(GCM)モジュール,適応選択モジュール(ASM)モジュールで構成される適応コンテキスト選択に基づくエンコーダデコーダフレームワークを提案する。
LCAモジュールは、エンコーダ層からデコーダ層へローカルなコンテキスト機能を提供する。
GCMは、グローバルなコンテキストの特徴をさらに探求し、デコーダ層に送信することを目的としている。ASMは、チャンネルワイドアテンションを通じて、コンテキスト特徴の適応的選択と集約に使用される。
論文 参考訳(メタデータ) (2023-01-12T04:06:44Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - Automatic Polyp Segmentation via Multi-scale Subtraction Network [100.94922587360871]
臨床的には、正確なポリープセグメンテーションは大腸癌の早期発見に重要な情報を提供する。
既存のほとんどの手法はU字型構造に基づいており、デコーダで段階的に異なるレベルの特徴を融合させるために要素ワイド付加または結合を用いる。
大腸内視鏡画像からポリプを抽出するマルチスケールサブトラクションネットワーク(MSNet)を提案する。
論文 参考訳(メタデータ) (2021-08-11T07:54:07Z) - PraNet: Parallel Reverse Attention Network for Polyp Segmentation [155.93344756264824]
大腸内視鏡画像の高精度なポリープ分割のための並列リバースアテンションネットワーク(PraNet)を提案する。
並列部分復号器(PPD)を用いて,まず高層層に特徴を集約する。
さらに,エリアとバウンダリの関連性を確立するために,リバースアテンション(RA)モジュールを用いて境界キューをマイニングする。
論文 参考訳(メタデータ) (2020-06-13T08:13:43Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。