論文の概要: DepthPolyp: Pseudo-Depth Guided Lightweight Segmentation for Real-Time Colonoscopy
- arxiv url: http://arxiv.org/abs/2605.16519v1
- Date: Fri, 15 May 2026 18:14:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.59989
- Title: DepthPolyp: Pseudo-Depth Guided Lightweight Segmentation for Real-Time Colonoscopy
- Title(参考訳): DepthPolyp:Pseudo-Depth Guided Lightweight Segmentationのリアルタイム大腸内視鏡への応用
- Authors: Zhuoyu Wu, Wenhui Ou, Lexi Zhang, Pei-Sze Tan, Dongjun Wu, Junhe Zhao, Wenqi Fang, Raphaël C. -W. Phan,
- Abstract要約: 擬似深層誘導マルチタスク学習と効率的な特徴変調に基づく軽量で堅牢な多目的セグメンテーションフレームワークを提案する。
DepthPolypは、劣化したデータに基づいてトレーニングし、クリーンかつノイズの多いターゲットドメインの両方で評価すると、強力なクロスデータセットの一般化を実現する。
3.57Mパラメータと0.86 GMACしか持たず、提案手法は180FPS以上のモバイルデバイス上で動作し、リソース制約された臨床環境におけるリアルタイムなデプロイに適している。
- 参考スコア(独自算出の注目度): 6.950410307869166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate polyp segmentation in colonoscopy is essential for early colorectal cancer detection, yet real-world clinical environments pose persistent challenges such as motion blur, specular reflections, and illumination instability. Most existing methods are optimized on clean benchmark images and suffer noticeable performance degradation when deployed in authentic surgical scenarios. We propose DepthPolyp, a lightweight and robust segmentation framework based on pseudo-depth-guided multi-task learning and efficient feature modulation. The architecture combines hierarchical Ghost factorization for compact feature generation, Interleaved Shuffle Fusion for low-cost cross-scale interaction, and Dynamic Group Gating for adaptive group-wise feature weighting. Extensive experiments demonstrate that DepthPolyp achieves strong cross-dataset generalization when trained on degraded data and evaluated on both clean and noisy target domains, consistently outperforming lightweight baselines and remaining competitive with substantially larger models. In real surgical video evaluation on PolypGen, DepthPolyp achieves better segmentation performance than models up to $20\times$ larger while preserving real-time inference speed. With only 3.57M parameters and 0.86 GMACs, the proposed method runs at over 180 FPS on mobile devices, making it well suited for real-time deployment in resource-constrained clinical environments. Code and pretrained weights are available at: https://github.com/ReaganWu/DepthPolyp/
- Abstract(参考訳): 大腸内視鏡における正確なポリープセグメンテーションは早期大腸癌の検出に不可欠であるが、実際の臨床環境は、動きのぼやけ、分光反射、照明不安定のような永続的な課題を生じさせる。
既存のほとんどの手法は、クリーンなベンチマーク画像に最適化されており、本物の手術シナリオにデプロイした場合に顕著なパフォーマンス劣化を被る。
擬似深層誘導マルチタスク学習と効率的な特徴変調に基づく軽量で堅牢なセグメンテーションフレームワークDepthPolypを提案する。
このアーキテクチャは、コンパクトな特徴生成のための階層的なゴースト因数分解、低コストなクロススケールインタラクションのためのInterleaved Shuffle Fusion、適応的なグループワイド機能重み付けのためのDynamic Group Gatingを組み合わせている。
DepthPolypは、劣化したデータに基づいてトレーニングし、クリーンでノイズの多いターゲットドメインの両方で評価し、軽量なベースラインを一貫して上回り、より大規模なモデルとの競争力を維持することにより、強力なクロスデータセットの一般化を実現している。
PolypGenの実際の手術ビデオ評価では、DepthPolypは、リアルタイムの推論速度を保ちながら、20ドル以上のモデルよりもセグメンテーション性能が向上する。
3.57Mパラメータと0.86 GMACしか持たず、提案手法は180FPS以上のモバイルデバイス上で動作し、リソース制約された臨床環境におけるリアルタイムなデプロイに適している。
コードと事前訓練されたウェイトは、https://github.com/ReaganWu/DepthPolyp/で利用可能である。
関連論文リスト
- From SAM to DINOv2: Towards Distilling Foundation Models to Lightweight Baselines for Generalized Polyp Segmentation [9.452022523459886]
Polyp-DiFoMは、基礎モデルのリッチな表現を軽量なセグメンテーションベースラインに転送するフレームワークである。
ベースラインモデルと最先端モデルとを一貫して上回り、オーバーヘッドを約9倍削減した。
論文 参考訳(メタデータ) (2025-12-10T04:25:01Z) - CL-Polyp: A Contrastive Learning-Enhanced Network for Accurate Polyp Segmentation [2.000434989156371]
CL-Polypを提案する。
本手法は, コントラスト学習を用いて, エンコーダの識別的特徴抽出を強化する。
臨床ポリープセグメンテーションにおける最先端の手法を一貫して超越している。
論文 参考訳(メタデータ) (2025-07-09T13:07:45Z) - LGPS: A Lightweight GAN-Based Approach for Polyp Segmentation in Colonoscopy Images [40.19053450600923]
ポリプセグメンテーションのための軽量なGANベースのフレームワークであるLGPSを提案する。
1) 改良された残留ブロックで強化されたMobileNetV2バックボーンと、効率的な特徴抽出のためのSqueeze-and-Excitationモジュールである。
最大かつ挑戦的なPolypGenテストデータセットでは、LGPSはDiceの0.7299とIoUの0.7867を達成し、全てのSOTAワークを上回り、堅牢な一般化を実証した。
論文 参考訳(メタデータ) (2025-03-24T02:41:53Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Adaptation of Distinct Semantics for Uncertain Areas in Polyp Segmentation [11.646574658785362]
本研究は,ポリプ不確定領域に対する識別意味論の適応という新しいアーキテクチャを提示する。
ADSNetは、未分類の詳細を修正し、最終段階で消滅し、検出されない弱い特徴を回復する。
実験により,ポリプ画像分割作業における他の技術と比較して,セグメンテーション性能が向上することを示す。
論文 参考訳(メタデータ) (2024-05-13T07:41:28Z) - ECC-PolypDet: Enhanced CenterNet with Contrastive Learning for Automatic
Polyp Detection [88.4359020192429]
既存の手法では、計算コストのかかるコンテキストアグリゲーションが伴うか、ポリープの事前モデリングが欠如しているため、難解なケースでは性能が低下する。
本稿では,2段階のトレーニングとエンドツーエンド推論フレームワークである Enhanced CenterNet with Contrastive Learning (ECC-PolypDet) を提案する。
Box-assisted Contrastive Learning (BCL) は, クラス内差を最小限に抑え, 前庭ポリープと背景のクラス間差を最大化するため, 隠れポリープを捕捉する。
微調整段階におけるIoU誘導サンプル再重み付けの導入
論文 参考訳(メタデータ) (2024-01-10T07:03:41Z) - Recurrent Generic Contour-based Instance Segmentation with Progressive
Learning [111.31166268300817]
本稿では,一般的な輪郭型インスタンスセグメンテーションのための新しいディープネットワークアーキテクチャ,すなわちPolySnakeを提案する。
従来のSnakeアルゴリズムに動機付け,提案したPolySnakeはより優れた,堅牢なセグメンテーション性能を実現する。
論文 参考訳(メタデータ) (2023-01-21T05:34:29Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Adaptive Context Selection for Polyp Segmentation [99.9959901908053]
本稿では,ローカルコンテキストアテンション(LCA)モジュール,グローバルコンテキストモジュール(GCM)モジュール,適応選択モジュール(ASM)モジュールで構成される適応コンテキスト選択に基づくエンコーダデコーダフレームワークを提案する。
LCAモジュールは、エンコーダ層からデコーダ層へローカルなコンテキスト機能を提供する。
GCMは、グローバルなコンテキストの特徴をさらに探求し、デコーダ層に送信することを目的としている。ASMは、チャンネルワイドアテンションを通じて、コンテキスト特徴の適応的選択と集約に使用される。
論文 参考訳(メタデータ) (2023-01-12T04:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。