論文の概要: Sharpening Lightweight Models for Generalized Polyp Segmentation: A Boundary Guided Distillation from Foundation Models
- arxiv url: http://arxiv.org/abs/2604.17865v1
- Date: Mon, 20 Apr 2026 06:25:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.727553
- Title: Sharpening Lightweight Models for Generalized Polyp Segmentation: A Boundary Guided Distillation from Foundation Models
- Title(参考訳): 一般化したポリプセグメンテーションのための軽量化モデル:基礎モデルからの境界付き蒸留
- Authors: Shivanshu Agnihotri, Snehashis Majhi, Deepak Ranjan Nayak,
- Abstract要約: ポリープセグメンテーションは早期大腸癌の検出とその予防に重要であるが、境界が弱いこと、外観の変化が大きく、注釈付きデータに制限があるため、依然として困難である。
複数のビジョンモデルからコンパクトなセグメンテーションバックボーンへ意味的および構造的事前を転送するフレームワークである LiteBounD を提案する。
LiteBounDは、最先端の手法と競合する大きなマージンとパフォーマンスで、軽量のベースラインを一貫して上回っている。
- 参考スコア(独自算出の注目度): 5.836991649815995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated polyp segmentation is critical for early colorectal cancer detection and its prevention, yet remains challenging due to weak boundaries, large appearance variations, and limited annotated data. Lightweight segmentation models such as U-Net, U-Net++, and PraNet offer practical efficiency for clinical deployment but struggle to capture the rich semantic and structural cues required for accurate delineation of complex polyp regions. In contrast, large Vision Foundation Models (VFMs), including SAM, OneFormer, Mask2Former, and DINOv2, exhibit strong generalization but transfer poorly to polyp segmentation due to domain mismatch, insufficient boundary sensitivity, and high computational cost. To bridge this gap, we propose \textit{\textbf{LiteBounD}, a \underline{Li}gh\underline{t}w\underline{e}ight \underline{Boun}dary-guided \underline{D}istillation} framework that transfers complementary semantic and structural priors from multiple VFMs into compact segmentation backbones. LiteBounD introduces (i) a dual-path distillation mechanism that disentangles semantic and boundary-aware representations, (ii) a frequency-aware alignment strategy that supervises low-frequency global semantics and high-frequency boundary details separately, and (iii) a boundary-aware decoder that fuses multi-scale encoder features with distilled semantically rich boundary information for precise segmentation. Extensive experiments on both seen (Kvasir-SEG, CVC-ClinicDB) and unseen (ColonDB, CVC-300, ETIS) datasets demonstrate that LiteBounD consistently outperforms its lightweight baselines by a significant margin and achieves performance competitive with state-of-the-art methods, while maintaining the efficiency required for real-time clinical use. Our code is available at https://github.com/lostinrepo/LiteBounD.
- Abstract(参考訳): 早期大腸癌の検出とその予防には, 自動ポリープセグメンテーションが重要であるが, 境界の弱さ, 外観のばらつき, 注釈付きデータに制限があるため, いまだに困難である。
U-Net、U-Net++、PraNetといった軽量セグメンテーションモデルは、臨床展開に実用的な効率を提供するが、複雑なポリプ領域の正確なデライン化に必要なリッチなセマンティクスと構造的手がかりを捉えるのに苦労している。
対照的に、SAM、OneFormer、Mask2Former、DINOv2を含む大きなVision Foundation Models (VFMs) は、強い一般化を示すが、ドメインミスマッチ、境界感度の不足、計算コストの高騰により、ポリプセグメンテーションに乏しい。
このギャップを埋めるために、複数のVFMから相補的セグメンテーションバックボーンに相補的セグメンテーションと構造的事前を転送する、 \textit{\textbf{LiteBounD}, a \underline{Li}gh\underline{t}w\underline{e}ight \underline{Boun}dary-guided \underline{D}istillation} フレームワークを提案する。
LiteBounDが紹介
(i)意味表現と境界認識表現を混同する二重経路蒸留機構
2低周波グローバルセマンティクスと高周波境界の詳細を別々に監督する周波アライメント戦略
三 マルチスケールエンコーダを融合した境界対応デコーダで、精密セグメンテーションのための意味豊かな境界情報を蒸留した。
Kvasir-SEG, CVC-ClinicDB) と Unseen (ColonDB, CVC-300, ETIS) の両方のデータセットに対する大規模な実験により、LiteBounD は、リアルタイム臨床使用に必要な効率を維持しつつ、最先端の手法と競合する性能を保ちながら、その軽量なベースラインを一貫して上回っていることが示されている。
私たちのコードはhttps://github.com/lostinrepo/LiteBounD.comで利用可能です。
関連論文リスト
- TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.09179939570486]
本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-24T12:06:26Z) - From SAM to DINOv2: Towards Distilling Foundation Models to Lightweight Baselines for Generalized Polyp Segmentation [9.452022523459886]
Polyp-DiFoMは、基礎モデルのリッチな表現を軽量なセグメンテーションベースラインに転送するフレームワークである。
ベースラインモデルと最先端モデルとを一貫して上回り、オーバーヘッドを約9倍削減した。
論文 参考訳(メタデータ) (2025-12-10T04:25:01Z) - MicroAUNet: Boundary-Enhanced Multi-scale Fusion with Knowledge Distillation for Colonoscopy Polyp Image Segmentation [8.682943624128214]
MicroAUNetは、奥行き分離可能な拡張畳み込みと、単一パス、パラメータ共有チャネル空間的アテンションブロックを組み合わせた軽量なアテンションベースセグメンテーションネットワークである。
ベンチマーク実験では、極めて低いモデル複雑さ下での最先端の精度が示され、MicroAUNetがリアルタイムな臨床ポリープセグメンテーションに適していることが示されている。
論文 参考訳(メタデータ) (2025-11-03T01:43:34Z) - AURASeg: Attention Guided Upsampling with Residual Boundary-Assistive Refinement for Drivable-Area Segmentation [0.5729426778193399]
セマンティックセグメンテーションのための残留境界支援リファインメント(AURASeg)を用いたアテンションガイドアップサンプリングを提案する。
提案手法は,<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>の2。
論文 参考訳(メタデータ) (2025-10-24T15:01:18Z) - Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion [12.839049648094893]
冠動脈セグメンテーションは冠動脈疾患(CAD)のコンピュータ診断に重要である
並列符号化アーキテクチャを用いて,視覚基盤モデル(VFM)のパワーを利用する新しいフレームワークを提案する。
提案手法は, 精度の高い冠動脈セグメンテーションにおいて, 最先端の手法よりも優れ, 優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-07-17T09:25:00Z) - Mamba Guided Boundary Prior Matters: A New Perspective for Generalized Polyp Segmentation [3.075778955462259]
大腸癌の早期発見と診断には大腸内視鏡像のポリープ分画が重要である。
本稿では,ロバストなポリープセグメンテーションのための画期的なアプローチであるSAM-MaGuPを提案する。
SAM(Segment Anything Model)に境界蒸留モジュールと1D-2Dマンバアダプタを組み込むことで、SAM-MaGuPは弱い境界問題の解決に優れる。
我々の重要な革新、マンバ誘導境界と1D-2Dマンバブロックは、フィールドに新しいベンチマークを設定し、ポリープセグメンテーションの境界を新しい高さに押し上げた。
論文 参考訳(メタデータ) (2025-07-02T09:16:58Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - BCS-Net: Boundary, Context and Semantic for Automatic COVID-19 Lung
Infection Segmentation from CT Images [83.82141604007899]
BCS-Netは、CT画像から自動的に新型コロナウイルスの肺感染症を分離するための新しいネットワークである。
BCS-Netはエンコーダ-デコーダアーキテクチャに従っており、多くの設計はデコーダのステージに焦点を当てている。
BCSRブロックでは、アテンション誘導グローバルコンテキスト(AGGC)モジュールがデコーダの最も価値のあるエンコーダ機能を学ぶように設計されている。
論文 参考訳(メタデータ) (2022-07-17T08:54:07Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。