論文の概要: EndoCaver: Handling Fog, Blur and Glare in Endoscopic Images via Joint Deblurring-Segmentation
- arxiv url: http://arxiv.org/abs/2601.22537v1
- Date: Fri, 30 Jan 2026 04:18:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.215356
- Title: EndoCaver: Handling Fog, Blur and Glare in Endoscopic Images via Joint Deblurring-Segmentation
- Title(参考訳): EndoCaver: 関節脱臭法による内視鏡像におけるFag, Blur, Glareの取り扱い
- Authors: Zhuoyu Wu, Wenhui Ou, Pei-Sze Tan, Jiayan Yang, Wenqi Fang, Zheng Wang, Raphaël C. -W. Phan,
- Abstract要約: EndoCaverは、一方向誘導デュアルデコーダアーキテクチャを備えた軽量トランスフォーマーである。
画像のデブロアやセグメンテーションのためのジョイントマルチタスク機能を実現する。
デバイス上の臨床展開に適している。
- 参考スコア(独自算出の注目度): 9.574713877383244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Endoscopic image analysis is vital for colorectal cancer screening, yet real-world conditions often suffer from lens fogging, motion blur, and specular highlights, which severely compromise automated polyp detection. We propose EndoCaver, a lightweight transformer with a unidirectional-guided dual-decoder architecture, enabling joint multi-task capability for image deblurring and segmentation while significantly reducing computational complexity and model parameters. Specifically, it integrates a Global Attention Module (GAM) for cross-scale aggregation, a Deblurring-Segmentation Aligner (DSA) to transfer restoration cues, and a cosine-based scheduler (LoCoS) for stable multi-task optimisation. Experiments on the Kvasir-SEG dataset show that EndoCaver achieves 0.922 Dice on clean data and 0.889 under severe image degradation, surpassing state-of-the-art methods while reducing model parameters by 90%. These results demonstrate its efficiency and robustness, making it well-suited for on-device clinical deployment. Code is available at https://github.com/ReaganWu/EndoCaver.
- Abstract(参考訳): 内視鏡画像解析は大腸癌検診に不可欠であるが、現実の状況では、しばしばレンズのぼやけ、動きのぼやけ、スペックルハイライトに悩まされ、自動ポリープ検出を著しく損なう。
本論文では,一方向誘導型デュアルデコーダアーキテクチャを備えた軽量トランスフォーマであるEndoCaverを提案する。
具体的には、クロススケールアグリゲーションのためのGlobal Attention Module(GAM)、復元キューを転送するためのDeblurring-Segmentation Aligner(DSA)、安定したマルチタスク最適化のためのコサインベースのスケジューラ(LoCoS)を統合する。
Kvasir-SEGデータセットの実験により、EdoCaverはクリーンデータに対して0.922Dice、画像劣化時に0.889Diceを達成し、最先端の手法を超越し、モデルパラメータを90%削減した。
これらの結果は、その効率性と堅牢性を示し、デバイス上の臨床展開に適している。
コードはhttps://github.com/ReaganWu/EndoCaver.comで入手できる。
関連論文リスト
- Cancer-Net PCa-MultiSeg: Multimodal Enhancement of Prostate Cancer Lesion Segmentation Using Synthetic Correlated Diffusion Imaging [55.62977326180104]
前立腺癌病変の分節化に対する近年の深層学習アプローチは,限られた性能を達成している。
本稿では,標準拡散型プロトコルの拡張として,合成相関拡散イメージング(CDI$s$)について検討する。
以上の結果から,PCa病変セグメント化タスクの実践的ドロップイン強化として,CDI$s$に対する検証済み統合経路が確立された。
論文 参考訳(メタデータ) (2025-11-11T04:16:12Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - FusionLungNet: Multi-scale Fusion Convolution with Refinement Network for Lung CT Image Segmentation [1.3124513975412255]
肺がんの早期発見は治療の成功率を高める。
新しい肺分画法は画像成分間の長距離関係の同定に困難に直面している。
本稿では,鍵成分を持つ多層構造を持つFusionLungNetネットワークを用いたハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2024-10-21T09:27:51Z) - Light-weight Retinal Layer Segmentation with Global Reasoning [14.558920359236572]
OCT画像に適用可能な網膜層セグメンテーションのためのLightReSegを提案する。
提案手法は,現在の最先端技術であるTransUnetと比較して,セグメンテーション性能が向上する。
論文 参考訳(メタデータ) (2024-04-25T05:42:41Z) - CDSE-UNet: Enhancing COVID-19 CT Image Segmentation with Canny Edge
Detection and Dual-Path SENet Feature Fusion [10.831487161893305]
CDSE-UNetは、Canny演算子エッジ検出とデュアルパスSENet機能融合機構を統合した、新しいUNetベースのセグメンテーションモデルである。
我々は,UNetの標準畳み込みを代替するマルチスケール畳み込み手法を開発し,病変の大きさや形状に適応した。
公開データセットの評価では、他の主要なモデルよりもCDSE-UNetの方が優れた性能を示している。
論文 参考訳(メタデータ) (2024-03-03T13:36:07Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - An Attentive-based Generative Model for Medical Image Synthesis [18.94900480135376]
注意に基づく二重コントラスト生成モデルであるADC-cycleGANを提案する。
このモデルは、二重コントラスト損失項とCycleGAN損失を統合し、合成された画像がソース領域と区別可能であることを保証する。
実験により,提案したADCサイクルGANモデルが,他の最先端生成モデルに匹敵するサンプルを生成することが示された。
論文 参考訳(メタデータ) (2023-06-02T14:17:37Z) - Enhanced Sharp-GAN For Histopathology Image Synthesis [63.845552349914186]
病理組織像合成は、正確ながん検出のためのディープラーニングアプローチの訓練において、データ不足の問題に対処することを目的としている。
核トポロジと輪郭正則化を用いて合成画像の品質を向上させる新しい手法を提案する。
提案手法は、Sharp-GANを2つのデータセット上の4つの画像品質指標すべてで上回る。
論文 参考訳(メタデータ) (2023-01-24T17:54:01Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - D2A U-Net: Automatic Segmentation of COVID-19 Lesions from CT Slices
with Dilated Convolution and Dual Attention Mechanism [9.84838467721235]
拡張型コンボリューションと新しいデュアルアテンション機構に基づくCTスライスにおけるCOVID-19病変セグメンテーションのための拡張型デュアルアテンションU-Net(D2A U-Net)を提案する。
以上の結果から,拡張畳み込みと二重注意機構を導入することにより,偽陽性の数が大幅に減少することが示唆された。
論文 参考訳(メタデータ) (2021-02-10T01:21:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。