論文の概要: SALI: Short-term Alignment and Long-term Interaction Network for Colonoscopy Video Polyp Segmentation
- arxiv url: http://arxiv.org/abs/2406.13532v1
- Date: Wed, 19 Jun 2024 13:15:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 19:43:36.540698
- Title: SALI: Short-term Alignment and Long-term Interaction Network for Colonoscopy Video Polyp Segmentation
- Title(参考訳): SALI: 大腸内視鏡的ポリプセグメンテーションのための短期的アライメントと長期的インタラクションネットワーク
- Authors: Qiang Hu, Zhenyu Yi, Ying Zhou, Fang Peng, Mei Liu, Qiang Li, Zhiwei Wang,
- Abstract要約: 大腸内視鏡ビデオは直腸癌診断のためのポリープセグメンテーションにおいてより豊かな情報を提供する。
内視鏡の速い動きとクローズアップの観察により、現在の手法は大きな空間的不整合と連続的な低品質フレームに悩まされる。
短期アライメントモジュール(SAM)と長期インタラクションモジュール(LIM)のハイブリッドであるSALIネットワークを提案する。
- 参考スコア(独自算出の注目度): 22.3944058892309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Colonoscopy videos provide richer information in polyp segmentation for rectal cancer diagnosis. However, the endoscope's fast moving and close-up observing make the current methods suffer from large spatial incoherence and continuous low-quality frames, and thus yield limited segmentation accuracy. In this context, we focus on robust video polyp segmentation by enhancing the adjacent feature consistency and rebuilding the reliable polyp representation. To achieve this goal, we in this paper propose SALI network, a hybrid of Short-term Alignment Module (SAM) and Long-term Interaction Module (LIM). The SAM learns spatial-aligned features of adjacent frames via deformable convolution and further harmonizes them to capture more stable short-term polyp representation. In case of low-quality frames, the LIM stores the historical polyp representations as a long-term memory bank, and explores the retrospective relations to interactively rebuild more reliable polyp features for the current segmentation. Combing SAM and LIM, the SALI network of video segmentation shows a great robustness to the spatial variations and low-visual cues. Benchmark on the large-scale SUNSEG verifies the superiority of SALI over the current state-of-the-arts by improving Dice by 2.1%, 2.5%, 4.1% and 1.9%, for the four test sub-sets, respectively. Codes are at https://github.com/Scatteredrain/SALI.
- Abstract(参考訳): 大腸内視鏡ビデオは直腸癌診断のためのポリープセグメンテーションにおいてより豊かな情報を提供する。
しかし、内視鏡の高速移動とクローズアップ観測により、現在の手法は大きな空間的不整合と連続的な低品質フレームに悩まされ、分割精度が制限される。
この文脈では、隣接する特徴の一貫性を高め、信頼性の高いポリプ表現を再構築することにより、ロバストなビデオポリプセグメンテーションに焦点を当てる。
そこで本研究では,短期調整モジュール (SAM) と長期インタラクションモジュール (LIM) のハイブリッドであるSALIネットワークを提案する。
SAMは、変形可能な畳み込みによって隣接するフレームの空間的整列性を学び、さらに調和してより安定した短期ポリプ表現をキャプチャする。
低品質のフレームの場合、LIMは過去のポリプ表現を長期記憶バンクとして保存し、現在のセグメンテーションのためにより信頼性の高いポリプ機能をインタラクティブに再構築するためのレトロスペクティブ関係を探る。
SAMとLIMを組み合わせることで、ビデオセグメンテーションのSALIネットワークは、空間的変動と低視覚的手がかりに対して大きな堅牢性を示す。
大規模なSUNSEGのベンチマークでは、4つのテストサブセットに対して、Diceを2.1%、2.5%、4.1%、および1.9%改善することで、SALIが現在の最先端よりも優れていることが検証されている。
コードはhttps://github.com/Scatteredrain/SALIにある。
関連論文リスト
- ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Multi-scale Information Sharing and Selection Network with Boundary Attention for Polyp Segmentation [10.152504573356413]
本稿では,多目的セグメンテーションタスクのためのマルチスケール情報共有選択ネットワーク(MISNet)を提案する。
5つのpolypセグメンテーションデータセットの実験により、MISNetはセグメンテーション結果の精度と明確性を改善した。
論文 参考訳(メタデータ) (2024-05-18T02:48:39Z) - PolypNextLSTM: A lightweight and fast polyp video segmentation network
using ConvNext and ConvLSTM [40.01199300702993]
PolypNextLSTMは、UNetライクな構造で、ConvNext-Tinyをバックボーンとして、パラメータオーバーヘッドを減らすために、最後の2つのレイヤを戦略的に省略する。
我々の第一の斬新さはPolypNextLSTMであり、パラメータの最もリーンで最速のモデルとして際立っている。
論文 参考訳(メタデータ) (2024-02-18T13:24:48Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for
Semi-supervised Polyp Segmentation [52.06525450636897]
大腸癌の早期診断と治療において, 自動ポリープセグメンテーションが重要な役割を担っている。
既存の手法は、完全に教師されたトレーニングに大きく依存しており、大量のラベル付きデータと時間を要するピクセル単位のアノテーションを必要とする。
大腸内視鏡画像からの半教師付きポリープ(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learningフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - YONA: You Only Need One Adjacent Reference-frame for Accurate and Fast
Video Polyp Detection [80.68520401539979]
textbfYONA (textbfYou textbfOnly textbfNeed one textbfAdjacent Reference-frame)は、ビデオポリープ検出のための効率的なエンドツーエンドのトレーニングフレームワークである。
提案したYONAは,従来の最先端の競合他社よりも精度と速度の両面で優れています。
論文 参考訳(メタデータ) (2023-06-06T13:53:15Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Automatic Polyp Segmentation via Multi-scale Subtraction Network [100.94922587360871]
臨床的には、正確なポリープセグメンテーションは大腸癌の早期発見に重要な情報を提供する。
既存のほとんどの手法はU字型構造に基づいており、デコーダで段階的に異なるレベルの特徴を融合させるために要素ワイド付加または結合を用いる。
大腸内視鏡画像からポリプを抽出するマルチスケールサブトラクションネットワーク(MSNet)を提案する。
論文 参考訳(メタデータ) (2021-08-11T07:54:07Z) - PraNet: Parallel Reverse Attention Network for Polyp Segmentation [155.93344756264824]
大腸内視鏡画像の高精度なポリープ分割のための並列リバースアテンションネットワーク(PraNet)を提案する。
並列部分復号器(PPD)を用いて,まず高層層に特徴を集約する。
さらに,エリアとバウンダリの関連性を確立するために,リバースアテンション(RA)モジュールを用いて境界キューをマイニングする。
論文 参考訳(メタデータ) (2020-06-13T08:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。