論文の概要: Multi Kernel Positional Embedding ConvNeXt for Polyp Segmentation
- arxiv url: http://arxiv.org/abs/2301.06673v2
- Date: Thu, 15 Jun 2023 08:08:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 02:35:49.566622
- Title: Multi Kernel Positional Embedding ConvNeXt for Polyp Segmentation
- Title(参考訳): polypセグメンテーションのためのマルチカーネル位置埋め込みconvnext
- Authors: Trong-Hieu Nguyen Mau, Quoc-Huy Trinh, Nhat-Tan Bui, Minh-Triet Tran,
Hai-Dang Nguyen
- Abstract要約: 本稿では,ConvNeXtバックボーンとMulti Kernel Positional Embeddingブロックで構成される新しいフレームワークを提案する。
我々のモデルは,Kvasir-SEGデータセット上でのDice係数0.8818とIOUスコア0.8163を達成する。
- 参考スコア(独自算出の注目度): 7.31341312596412
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image segmentation is the technique that helps doctor view and has a
precise diagnosis, particularly in Colorectal Cancer. Specifically, with the
increase in cases, the diagnosis and identification need to be faster and more
accurate for many patients; in endoscopic images, the segmentation task has
been vital to helping the doctor identify the position of the polyps or the
ache in the system correctly. As a result, many efforts have been made to apply
deep learning to automate polyp segmentation, mostly to ameliorate the U-shape
structure. However, the simple skip connection scheme in UNet leads to
deficient context information and the semantic gap between feature maps from
the encoder and decoder. To deal with this problem, we propose a novel
framework composed of ConvNeXt backbone and Multi Kernel Positional Embedding
block. Thanks to the suggested module, our method can attain better accuracy
and generalization in the polyps segmentation task. Extensive experiments show
that our model achieves the Dice coefficient of 0.8818 and the IOU score of
0.8163 on the Kvasir-SEG dataset. Furthermore, on various datasets, we make
competitive achievement results with other previous state-of-the-art methods.
- Abstract(参考訳): 医用画像分割は、特に大腸癌において、医師の診察を助け、正確な診断を行う技術である。
特に、症例の増加に伴い、多くの患者にとって診断と診断はより迅速かつ正確に行う必要があり、内視鏡画像では、ポリープの位置やシステム内のアッシュを正確に識別するのを助けるために、セグメンテーションタスクが不可欠である。
その結果,ポリプセグメンテーションの自動化に深層学習を適用し,その多くがU字構造の改善に寄与した。
しかし、UNetの単純なスキップ接続方式は、エンコーダとデコーダの機能マップ間のセマンティックギャップやコンテキスト情報の不足につながる。
この問題に対処するために,ConvNeXtバックボーンとマルチカーネル位置埋め込みブロックからなる新しいフレームワークを提案する。
提案したモジュールにより,本手法はポリープ分割タスクにおいて,精度の向上と一般化を実現することができる。
Kvasir-SEG データセット上で,我々のモデルではDice 係数 0.8818 と IOU スコア 0.8163 が得られた。
さらに,様々なデータセットにおいて,従来の最先端手法と競合する結果を得る。
関連論文リスト
- Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - GCtx-UNet: Efficient Network for Medical Image Segmentation [0.2353157426758003]
GCtx-UNetは軽量なセグメンテーションアーキテクチャで、最先端のアプローチよりも正確さでグローバルおよびローカルの画像特徴をキャプチャできる。
GCtx-UNetは、Synapseの多臓器腹部CTデータセット、ACDCの心臓MRIデータセット、およびいくつかのポリープセグメンテーションデータセットで評価される。
論文 参考訳(メタデータ) (2024-06-09T19:17:14Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Automatic Polyp Segmentation via Multi-scale Subtraction Network [100.94922587360871]
臨床的には、正確なポリープセグメンテーションは大腸癌の早期発見に重要な情報を提供する。
既存のほとんどの手法はU字型構造に基づいており、デコーダで段階的に異なるレベルの特徴を融合させるために要素ワイド付加または結合を用いる。
大腸内視鏡画像からポリプを抽出するマルチスケールサブトラクションネットワーク(MSNet)を提案する。
論文 参考訳(メタデータ) (2021-08-11T07:54:07Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - PraNet: Parallel Reverse Attention Network for Polyp Segmentation [155.93344756264824]
大腸内視鏡画像の高精度なポリープ分割のための並列リバースアテンションネットワーク(PraNet)を提案する。
並列部分復号器(PPD)を用いて,まず高層層に特徴を集約する。
さらに,エリアとバウンダリの関連性を確立するために,リバースアテンション(RA)モジュールを用いて境界キューをマイニングする。
論文 参考訳(メタデータ) (2020-06-13T08:13:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。