論文の概要: Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation
- arxiv url: http://arxiv.org/abs/2104.00850v1
- Date: Fri, 2 Apr 2021 02:07:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 21:43:55.804548
- Title: Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation
- Title(参考訳): ポリープセグメンテーションのための確率的アクティベーション選択に基づくディープアンサンブル
- Authors: Alessandra Lumini, Loris Nanni and Gianluca Maguolo
- Abstract要約: 本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
- 参考スコア(独自算出の注目度): 82.61182037130406
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation has a wide array of applications ranging from
medical-image analysis, scene understanding, autonomous driving and robotic
navigation. This work deals with medical image segmentation and in particular
with accurate polyp detection and segmentation during colonoscopy examinations.
Several convolutional neural network architectures have been proposed to
effectively deal with this task and with the problem of segmenting objects at
different scale input. The basic architecture in image segmentation consists of
an encoder and a decoder: the first uses convolutional filters to extract
features from the image, the second is responsible for generating the final
output. In this work, we compare some variant of the DeepLab architecture
obtained by varying the decoder backbone. We compare several decoder
architectures, including ResNet, Xception, EfficentNet, MobileNet and we
perturb their layers by substituting ReLU activation layers with other
functions. The resulting methods are used to create deep ensembles which are
shown to be very effective. Our experimental evaluations show that our best
ensemble produces good segmentation results by achieving high evaluation scores
with a dice coefficient of 0.884, and a mean Intersection over Union (mIoU) of
0.818 for the Kvasir-SEG dataset. To improve reproducibility and research
efficiency the MATLAB source code used for this research is available at
GitHub: https://github.com/LorisNanni.
- Abstract(参考訳): セマンティックセグメンテーションには、医療画像分析、シーン理解、自律運転、ロボットナビゲーションなど、幅広い応用がある。
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
いくつかの畳み込みニューラルネットワークアーキテクチャは、このタスクと異なるスケールの入力でオブジェクトを分割する問題に効果的に対処するために提案されている。
画像セグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されており、第1は畳み込みフィルタを使って画像から特徴を抽出し、第2は最終的な出力を生成する。
本稿では,デコーダのバックボーンの変更によって得られたDeepLabアーキテクチャのバリエーションを比較する。
我々はResNet、Xception、EfficentNet、MobileNetなどいくつかのデコーダアーキテクチャを比較し、ReLUアクティベーションレイヤを他の関数に置き換えることでそれらのレイヤを摂動させる。
結果として得られた手法は、非常に効果的であることが示される深いアンサンブルを作成するために使用される。
実験結果から, kvasir-segデータセットでは, dice係数0.884, 平均交点平均(miou)0.818で高い評価スコアを達成し, 最適なセグメンテーション結果が得られることがわかった。
再現性と研究効率を改善するために、この研究で使用されるMATLABソースコードはGitHubで入手できる。
関連論文リスト
- DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - U-Net v2: Rethinking the Skip Connections of U-Net for Medical Image Segmentation [14.450329809640422]
医用画像分割のための新しい堅牢で効率的なU-Net変種であるU-Net v2を紹介する。
セマンティックな情報を低レベルの機能に注入し、同時に細かな詳細で高レベルの機能を改善することを目的としている。
論文 参考訳(メタデータ) (2023-11-29T16:35:24Z) - Using DUCK-Net for Polyp Image Segmentation [0.0]
DUCK-Netは、少量の医療画像から効果的に学習し、一般化し、正確なセグメンテーションタスクを実行することができる。
大腸内視鏡画像におけるポリープセグメンテーションに特有な機能を示す。
論文 参考訳(メタデータ) (2023-11-03T20:58:44Z) - Multi Kernel Positional Embedding ConvNeXt for Polyp Segmentation [7.31341312596412]
本稿では,ConvNeXtバックボーンとMulti Kernel Positional Embeddingブロックで構成される新しいフレームワークを提案する。
我々のモデルは,Kvasir-SEGデータセット上でのDice係数0.8818とIOUスコア0.8163を達成する。
論文 参考訳(メタデータ) (2023-01-17T03:12:57Z) - R2U++: A Multiscale Recurrent Residual U-Net with Dense Skip Connections
for Medical Image Segmentation [0.5735035463793008]
本稿では,新しいU-Netベースの医用画像セグメンテーションアーキテクチャR2U++を提案する。
提案したアーキテクチャでは, 単純な畳み込みバックボーンを, より深い再帰的な畳み込みブロックに置き換える。
エンコーダとデコーダのセマンティックギャップは、濃密なスキップ経路によって減少する。
論文 参考訳(メタデータ) (2022-06-03T19:42:44Z) - Deep ensembles in bioimage segmentation [74.01883650587321]
本研究では,畳み込みニューラルネットワーク(CNN)のアンサンブルを提案する。
アンサンブル法では、多くの異なるモデルが訓練され、分類に使用され、アンサンブルは単一分類器の出力を集約する。
提案するアンサンブルは,DeepLabV3+とHarDNet環境を用いて,異なるバックボーンネットワークを組み合わせることで実現されている。
論文 参考訳(メタデータ) (2021-12-24T05:54:21Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - KiU-Net: Overcomplete Convolutional Architectures for Biomedical Image
and Volumetric Segmentation [71.79090083883403]
トラディショナル・エンコーダ・デコーダに基づく手法は, より小さな構造を検出でき, 境界領域を正確に分割できない。
本稿では,(1)入力の細部と正確なエッジを捉えることを学ぶ完全畳み込みネットワークKite-Netと,(2)高レベルの特徴を学習するU-Netの2つの枝を持つKiU-Netを提案する。
提案手法は,より少ないパラメータとより高速な収束の利点により,最近のすべての手法と比較して性能が向上する。
論文 参考訳(メタデータ) (2020-10-04T19:23:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。