論文の概要: PlutoNet: An Efficient Polyp Segmentation Network
- arxiv url: http://arxiv.org/abs/2204.03652v1
- Date: Wed, 6 Apr 2022 20:29:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 00:40:51.634555
- Title: PlutoNet: An Efficient Polyp Segmentation Network
- Title(参考訳): PlutoNet: 効率的なポリプセグメンテーションネットワーク
- Authors: Tugberk Erol and Duygu Sarikaya
- Abstract要約: 大腸のポリープは早期の介入で除去しなければ癌細胞に変化する。
ディープラーニングモデルは、専門家が気付かないポリプの数を最小限にするために使用される。
これらのモデルにはパラメータが多すぎるため、リアルタイムアプリケーションでは問題が発生する可能性がある。
我々は,2,626,337パラメータのみを必要とするPlutoNetと呼ばれる新しいセグメンテーションモデルを提案する。
- 参考スコア(独自算出の注目度): 0.40611352512781856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Polyps in the colon can turn into cancerous cells if not removed with early
intervention. Deep learning models are used to minimize the number of polyps
that goes unnoticed by the experts, and to accurately segment the detected
polyps during these interventions. Although these models perform well on these
tasks, they require too many parameters, which can pose a problem with
real-time applications. To address this problem, we propose a novel
segmentation model called PlutoNet which requires only 2,626,337 parameters
while outperforming state-of-the-art models on multiple medical image
segmentation tasks. We use EfficientNetB0 architecture as a backbone and
propose the novel modified partial decoder, which is a combination of partial
decoder and full scale connections, which further reduces the number of
parameters required, as well as captures semantic details. We use asymmetric
convolutions to handle varying polyp sizes. Finally, we weight each feature map
to improve segmentation by using a squeeze and excitation block. In addition to
polyp segmentation in colonoscopy, we tested our model on segmentation of
nuclei and surgical instruments to demonstrate its generalizability to
different medical image segmentation tasks. Our model outperformed the
state-of-the-art models with a Dice score of %92.3 in CVC-ClinicDB dataset and
%89.3 in EndoScene dataset, a Dice score of %91.93 on the 2018 Data Science
Bowl Challenge dataset, and a Dice score of %94.8 on Kvasir-Instrument dataset.
Our experiments and ablation studies show that our model is superior in terms
of accuracy, and it is able generalize well to multiple medical segmentation
tasks.
- Abstract(参考訳): 大腸のポリープは早期の介入で除去されないと癌細胞になることがある。
ディープラーニングモデルは、専門家が気づかないポリプの数を最小化し、検出されたポリプを正確に分割するために使用される。
これらのモデルはこれらのタスクでうまく機能するが、パラメータが多すぎるため、リアルタイムアプリケーションでは問題が発生する可能性がある。
そこで本研究では,複数の医用画像セグメンテーションタスクにおいて,最先端モデルを上回りながら,2,626,337個のパラメータしか必要としない,プルトネットと呼ばれる新しいセグメンテーションモデルを提案する。
我々は efficientnetb0 アーキテクチャをバックボーンとして使用し,部分デコーダとフルスケール接続を組み合わせた改良型部分デコーダを提案する。
様々なポリプサイズを扱うために非対称畳み込みを用いる。
最後に,各特徴マップを重み付けし,圧縮励磁ブロックを用いてセグメンテーションを改善する。
大腸内視鏡検査におけるポリープセグメンテーションに加えて, 手術器具と核のセグメンテーションに関する実験を行い, 医用画像セグメンテーションタスクの一般化を実証した。
我々のモデルは、CVC-ClinicDBデータセットのDiceスコアが92.3、EndoSceneデータセットの%89.3、2018 Data Science Bowl ChallengeデータセットのDiceスコアが91.93、Kvasir-InstrumentデータセットのDiceスコアが94.8、最先端モデルよりも優れていた。
実験およびアブレーション研究により,本モデルは精度に優れており,複数の医学的セグメンテーションタスクによく応用できることが示された。
関連論文リスト
- Pre-training Point Cloud Compact Model with Partial-aware Reconstruction [51.403810709250024]
本稿では, 部分認識型textbfReconstruction を用いた, Point-CPR という事前学習型クラウド圧縮モデルを提案する。
我々のモデルは様々なタスクにおいて強い性能を示し、特にパラメータの2%しか持たない主要なMPMベースモデルであるPointGPT-Bを上回っている。
論文 参考訳(メタデータ) (2024-07-12T15:18:14Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Variational Autoencoding of Dental Point Clouds [10.137124603866036]
本稿では,歯のメッシュと点雲の広範なコレクションであるFDI 16データセットを紹介する。
本稿では,変分FoldingNet(VF-Net)という,点群に対する完全確率的変分オートエンコーダを提案する。
論文 参考訳(メタデータ) (2023-07-20T14:18:44Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - Discrete Key-Value Bottleneck [95.61236311369821]
ディープニューラルネットワークは、データストリームがi.d.d.であり、ラベル付きデータが豊富である分類タスクでうまく機能する。
この課題に対処した強力なアプローチの1つは、手軽に利用可能なデータ量に対する大規模なエンコーダの事前トレーニングと、タスク固有のチューニングである。
しかし、新しいタスクを考えると、多くの重みを微調整する必要があるため、エンコーダの重みを更新することは困難であり、その結果、以前のタスクに関する情報を忘れてしまう。
この問題に対処するモデルアーキテクチャを提案し,個別かつ学習可能なキー値符号のペアを含む離散的ボトルネックの上に構築する。
論文 参考訳(メタデータ) (2022-07-22T17:52:30Z) - Multifidelity data fusion in convolutional encoder/decoder networks [0.0]
我々は、エンコーダ、デコーダ、スキップ接続から組み立てられた畳み込みニューラルネットワークの回帰精度を分析した。
少数の高忠実度データと多数の低忠実度データをトレーニングした際の精度を実証する。
論文 参考訳(メタデータ) (2022-05-10T21:51:22Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Attention W-Net: Improved Skip Connections for better Representations [5.027571997864707]
我々は網膜血管分割のための新しいU-NetアーキテクチャであるAttention W-Netを提案する。
我々はAUCとF1スコアの0.8407と0.9833を観測し、LadderNetのバックボーンを大きく改善した。
論文 参考訳(メタデータ) (2021-10-17T12:44:36Z) - CarNet: A Lightweight and Efficient Encoder-Decoder Architecture for
High-quality Road Crack Detection [21.468229247797627]
高速かつ高品質な亀裂検出のための軽量エンコーダデコーダアーキテクチャであるCarNetを提案する。
特に、理想的なエンコーダは、異なる段階における畳み込み層数に関するオリーブ型分布を示すべきである。
デコーダでは、クラック検出のためのリッチな階層的特徴を学習するために、軽量なアップサンプリング機能ピラミッドモジュールを導入する。
論文 参考訳(メタデータ) (2021-09-13T05:01:34Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。