論文の概要: PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial
Decoder and Decoder Consistency Training
- arxiv url: http://arxiv.org/abs/2204.03652v4
- Date: Sat, 18 Mar 2023 16:25:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 04:44:41.265846
- Title: PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial
Decoder and Decoder Consistency Training
- Title(参考訳): PlutoNet: 修正部分デコーダとデコーダ一貫性トレーニングを備えた効率的なポリプセグメンテーションネットワーク
- Authors: Tugberk Erol and Duygu Sarikaya
- Abstract要約: PlutoNetは2,626,537のパラメータしか必要とせず、そのパラメータの10%以下である。
修正部分復号器と補助復号器を併用して訓練し、整合性を強化し、エンコーダ表現の改善に役立てる。
我々は、PlutoNetが最先端のモデルよりも優れていることを示すアブレーション研究と広範な実験を行った。
- 参考スコア(独自算出の注目度): 0.40611352512781856
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning models are used to minimize the number of polyps that goes
unnoticed by the experts and to accurately segment the detected polyps during
interventions. Although state-of-the-art models are proposed, it remains a
challenge to define representations that are able to generalize well and that
mediate between capturing low-level features and higher-level semantic details
without being redundant. Another challenge with these models is that they
require too many parameters, which can pose a problem with real-time
applications. To address these problems, we propose PlutoNet for polyp
segmentation which requires only 2,626,537 parameters, less than 10\% of the
parameters required by its counterparts. With PlutoNet, we propose a novel
\emph{decoder consistency training} approach that consists of a shared encoder,
the modified partial decoder which is a combination of the partial decoder and
full-scale connections that capture salient features at different scales
without being redundant, and the auxiliary decoder which focuses on
higher-level relevant semantic features. We train the modified partial decoder
and the auxiliary decoder with a combined loss to enforce consistency, which
helps improve the encoders representations. This way we are able to reduce
uncertainty and false positive rates. We perform ablation studies and extensive
experiments which show that PlutoNet performs significantly better than the
state-of-the-art models, particularly on unseen datasets and datasets across
different domains.
- Abstract(参考訳): ディープラーニングモデルは、専門家が気づかないポリプの数を最小化し、介入中に検出されたポリプを正確に分割するために使用される。
最先端のモデルが提案されているが、十分に一般化できる表現を定義し、低レベルの特徴と高レベルのセマンティックディテールを冗長に扱うことは依然として課題である。
これらのモデルのもうひとつの課題は、リアルタイムアプリケーションに問題を引き起こす可能性のあるパラメータが多すぎることだ。
これらの問題に対処するために,我々は2,626,537のパラメータしか必要としないポリプセグメンテーションのためのプルトネットを提案する。
plutonetでは,共有エンコーダと,部分デコーダと実規模接続を組み合わせた部分デコーダを組み合わせることで,冗長性を持たず,異なるスケールでサルエントな特徴をキャプチャし,高レベルな意味的特徴に着目した補助デコーダからなる,新たな \emph{decoder consistency training} アプローチを提案する。
修正部分復号器と補助復号器を併用して訓練し、整合性を強化し、エンコーダ表現の改善に役立てる。
こうして不確実性と偽陽性率を低減できるのです。
我々は,特に未発見のデータセットや異なる領域にまたがるデータセットにおいて,プルトネットが最先端モデルよりも著しく優れた性能を示すアブレーション研究や広範な実験を行う。
関連論文リスト
- Pre-training Point Cloud Compact Model with Partial-aware Reconstruction [51.403810709250024]
本稿では, 部分認識型textbfReconstruction を用いた, Point-CPR という事前学習型クラウド圧縮モデルを提案する。
我々のモデルは様々なタスクにおいて強い性能を示し、特にパラメータの2%しか持たない主要なMPMベースモデルであるPointGPT-Bを上回っている。
論文 参考訳(メタデータ) (2024-07-12T15:18:14Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Variational Autoencoding of Dental Point Clouds [10.137124603866036]
本稿では,歯のメッシュと点雲の広範なコレクションであるFDI 16データセットを紹介する。
本稿では,変分FoldingNet(VF-Net)という,点群に対する完全確率的変分オートエンコーダを提案する。
論文 参考訳(メタデータ) (2023-07-20T14:18:44Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - Discrete Key-Value Bottleneck [95.61236311369821]
ディープニューラルネットワークは、データストリームがi.d.d.であり、ラベル付きデータが豊富である分類タスクでうまく機能する。
この課題に対処した強力なアプローチの1つは、手軽に利用可能なデータ量に対する大規模なエンコーダの事前トレーニングと、タスク固有のチューニングである。
しかし、新しいタスクを考えると、多くの重みを微調整する必要があるため、エンコーダの重みを更新することは困難であり、その結果、以前のタスクに関する情報を忘れてしまう。
この問題に対処するモデルアーキテクチャを提案し,個別かつ学習可能なキー値符号のペアを含む離散的ボトルネックの上に構築する。
論文 参考訳(メタデータ) (2022-07-22T17:52:30Z) - Multifidelity data fusion in convolutional encoder/decoder networks [0.0]
我々は、エンコーダ、デコーダ、スキップ接続から組み立てられた畳み込みニューラルネットワークの回帰精度を分析した。
少数の高忠実度データと多数の低忠実度データをトレーニングした際の精度を実証する。
論文 参考訳(メタデータ) (2022-05-10T21:51:22Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Attention W-Net: Improved Skip Connections for better Representations [5.027571997864707]
我々は網膜血管分割のための新しいU-NetアーキテクチャであるAttention W-Netを提案する。
我々はAUCとF1スコアの0.8407と0.9833を観測し、LadderNetのバックボーンを大きく改善した。
論文 参考訳(メタデータ) (2021-10-17T12:44:36Z) - CarNet: A Lightweight and Efficient Encoder-Decoder Architecture for
High-quality Road Crack Detection [21.468229247797627]
高速かつ高品質な亀裂検出のための軽量エンコーダデコーダアーキテクチャであるCarNetを提案する。
特に、理想的なエンコーダは、異なる段階における畳み込み層数に関するオリーブ型分布を示すべきである。
デコーダでは、クラック検出のためのリッチな階層的特徴を学習するために、軽量なアップサンプリング機能ピラミッドモジュールを導入する。
論文 参考訳(メタデータ) (2021-09-13T05:01:34Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。