論文の概要: SPEEDNet: Salient Pyramidal Enhancement Encoder-Decoder Network for
Colonoscopy Images
- arxiv url: http://arxiv.org/abs/2312.01128v1
- Date: Sat, 2 Dec 2023 13:03:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 19:08:29.495682
- Title: SPEEDNet: Salient Pyramidal Enhancement Encoder-Decoder Network for
Colonoscopy Images
- Title(参考訳): SPEEDNet:SPEEDNet : 内視鏡画像のためのピラミッドエンハンスメントエンコーダ・デコーダネットワーク
- Authors: Tushir Sahu, Vidhi Bhatt, Sai Chandra Teja R, Sparsh Mittal, Nagesh
Kumar S
- Abstract要約: 本稿では,大腸内視鏡画像中の病変を正確に分割する新しいアーキテクチャであるSPEEDNetを提案する。
DIPCブロックは、拡張された畳み込み層をピラミッド構造に結合し、特徴写像をコンパクトな空間に変換する。
EBHISegデータセットでは、SPEEDNetは以前の3つのネットワーク(UNet、FeedNet、AttesResDUNet)を上回っている。
- 参考スコア(独自算出の注目度): 2.825324306665133
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate identification and precise delineation of regions of significance,
such as tumors or lesions, is a pivotal goal in medical imaging analysis. This
paper proposes SPEEDNet, a novel architecture for precisely segmenting lesions
within colonoscopy images. SPEEDNet uses a novel block named
Dilated-Involutional Pyramidal Convolution Fusion (DIPC). A DIPC block combines
the dilated involution layers pairwise into a pyramidal structure to convert
the feature maps into a compact space. This lowers the total number of
parameters while improving the learning of representations across an optimal
receptive field, thereby reducing the blurring effect. On the EBHISeg dataset,
SPEEDNet outperforms three previous networks: UNet, FeedNet, and AttesResDUNet.
Specifically, SPEEDNet attains an average dice score of 0.952 and a recall of
0.971. Qualitative results and ablation studies provide additional insights
into the effectiveness of SPEEDNet. The model size of SPEEDNet is 9.81 MB,
significantly smaller than that of UNet (22.84 MB), FeedNet(185.58 MB), and
AttesResDUNet (140.09 MB).
- Abstract(参考訳): 腫瘍や病変などの重要な領域の正確な同定と正確な記述は、医用画像解析において重要な目標である。
本稿では,大腸内視鏡画像中の病変を正確に分割する新しいアーキテクチャであるSPEEDNetを提案する。
SPEEDNetはDilated-Involutional Pyramidal Convolution Fusion (DIPC)と呼ばれる新しいブロックを使用している。
DIPCブロックは、拡張された畳み込み層をピラミッド構造に結合し、特徴写像をコンパクトな空間に変換する。
これにより、最適受容場における表現の学習を改善しつつ、パラメータの総数を減少させ、ぼやけた効果を減少させる。
EBHISegデータセットでは、SPEEDNetは以前の3つのネットワーク(UNet、FeedNet、AttesResDUNet)を上回っている。
具体的には、SPEEDNetは平均ダイススコア0.952、リコール0.971に達する。
定性的な結果とアブレーション研究は、SPEEDNetの有効性に関するさらなる洞察を提供する。
SPEEDNet のモデルサイズは 9.81 MB であり、UNet (22.84 MB)、FeedNet(185.58 MB)、AttesResDUNet (140.09 MB) よりもかなり小さい。
関連論文リスト
- Improving Deep Attractor Network by BGRU and GMM for Speech Separation [0.0]
Deep Attractor Network (DANet) は、音声分離分野における最先端技術である。
本稿では,BLSTMの代わりに双方向ゲーテッドニューラルネットワーク(BGRU)を用いて,単純化された強力なDANetモデルを提案する。
論文 参考訳(メタデータ) (2023-08-07T06:26:53Z) - Free Bits: Latency Optimization of Mixed-Precision Quantized Neural
Networks on the Edge [17.277918711842457]
混合精度量子化は、モデルサイズ、レイテンシ、統計的精度の間のトレードオフを最適化する機会を提供する。
本稿では,与えられたネットワークに対する混合精度構成の探索空間をナビゲートするハイブリッド探索手法を提案する。
ハードウェアに依存しない差別化検索アルゴリズムと、特定のハードウェアターゲットに対して遅延最適化された混合精度構成を見つけるハードウェア対応最適化で構成されている。
論文 参考訳(メタデータ) (2023-07-06T09:57:48Z) - TransRUPNet for Improved Polyp Segmentation [1.2498887792836635]
本研究では,トランスフォーマーをベースとしたResidual Upsampling Network (TransRUPNet) を開発した。
画像サイズが256times256$の場合、提案手法は、毎秒47.07フレームの優れたリアルタイム動作速度を実現する。
論文 参考訳(メタデータ) (2023-06-03T19:06:06Z) - Recurrence With Correlation Network for Medical Image Registration [66.63200823918429]
本稿では,医療画像登録ネットワークであるRecurrence with correlation Network (RWCNet)について述べる。
これらの特徴により、2つの画像登録データセットにおける医用画像登録精度が向上することが実証された。
論文 参考訳(メタデータ) (2023-02-05T02:41:46Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - a novel attention-based network for fast salient object detection [14.246237737452105]
現在の有向物体検出ネットワークにおいて、最も一般的な方法はU字型構造を用いることである。
3つのコントリビューションを持つ新しい深層畳み込みネットワークアーキテクチャを提案する。
提案手法は, 精度を損なうことなく, 原サイズの1/3まで圧縮できることを示した。
論文 参考訳(メタデータ) (2021-12-20T12:30:20Z) - MCUNetV2: Memory-Efficient Patch-based Inference for Tiny Deep Learning [72.80896338009579]
メモリボトルネックは畳み込みニューラルネットワーク(CNN)の設計における不均衡なメモリ分布に起因する。
本稿では,ピークメモリを大幅に削減するパッチ・バイ・パッチ・推論スケジューリングを提案する。
ニューラルアーキテクチャサーチによるプロセスを自動化し、ニューラルアーキテクチャと推論スケジューリングを共同で最適化し、MCUNetV2に導いた。
論文 参考訳(メタデータ) (2021-10-28T17:58:45Z) - CFPNet-M: A Light-Weight Encoder-Decoder Based Network for Multimodal
Biomedical Image Real-Time Segmentation [0.0]
我々は,新しい軽量アーキテクチャ -- 医療用チャネルワイズ機能ピラミッドネットワークを開発した。
u-netの約2%のパラメータと8mbのメモリを持つ5つの医療データセットで同等のセグメンテーション結果を達成している。
論文 参考訳(メタデータ) (2021-05-10T02:29:11Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - OctSqueeze: Octree-Structured Entropy Model for LiDAR Compression [77.8842824702423]
本稿では,LiDAR点雲のメモリフットプリントを削減するための新しいディープ圧縮アルゴリズムを提案する。
本手法は,メモリフットプリントを低減するために,点間の間隔と構造的冗長性を利用する。
我々のアルゴリズムは、自動運転車などのアプリケーションにおいて、LiDARポイントのオンボードおよびオフボードストレージを減らすために使用できる。
論文 参考訳(メタデータ) (2020-05-14T17:48:49Z) - Toward fast and accurate human pose estimation via soft-gated skip
connections [97.06882200076096]
本稿では,高精度かつ高効率な人間のポーズ推定について述べる。
我々は、最先端技術よりも精度と効率を両立させる文脈において、この設計選択を再分析する。
本モデルでは,MPII と LSP のデータセットから最先端の結果が得られる。
論文 参考訳(メタデータ) (2020-02-25T18:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。