論文の概要: CovSegNet: A Multi Encoder-Decoder Architecture for Improved Lesion
Segmentation of COVID-19 Chest CT Scans
- arxiv url: http://arxiv.org/abs/2012.01473v1
- Date: Wed, 2 Dec 2020 19:26:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-30 03:14:17.844596
- Title: CovSegNet: A Multi Encoder-Decoder Architecture for Improved Lesion
Segmentation of COVID-19 Chest CT Scans
- Title(参考訳): covsegnet:covid-19胸部ctスキャンの病変分割を改善するマルチエンコーダ・デコーダアーキテクチャ
- Authors: Tanvir Mahmud, Md Awsafur Rahman, Shaikh Anowarul Fattah, Sun-Yuan
Kung
- Abstract要約: 高度に効率的なニューラルネットワークアーキテクチャ、すなわちCovSegNetを利用して、自動化されたCOVID-19病変のセグメンテーションスキームを提案する。
パフォーマンスは3つの公開データセットで達成されており、他の最先端のアプローチよりも大幅に向上している。
- 参考スコア(独自算出の注目度): 11.946078871080836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic lung lesions segmentation of chest CT scans is considered a pivotal
stage towards accurate diagnosis and severity measurement of COVID-19.
Traditional U-shaped encoder-decoder architecture and its variants suffer from
diminutions of contextual information in pooling/upsampling operations with
increased semantic gaps among encoded and decoded feature maps as well as
instigate vanishing gradient problems for its sequential gradient propagation
that result in sub-optimal performance. Moreover, operating with 3D CT-volume
poses further limitations due to the exponential increase of computational
complexity making the optimization difficult. In this paper, an automated
COVID-19 lesion segmentation scheme is proposed utilizing a highly efficient
neural network architecture, namely CovSegNet, to overcome these limitations.
Additionally, a two-phase training scheme is introduced where a deeper
2D-network is employed for generating ROI-enhanced CT-volume followed by a
shallower 3D-network for further enhancement with more contextual information
without increasing computational burden. Along with the traditional vertical
expansion of Unet, we have introduced horizontal expansion with multi-stage
encoder-decoder modules for achieving optimum performance. Additionally,
multi-scale feature maps are integrated into the scale transition process to
overcome the loss of contextual information. Moreover, a multi-scale fusion
module is introduced with a pyramid fusion scheme to reduce the semantic gaps
between subsequent encoder/decoder modules while facilitating the parallel
optimization for efficient gradient propagation. Outstanding performances have
been achieved in three publicly available datasets that largely outperform
other state-of-the-art approaches. The proposed scheme can be easily extended
for achieving optimum segmentation performances in a wide variety of
applications.
- Abstract(参考訳): 胸部ctスキャンによる肺病変の自動分割は、新型コロナウイルスの正確な診断と重症度測定のための重要な段階であると考えられている。
従来のu字型エンコーダ-デコーダアーキテクチャとその変種は、エンコードおよびデコードされた特徴マップ間の意味的ギャップが増大するプール/アップサンプリング操作における文脈情報の縮小に苦しむとともに、下位最適性能をもたらす逐次的な勾配伝播に関する勾配問題を解消する。
さらに, 3次元CTボリュームの操作は, 計算複雑性の指数的増大により, 最適化が困難になるため, さらなる制限が生じる。
本稿では,これらの制約を克服するために,高効率なニューラルネットワークアーキテクチャであるCovSegNetを用いて,自動新型コロナウイルス病変セグメンテーション手法を提案する。
さらに,より深い2dネットワークを用いてroiエンハンスctボリュームを生成し,さらに浅い3dネットワークを用いて計算負荷を増大させることなく,より文脈情報による強化を行う2相訓練方式を導入する。
Unetの従来の垂直展開とともに、最適性能を実現するために、多段エンコーダデコーダモジュールによる水平展開を導入しました。
さらに、コンテキスト情報の喪失を克服するため、マルチスケールの特徴マップをスケール遷移プロセスに統合する。
さらに, マルチスケール融合モジュールにピラミッド融合方式を導入し, その後のエンコーダ/デコーダモジュール間のセマンティックギャップを低減し, 効率的な勾配伝搬のための並列最適化を容易にする。
優れたパフォーマンスは、他の最先端のアプローチを大きく上回る3つの公開データセットで達成されている。
提案手法は,多様なアプリケーションにおいて最適セグメンテーション性能を実現するために容易に拡張できる。
関連論文リスト
- Enhancing Retinal Vascular Structure Segmentation in Images With a Novel
Design Two-Path Interactive Fusion Module Model [6.392575673488379]
網膜血管セグメンテーションの精度を高めるために設計されたSwin-Res-Netについて紹介する。
Swin-Res-Netは、パーティショニングに変位のあるシフトウィンドウを使用するSwin Transformerを使用している。
提案したアーキテクチャは,他の公開されたモデルに適合するか,あるいは超越するかという,優れた結果をもたらす。
論文 参考訳(メタデータ) (2024-03-03T01:36:11Z) - E2ENet: Dynamic Sparse Feature Fusion for Accurate and Efficient 3D
Medical Image Segmentation [36.367368163120794]
E2ENet(Efficient to Efficient Network)と呼ばれる3次元医用画像分割モデルを提案する。
パラメトリックと計算効率の2つの設計が組み込まれている。
さまざまなリソース制約に対して、正確性と効率性のトレードオフを一貫して達成します。
論文 参考訳(メタデータ) (2023-12-07T22:13:37Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Optimization-Inspired Cross-Attention Transformer for Compressive
Sensing [45.672646799969215]
高い解釈性と高い性能を有する深部展開ネットワーク(DUN)は、圧縮センシングにおいて注目を集めている。
既存のDUNは、多数のパラメーターの価格で視覚的品質を向上し、イテレーション中に特徴情報を失う問題を引き起こすことが多い。
画像CSのための軽量なOCTUF (OCT-based Unfolding Framework) を実現するため,OCTモジュールを反復処理として提案する。
論文 参考訳(メタデータ) (2023-04-27T07:21:30Z) - Denoising Diffusion Error Correction Codes [92.10654749898927]
近年、ニューラルデコーダは古典的デコーダ技術に対する優位性を実証している。
最近の最先端のニューラルデコーダは複雑で、多くのレガシデコーダの重要な反復的スキームが欠如している。
本稿では,任意のブロック長の線形符号のソフトデコードにデノナイズ拡散モデルを適用することを提案する。
論文 参考訳(メタデータ) (2022-09-16T11:00:50Z) - Memory-efficient Segmentation of High-resolution Volumetric MicroCT
Images [11.723370840090453]
本稿では,3次元高解像度画像分割のためのメモリ効率の高いネットワークアーキテクチャを提案する。
このネットワークは、2段階のU-netベースのカスケードフレームワークを通じて、グローバル機能とローカル機能の両方を組み込んでいる。
実験により, セグメント化精度とメモリ効率の両方の観点から, 最先端の3Dセグメンテーション法より優れていることが示された。
論文 参考訳(メタデータ) (2022-05-31T16:42:48Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - InversionNet3D: Efficient and Scalable Learning for 3D Full Waveform
Inversion [14.574636791985968]
本稿では,3次元FWIのための効率よくスケーラブルなエンコーダデコーダネットワークであるInversionNet3Dを提案する。
提案手法では,エンコーダ内のグループ畳み込みを用いて,複数のソースから情報を得るための効果的な階層を構築する。
3D Kimberlinaデータセットの実験は、InversionNet3Dがベースラインと比較して計算コストとメモリフットプリントを削減できることを示しています。
論文 参考訳(メタデータ) (2021-03-25T22:24:57Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。