論文の概要: Efficient Context-Aware Network for Abdominal Multi-organ Segmentation
- arxiv url: http://arxiv.org/abs/2109.10601v1
- Date: Wed, 22 Sep 2021 09:05:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 13:37:53.110956
- Title: Efficient Context-Aware Network for Abdominal Multi-organ Segmentation
- Title(参考訳): 腹部マルチオルガンセグメンテーションのための効率的なコンテキストアウェアネットワーク
- Authors: Fan Zhang, Yu Wang
- Abstract要約: 腹腔内多臓器分画を効果的かつ効果的に行うための網羅的粗粒化フレームワークを開発した。
デコーダモジュールでは、k*k*1のスライス内畳み込みと1*1*kのスライス間畳み込みによる異方性畳み込みが、負担を軽減するように設計されている。
コンテキストブロックに対して、異方性と長距離のコンテキスト情報をキャプチャするためのストリッププーリングモジュールを提案する。
- 参考スコア(独自算出の注目度): 8.92337236455273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The contextual information, presented in abdominal CT scan, is relative
consistent. In order to make full use of the overall 3D context, we develop a
whole-volumebased coarse-to-fine framework for efficient and effective
abdominal multi-organ segmentation. We propose a new efficientSegNet network,
which is composed of encoder, decoder and context block. For the decoder
module, anisotropic convolution with a k*k*1 intra-slice convolution and a
1*1*k inter-slice convolution, is designed to reduce the computation burden.
For the context block, we propose strip pooling module to capture anisotropic
and long-range contextual information, which exists in abdominal scene.
Quantitative evaluation on the FLARE2021 validation cases, this method achieves
the average dice similarity coefficient (DSC) of 0.895 and average normalized
surface distance (NSD) of 0.775. The average running time is 9.8 s per case in
inference phase, and maximum used GPU memory is 1017 MB.
- Abstract(参考訳): 腹部CT検査で示された文脈情報は比較的一致している。
3dコンテキスト全体を最大限に活用するため,腹腔内マルチオルガンセグメンテーションを効率的かつ効果的に行うための全ボリューム粗いto-fineフレームワークを開発した。
本稿では,エンコーダ,デコーダ,コンテキストブロックで構成される新しい効率的なSegNetネットワークを提案する。
デコーダモジュールでは、k*k*1のスライス内畳み込みと1*1*kのスライス間畳み込みによる異方性畳み込みが計算負担を軽減するように設計されている。
そこで本研究では,腹部シーンに存在する異方性と長距離のコンテキスト情報をキャプチャするためのストリッププーリングモジュールを提案する。
本手法は, FLARE2021検証事例の定量的評価を行い, 平均ダイス類似度係数(DSC)0.895, 平均正規化表面距離(NSD)0.775を達成する。
平均実行時間は推論フェーズあたり9.8 sであり、最大使用GPUメモリは1017 MBである。
関連論文リスト
- Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss [59.835032408496545]
本稿では, コントラスト損失計算を任意の小ブロックに分割するタイルベースの戦略を提案する。
分散システムの階層構造を活用するためのマルチレベルタイリング戦略も導入する。
SOTAメモリ効率のソリューションと比較すると、同等の速度を維持しながら、メモリの2桁の削減を実現している。
論文 参考訳(メタデータ) (2024-10-22T17:59:30Z) - EffiSegNet: Gastrointestinal Polyp Segmentation through a Pre-Trained EfficientNet-based Network with a Simplified Decoder [0.8892527836401773]
EffiSegNetは、トレーニング済みの畳み込みニューラルネットワーク(CNN)をバックボーンとして、トランスファーラーニングを活用する新しいセグメンテーションフレームワークである。
Kvasir-SEGデータセットを用いて消化管ポリープセグメンテーションタスクの評価を行い,その成果を得た。
論文 参考訳(メタデータ) (2024-07-23T08:54:55Z) - Towards Effective and Efficient Non-autoregressive Decoding Using Block-based Attention Mask [74.64216073678617]
AMDはアテンションマスクを用いて隠された出力ラベルの連続ブロック内で並列NAR推論を行う。
ビームサーチアルゴリズムは、CTC、ARデコーダ、AMD確率の動的融合を利用するように設計されている。
LibriSpeech-100hrコーパスの実験では、AMDモジュールを組み込んだトリパルタイトデコーダが最大1.73倍のデコード速度比を生み出すことを示唆している。
論文 参考訳(メタデータ) (2024-06-14T13:42:38Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - Scaling Up 3D Kernels with Bayesian Frequency Re-parameterization for
Medical Image Segmentation [25.62587471067468]
RepUX-Netは、単純な大きなカーネルブロック設計を持つ純粋なCNNアーキテクチャである。
人間の視覚系における空間周波数にインスパイアされ、カーネル収束を要素的設定に変化させるよう拡張する。
論文 参考訳(メタデータ) (2023-03-10T08:38:34Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - 3D Cross Pseudo Supervision (3D-CPS): A semi-supervised nnU-Net
architecture for abdominal organ segmentation [8.538887194517763]
そこで我々は,Cross Pseudo Supervision法によるnnU-Netに基づく半教師付きネットワークアーキテクチャである,新しい3Dクロス擬似スーパービジョン(3D-CPS)手法を提案する。
提案手法は,MICCAI FLARE2022 検証セット上で 0.881 の平均サイス類似度係数 (DSC) と 0.913 の平均正規化表面距離 (NSD) を達成する。
論文 参考訳(メタデータ) (2022-09-19T11:46:43Z) - Source-free unsupervised domain adaptation for cross-modality abdominal
multi-organ segmentation [10.151144203061778]
腹部多臓器セグメンテーションのための未ラベルMRデータセットに,ソースラベル付きCTデータセットから学習知識を転送することが望ましい。
そこで本研究では, ソースデータセットにアクセスすることなく, 効率的なソースレス非教師なし領域適応手法を提案する。
論文 参考訳(メタデータ) (2021-11-24T01:42:07Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - Temporal Attention-Augmented Graph Convolutional Network for Efficient
Skeleton-Based Human Action Recognition [97.14064057840089]
グラフネットワーク(GCN)はユークリッド以外のデータ構造をモデル化するのに非常に成功した。
ほとんどのGCNベースのアクション認識手法は、計算量の多いディープフィードフォワードネットワークを使用して、全てのスケルトンをアクションで処理する。
本稿では,骨格に基づく行動認識の効率を高めるための時間的アテンションモジュール(TAM)を提案する。
論文 参考訳(メタデータ) (2020-10-23T08:01:55Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。