論文の概要: An Efficient Dual-Line Decoder Network with Multi-Scale Convolutional Attention for Multi-organ Segmentation
- arxiv url: http://arxiv.org/abs/2508.17007v1
- Date: Sat, 23 Aug 2025 12:34:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.295916
- Title: An Efficient Dual-Line Decoder Network with Multi-Scale Convolutional Attention for Multi-organ Segmentation
- Title(参考訳): マルチ組織分割のためのマルチスケール畳み込み型効率的なデュアルラインデコーダネットワーク
- Authors: Riad Hassan, M. Rubaiyat Hossain Mondal, Sheikh Iqbal Ahamed, Fahad Mostafa, Md Mostafijur Rahman,
- Abstract要約: 本稿では,効率的なデュアルラインデコーダセグメンテーションネットワーク(EDLDNet)を提案する。
提案手法は, モデルロバスト性向上のため, トレーニング時に構造的摂動を取り入れることを学ぶノイズデコーダを特徴とする。
両デコーダから複数スケールのセグメンテーションマスクを活用することにより,変異に基づく損失関数を用いてモデルの一般化を促進する。
- 参考スコア(独自算出の注目度): 5.6873464177873245
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Proper segmentation of organs-at-risk is important for radiation therapy, surgical planning, and diagnostic decision-making in medical image analysis. While deep learning-based segmentation architectures have made significant progress, they often fail to balance segmentation accuracy with computational efficiency. Most of the current state-of-the-art methods either prioritize performance at the cost of high computational complexity or compromise accuracy for efficiency. This paper addresses this gap by introducing an efficient dual-line decoder segmentation network (EDLDNet). The proposed method features a noisy decoder, which learns to incorporate structured perturbation at training time for better model robustness, yet at inference time only the noise-free decoder is executed, leading to lower computational cost. Multi-Scale convolutional Attention Modules (MSCAMs), Attention Gates (AGs), and Up-Convolution Blocks (UCBs) are further utilized to optimize feature representation and boost segmentation performance. By leveraging multi-scale segmentation masks from both decoders, we also utilize a mutation-based loss function to enhance the model's generalization. Our approach outperforms SOTA segmentation architectures on four publicly available medical imaging datasets. EDLDNet achieves SOTA performance with an 84.00% Dice score on the Synapse dataset, surpassing baseline model like UNet by 13.89% in Dice score while significantly reducing Multiply-Accumulate Operations (MACs) by 89.7%. Compared to recent approaches like EMCAD, our EDLDNet not only achieves higher Dice score but also maintains comparable computational efficiency. The outstanding performance across diverse datasets establishes EDLDNet's strong generalization, computational efficiency, and robustness. The source code, pre-processed data, and pre-trained weights will be available at https://github.com/riadhassan/EDLDNet .
- Abstract(参考訳): ガン・アット・リスクの適切なセグメンテーションは、放射線治療、外科的計画、医療画像解析における診断決定において重要である。
ディープラーニングベースのセグメンテーションアーキテクチャは大きな進歩を遂げているが、セグメンテーションの精度と計算効率のバランスが取れないことが多い。
現在の最先端の手法のほとんどは、高い計算複雑性を犠牲にして性能を優先するか、効率を損なうかのどちらかである。
本稿では,効率的なデュアルラインデコーダセグメンテーションネットワーク(EDLDNet)を導入することで,このギャップに対処する。
提案手法は, モデルロバスト性を向上させるため, トレーニング時に構造的摂動を組み込むことを学習する雑音デコーダを特徴とするが, 推論時にのみノイズフリーデコーダが実行され, 計算コストが低下する。
マルチスケール・コンボリューショナル・アテンション・モジュール(MSCAM)、アテンション・ゲート(AG)、アップ・コンボリューション・ブロック(UCB)は特徴表現の最適化やセグメンテーション性能の向上にさらに利用される。
両デコーダから複数スケールのセグメンテーションマスクを活用することにより,変異に基づく損失関数を用いてモデルの一般化を促進する。
本手法は,4つの医用画像データセット上でのSOTAセグメンテーションアーキテクチャより優れている。
EDLDNetは、Synapseデータセット上で84.00%のDiceスコアでSOTAのパフォーマンスを達成し、UNetのようなベースラインモデルの13.89%を上回り、MAC(Multiply-Accumulate Operations)を89.7%削減した。
EMCADのような最近のアプローチと比較して、EDLDNetはより高いDiceスコアを達成するだけでなく、同等の計算効率も維持しています。
多様なデータセットにわたる優れたパフォーマンスは、EDLDNetの強力な一般化、計算効率、堅牢性を確立する。
ソースコード、事前処理されたデータ、および事前訓練された重み付けはhttps://github.com/riadhassan/EDLDNet.orgで入手できる。
関連論文リスト
- MLRU++: Multiscale Lightweight Residual UNETR++ with Attention for Efficient 3D Medical Image Segmentation [3.014234061484863]
セグメント化精度と計算効率のバランスをとるために設計されたマルチスケール軽量Residual UNETR++アーキテクチャ。
4つの公開ベンチマークデータセットの実験は、MLRU++が最先端のパフォーマンスを達成することを示した。
MLRU++は, 3次元画像分割タスクに対して, 実用的で高性能なソリューションを提供する。
論文 参考訳(メタデータ) (2025-07-22T00:30:44Z) - Non-pooling Network for medical image segmentation [11.956054700035326]
本稿では,非プールネットワーク(NPNet)を提案する。
NPNetのセマンティックセマンティックセグメンテーションモデルを,w i t h多重状態(SOTA)モデルと比較した3つのベンチマークデータセットで評価した。
論文 参考訳(メタデータ) (2023-02-21T02:49:16Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - DANCE: DAta-Network Co-optimization for Efficient Segmentation Model Training and Inference [86.03382625531951]
DANCEは、効率的なセグメンテーションモデルのトレーニングと推論のための自動データネットワーク協調最適化である。
入力イメージを適応的にダウンサンプル/ドロップする自動データスライミングを統合し、画像の空間的複雑さによって導かれるトレーニング損失に対するそれに対応するコントリビューションを制御する。
実験と非難研究により、DANCEは効率的なセグメンテーションに向けて「オールウィン」を達成できることを示した。
論文 参考訳(メタデータ) (2021-07-16T04:58:58Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。