論文の概要: SPG-CDENet: Spatial Prior-Guided Cross Dual Encoder Network for Multi-Organ Segmentation
- arxiv url: http://arxiv.org/abs/2510.26390v1
- Date: Thu, 30 Oct 2025 11:33:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.783423
- Title: SPG-CDENet: Spatial Prior-Guided Cross Dual Encoder Network for Multi-Organ Segmentation
- Title(参考訳): SPG-CDENet:マルチオーガンセグメンテーションのための空間事前誘導クロスデュアルエンコーダネットワーク
- Authors: Xizhi Tian, Changjun Zhou, Yulin. Yang,
- Abstract要約: 本稿では,多臓器分割の精度を向上させるために,新しい2段階分割パラダイムを提案する。
SPG-CDENetは空間先行ネットワークとクロスデュアルエンコーダネットワークの2つのキーコンポーネントから構成される。
グローバルエンコーダは画像全体からグローバルセマンティック機能をキャプチャし、ローカルエンコーダは以前のネットワークの機能にフォーカスする。
- 参考スコア(独自算出の注目度): 5.970991208589063
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multi-organ segmentation is a critical task in computer-aided diagnosis. While recent deep learning methods have achieved remarkable success in image segmentation, huge variations in organ size and shape challenge their effectiveness in multi-organ segmentation. To address these challenges, we propose a Spatial Prior-Guided Cross Dual Encoder Network (SPG-CDENet), a novel two-stage segmentation paradigm designed to improve multi-organ segmentation accuracy. Our SPG-CDENet consists of two key components: a spatial prior network and a cross dual encoder network. The prior network generates coarse localization maps that delineate the approximate ROI, serving as spatial guidance for the dual encoder network. The cross dual encoder network comprises four essential components: a global encoder, a local encoder, a symmetric cross-attention module, and a flow-based decoder. The global encoder captures global semantic features from the entire image, while the local encoder focuses on features from the prior network. To enhance the interaction between the global and local encoders, a symmetric cross-attention module is proposed across all layers of the encoders to fuse and refine features. Furthermore, the flow-based decoder directly propagates high-level semantic features from the final encoder layer to all decoder layers, maximizing feature preservation and utilization. Extensive qualitative and quantitative experiments on two public datasets demonstrate the superior performance of SPG-CDENet compared to existing segmentation methods. Furthermore, ablation studies further validate the effectiveness of the proposed modules in improving segmentation accuracy.
- Abstract(参考訳): 多臓器分節化はコンピュータ支援診断において重要な課題である。
近年の深層学習法は画像分割において顕著な成功を遂げているが,臓器の大きさや形状の相違は多臓器分割におけるその効果に挑戦している。
これらの課題に対処するために,多臓器分割の精度を向上させるために設計された新しい2段階分割パラダイムであるSPG-CDENet(Spatial Prior-Guided Cross Dual Encoder Network)を提案する。
SPG-CDENetは空間先行ネットワークとクロスデュアルエンコーダネットワークの2つのキーコンポーネントから構成される。
先行ネットワークは、近似ROIを規定する粗い局所化マップを生成し、二重エンコーダネットワークの空間的ガイダンスとして機能する。
クロスデュアルエンコーダネットワークは、グローバルエンコーダ、ローカルエンコーダ、対称的クロスアテンションモジュール、フローベースデコーダの4つの必須成分を含む。
グローバルエンコーダは画像全体からグローバルセマンティック機能をキャプチャし、ローカルエンコーダは以前のネットワークの機能にフォーカスする。
グローバルエンコーダとローカルエンコーダの相互作用を強化するため,全層にわたって対称なクロスアテンションモジュールを提案し,特徴を融合・洗練する。
さらに、フローベースのデコーダは、最終エンコーダ層から全てのデコーダ層へ直接、高レベルのセマンティックな特徴を伝播し、特徴保存と利用を最大化する。
2つの公開データセットに対する大規模な定性的および定量的実験は、既存のセグメンテーション法と比較してSPG-CDENetの優れた性能を示す。
さらに, Ablation 実験により, セグメンテーション精度を向上させるために提案したモジュールの有効性がさらに検証された。
関連論文リスト
- Col-OLHTR: A Novel Framework for Multimodal Online Handwritten Text Recognition [82.88856416080331]
オンライン手書き文字認識(OLHTR)は様々な用途で注目されている。
現在のアプローチは通常、OLHTRをシーケンス認識タスクとして扱い、単一のトラジェクトリまたはイメージエンコーダまたはマルチストリームエンコーダを使用する。
単ストリーム推論プロセスを維持しながら、トレーニング中にマルチモーダルな特徴を学習するコラボレーティブ学習ベースのOLHTRフレームワークCol-OLHTRを提案する。
論文 参考訳(メタデータ) (2025-02-10T02:12:24Z) - Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文 参考訳(メタデータ) (2023-03-18T11:26:36Z) - Attention guided global enhancement and local refinement network for
semantic segmentation [5.881350024099048]
エンコーダ・デコーダアーキテクチャを用いて,軽量なセマンティックセマンティックセマンティクスネットワークを開発した。
高レベル特徴マップからグローバル情報を集約するグローバルエンハンスメント手法を提案する。
ローカルリファインメントモジュールは、デコーダ機能をセマンティックガイダンスとして利用することによって開発される。
この2つの手法はContext Fusion Blockに統合され、それに基づいてAttention Guided Global enhancement and Local refinement Network (AGLN) が精巧に設計されている。
論文 参考訳(メタデータ) (2022-04-09T02:32:24Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Dual Convolutional LSTM Network for Referring Image Segmentation [18.181286443737417]
イメージセグメンテーションは、コンピュータビジョンと自然言語理解の共通点における問題である。
本稿では,この問題を解決するために,二重畳み込みLSTM(ConvLSTM)ネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-30T20:40:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。