論文の概要: SACNet: A Spatially Adaptive Convolution Network for 2D Multi-organ Medical Segmentation
- arxiv url: http://arxiv.org/abs/2407.10157v1
- Date: Sun, 14 Jul 2024 10:58:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 19:19:02.344187
- Title: SACNet: A Spatially Adaptive Convolution Network for 2D Multi-organ Medical Segmentation
- Title(参考訳): SACNet: 2次元多臓器医療セグメントのための空間適応型畳み込みネットワーク
- Authors: Lin Zhang, Wenbo Gao, Jie Yi, Yunyun Yang,
- Abstract要約: 医用画像解析における多臓器分割は診断と治療計画に不可欠である。
本稿では、変形可能な畳み込みV3の知識を利用して、空間適応畳み込みネットワーク(SACNet)を最適化する。
ACDCとSynapseの3Dスライスデータセットの実験は、SACNetが既存のいくつかの手法と比較して優れたセグメンテーション性能を提供することを示した。
- 参考スコア(独自算出の注目度): 7.897088081928714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-organ segmentation in medical image analysis is crucial for diagnosis and treatment planning. However, many factors complicate the task, including variability in different target categories and interference from complex backgrounds. In this paper, we utilize the knowledge of Deformable Convolution V3 (DCNv3) and multi-object segmentation to optimize our Spatially Adaptive Convolution Network (SACNet) in three aspects: feature extraction, model architecture, and loss constraint, simultaneously enhancing the perception of different segmentation targets. Firstly, we propose the Adaptive Receptive Field Module (ARFM), which combines DCNv3 with a series of customized block-level and architecture-level designs similar to transformers. This module can capture the unique features of different organs by adaptively adjusting the receptive field according to various targets. Secondly, we utilize ARFM as building blocks to construct the encoder-decoder of SACNet and partially share parameters between the encoder and decoder, making the network wider rather than deeper. This design achieves a shared lightweight decoder and a more parameter-efficient and effective framework. Lastly, we propose a novel continuity dynamic adjustment loss function, based on t-vMF dice loss and cross-entropy loss, to better balance easy and complex classes in segmentation. Experiments on 3D slice datasets from ACDC and Synapse demonstrate that SACNet delivers superior segmentation performance in multi-organ segmentation tasks compared to several existing methods.
- Abstract(参考訳): 医用画像解析における多臓器分割は診断と治療計画に不可欠である。
しかし、様々なカテゴリーの変動や複雑な背景からの干渉など、多くの要因がタスクを複雑にしている。
本稿では,Deformable Convolution V3(DCNv3)とマルチオブジェクトセグメンテーションの知識を利用して,空間適応型畳み込みネットワーク(SACNet)を特徴抽出,モデルアーキテクチャ,損失制約の3つの側面で最適化し,異なるセグメンテーション対象の認識を同時に増強する。
まず、DCNv3とトランスフォーマーに似たブロックレベルおよびアーキテクチャレベルの一連の設計を組み合わせた適応受容フィールドモジュール(ARFM)を提案する。
このモジュールは、様々な目標に応じて受容野を適応的に調整することで、異なる臓器のユニークな特徴を捉えることができる。
第2に、ARFMをビルディングブロックとして利用し、SACNetのエンコーダデコーダを構築し、エンコーダとデコーダのパラメータを部分的に共有し、ネットワークをより深くする。
この設計は、共有軽量デコーダと、よりパラメータ効率が高く効果的なフレームワークを実現する。
最後に,t-vMFダイス損失とクロスエントロピー損失に基づく連続度動的調整損失関数を提案する。
ACDCとSynapseによる3Dスライスデータセットの実験により、SACNetは既存のいくつかの手法と比較して、複数組織セグメンテーションタスクにおいて優れたセグメンテーション性能を提供することを示した。
関連論文リスト
- Optimizing Medical Image Segmentation with Advanced Decoder Design [0.8402155549849591]
U-Netは、シンプルで柔軟なアーキテクチャ設計のため、医用画像のセグメンテーションで広く使われている。
提案するSwin DER(Swin UNETR Decoder Enhanced and Refined)は,これらの3つのコンポーネントの設計を最適化する。
我々のモデル設計は、SynapseとMSDの脳腫瘍セグメント化タスクの両方において、最先端の手法を超越して優れた結果が得られる。
論文 参考訳(メタデータ) (2024-10-05T11:47:13Z) - AFFSegNet: Adaptive Feature Fusion Segmentation Network for Microtumors and Multi-Organ Segmentation [32.74195208408193]
医用画像のセグメンテーションは、コンピュータビジョンにおいて重要な課題であり、診断、治療計画、疾患モニタリングにおける臨床医を支援する。
本稿では,局所的特徴とグローバルな特徴を効果的に統合し,正確な医用画像分割を実現するトランスフォーマアーキテクチャである適応意味ネットワーク(ASSNet)を提案する。
多臓器、肝腫瘍、膀胱腫瘍の分節を含む様々な医療画像の分節タスクに関するテストは、ATSNetが最先端の結果を達成することを実証している。
論文 参考訳(メタデータ) (2024-09-12T06:25:44Z) - MSA$^2$Net: Multi-scale Adaptive Attention-guided Network for Medical Image Segmentation [8.404273502720136]
MSA$2$Netは、スキップ接続を適切に設計した新しいディープセグメンテーションフレームワークである。
本稿では,空間的特徴を選択的に強調するために,MASAG(Multi-Scale Adaptive Space Attention Gate)を提案する。
MSA$2$Netは、最先端のSOTA(State-of-the-art)よりも優れています。
論文 参考訳(メタデータ) (2024-07-31T14:41:10Z) - Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文 参考訳(メタデータ) (2023-03-18T11:26:36Z) - Learning from partially labeled data for multi-organ and tumor
segmentation [102.55303521877933]
本稿では,トランスフォーマーに基づく動的オンデマンドネットワーク(TransDoDNet)を提案する。
動的ヘッドにより、ネットワークは複数のセグメンテーションタスクを柔軟に達成することができる。
我々はMOTSと呼ばれる大規模にラベル付けされたMulti-Organ and tumorベンチマークを作成し、他の競合相手よりもTransDoDNetの方が優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-13T13:03:09Z) - Multi-scale and Cross-scale Contrastive Learning for Semantic
Segmentation [5.281694565226513]
セグメンテーションネットワークによって抽出されたマルチスケール特徴の識別能力を高めるために,コントラスト学習を適用した。
まず、エンコーダのマルチスケール表現を共通の特徴空間にマッピングすることにより、教師付き局所言語制約の新しい形式をインスタンス化する。
論文 参考訳(メタデータ) (2022-03-25T01:24:24Z) - A Unified Transformer Framework for Group-based Segmentation:
Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection [59.21990697929617]
人間は、ダイナミックな世界に住んでいるので、画像のグループやビデオのフレームから学ぶことによってオブジェクトをマイニングする傾向があります。
従来のアプローチでは、類似したタスクで異なるネットワークを個別に設計するが、互いに適用するのは困難である。
UFO(UnifiedObject Framework for Co-Object Framework)という,これらの問題に対処するための統一フレームワークを導入する。
論文 参考訳(メタデータ) (2022-03-09T13:35:19Z) - Conquering Data Variations in Resolution: A Slice-Aware Multi-Branch
Decoder Network [28.946037652152395]
本研究は,スライス内分解能とスライス間分解能の比の幅広い変動を性能の重要な障害とみなす。
本研究では,各スライスに対して,平面内セマンティクスだけでなく,外面にもとづく特徴を抽出することを強調するスライス対応2.5Dネットワークを提案する。
論文 参考訳(メタデータ) (2022-03-07T14:31:26Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。