論文の概要: D-Net: Dynamic Large Kernel with Dynamic Feature Fusion for Volumetric Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2403.10674v2
- Date: Thu, 17 Oct 2024 00:51:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:15:58.536543
- Title: D-Net: Dynamic Large Kernel with Dynamic Feature Fusion for Volumetric Medical Image Segmentation
- Title(参考訳): D-Net:ボリューム医用画像分割のための動的特徴融合機能付き動的大カーネル
- Authors: Jin Yang, Peijie Qiu, Yichi Zhang, Daniel S. Marcus, Aristeidis Sotiras,
- Abstract要約: 動的大カーネル(DLK)および動的特徴融合(DFF)モジュールを提案する。
D-Netは、マルチスケールの大規模な受容場を効果的に利用し、グローバルな文脈情報を適応的に活用することができる。
- 参考スコア(独自算出の注目度): 7.894630378784007
- License:
- Abstract: Hierarchical transformers have achieved significant success in medical image segmentation due to their large receptive field and capabilities of effectively leveraging global long-range contextual information. Convolutional neural networks (CNNs) can also deliver a large receptive field by using large kernels, enabling them to achieve competitive performance with fewer model parameters. However, CNNs incorporated with large convolutional kernels remain constrained in adaptively capturing multi-scale features from organs with large variations in shape and size due to the employment of fixed-sized kernels. Additionally, they are unable to utilize global contextual information efficiently. To address these limitations, we propose Dynamic Large Kernel (DLK) and Dynamic Feature Fusion (DFF) modules. The DLK module employs multiple large kernels with varying kernel sizes and dilation rates to capture multi-scale features. Subsequently, a dynamic selection mechanism is utilized to adaptively highlight the most important spatial features based on global information. Additionally, the DFF module is proposed to adaptively fuse multi-scale local feature maps based on their global information. We integrate DLK and DFF in a hierarchical transformer architecture to develop a novel architecture, termed D-Net. D-Net is able to effectively utilize a multi-scale large receptive field and adaptively harness global contextual information. Extensive experimental results demonstrate that D-Net outperforms other state-of-the-art models in the two volumetric segmentation tasks, including abdominal multi-organ segmentation and multi-modality brain tumor segmentation. Our code is available at https://github.com/sotiraslab/DLK.
- Abstract(参考訳): 階層型トランスフォーマーは、その大きな受容領域と、グローバルな長距離コンテキスト情報を効果的に活用する能力により、医用画像セグメンテーションにおいて大きな成功を収めている。
畳み込みニューラルネットワーク(CNN)は、大きなカーネルを使用することで、大きな受容野を提供できるため、モデルパラメータが少なくて競合的なパフォーマンスを実現することができる。
しかし、大きな畳み込みカーネルを組み込んだCNNは、固定サイズのカーネルの使用により、形状やサイズが大きく変化する臓器から、適応的にマルチスケールの特徴を捉えることに制約が残っている。
さらに,グローバルな文脈情報を効率的に利用することはできない。
これらの制約に対処するため,動的大カーネル (DLK) と動的特徴融合 (DFF) モジュールを提案する。
DLKモジュールは、カーネルサイズや拡張率の異なる複数の大きなカーネルを使用して、マルチスケールの機能をキャプチャする。
その後、動的選択機構を用いて、グローバル情報に基づいて、最も重要な空間特徴を適応的に強調する。
さらに、DFFモジュールは、そのグローバル情報に基づいて、多スケールの局所特徴写像を適応的に融合する。
我々は、DLKとDFFを階層型トランスフォーマーアーキテクチャに統合し、D-Netと呼ばれる新しいアーキテクチャを開発する。
D-Netは、マルチスケールの大規模な受容場を効果的に利用し、グローバルな文脈情報を適応的に活用することができる。
拡張実験の結果,D-Netは腹部多臓器分節と多モジュール脳腫瘍分節を含む2つの容積分節タスクにおいて,他の最先端モデルよりも優れていた。
私たちのコードはhttps://github.com/sotiraslab/DLK.comで公開されています。
関連論文リスト
- DMC-Net: Lightweight Dynamic Multi-Scale and Multi-Resolution Convolution Network for Pancreas Segmentation in CT Images [1.9422777572345737]
畳み込みニューラルネットワーク(CNN)は医用画像セグメンテーションにおいて極めて有効である。
CNNは、臓器の形状や大きさの大きなオブジェクト間変異をモデル化し、グローバルな長距離コンテキスト情報を利用する場合に限られる。
我々は,動的マルチソリューション・コンボリューション(DMRC)と動的マルチスケール・コンボリューション(DMSC)モジュールを開発した。
論文 参考訳(メタデータ) (2024-10-03T01:19:21Z) - Multiscale Encoder and Omni-Dimensional Dynamic Convolution Enrichment in nnU-Net for Brain Tumor Segmentation [9.39565041325745]
本研究では nnU-Net アーキテクチャを改良した新しいセグメンテーションアルゴリズムを提案する。
我々は、全次元動的畳み込み層を組み込むことにより従来の畳み込み層を強化し、特徴表現を改善した。
モデルの有効性はBraTS-2023チャレンジの多様なデータセットで実証される。
論文 参考訳(メタデータ) (2024-09-20T05:25:46Z) - A Multimodal Feature Distillation with CNN-Transformer Network for Brain Tumor Segmentation with Incomplete Modalities [15.841483814265592]
本稿では,CNN-Transformer Hybrid Network (MCTSeg) を用いたマルチモーダル特徴蒸留法を提案する。
CNN-Transformer ネットワークと Transformer の畳み込みブロックを併用して提案するモジュールの重要性について検討した。
論文 参考訳(メタデータ) (2024-04-22T09:33:44Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Adaptive Dynamic Filtering Network for Image Denoising [8.61083713580388]
画像デノーミングネットワークでは、機能スケーリングは受動的フィールドサイズを拡大し、計算コストを削減するために広く利用されている。
本稿では、動的畳み込みを用いて、高周波およびマルチスケール特徴の学習を改善することを提案する。
我々は提案するDCBとAMDNetというMDCBを併用した効率的なデノベーションネットワークを構築した。
論文 参考訳(メタデータ) (2022-11-22T06:54:27Z) - Learning from partially labeled data for multi-organ and tumor
segmentation [102.55303521877933]
本稿では,トランスフォーマーに基づく動的オンデマンドネットワーク(TransDoDNet)を提案する。
動的ヘッドにより、ネットワークは複数のセグメンテーションタスクを柔軟に達成することができる。
我々はMOTSと呼ばれる大規模にラベル付けされたMulti-Organ and tumorベンチマークを作成し、他の競合相手よりもTransDoDNetの方が優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-13T13:03:09Z) - Salient Object Detection via Dynamic Scale Routing [62.26677215668959]
本稿では,「動的」なスケールルーティング(新しいアイデアとして)について紹介する。
結果として、既存の機能のバックボーンに直接適合するジェネリックなプラグインが生まれます。
DPConvベースのエンコーダを最適に適合させるために,自己適応型双方向デコーダの設計を提案する。
論文 参考訳(メタデータ) (2022-10-25T08:01:27Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - DoDNet: Learning to segment multi-organ and tumors from multiple
partially labeled datasets [102.55303521877933]
本稿では,複数の臓器と腫瘍を部分的にラベル付けしたデータセット上に分割する動的オンデマンドネットワーク(DoDNet)を提案する。
DoDNetは共有エンコーダデコーダアーキテクチャ、タスク符号化モジュール、動的畳み込みフィルタを生成するコントローラ、そして単一だが動的セグメンテーションヘッドで構成されている。
論文 参考訳(メタデータ) (2020-11-20T04:56:39Z) - Omni-Scale CNNs: a simple and effective kernel size configuration for
time series classification [47.423272376757204]
時系列分類タスクにおける1次元畳み込みニューラルネットワーク(1D-CNN)において、受容場(RF)サイズは最も重要な要素の1つである。
1D-CNNのためのOmni-Scale Block (OS-block)を提案する。
実験の結果,OSブロックを持つモデルでは,探索された最適なRFサイズを持つモデルと同様の性能が得られることがわかった。
論文 参考訳(メタデータ) (2020-02-24T03:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。