論文の概要: MedNeXt: Transformer-driven Scaling of ConvNets for Medical Image
Segmentation
- arxiv url: http://arxiv.org/abs/2303.09975v2
- Date: Wed, 22 Mar 2023 11:14:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-23 22:13:33.101839
- Title: MedNeXt: Transformer-driven Scaling of ConvNets for Medical Image
Segmentation
- Title(参考訳): mednext: 医用画像セグメンテーションのためのconvnetのトランスフォーマー駆動スケーリング
- Authors: Saikat Roy, Gregor Koehler, Constantin Ulrich, Michael Baumgartner,
Jens Petersen, Fabian Isensee, Paul F. Jaeger, Klaus Maier-Hein
- Abstract要約: 本稿では,トランスフォーマーにインスパイアされた医用画像分割のための大規模カーネルセグメントネットワークであるMedNeXtを紹介する。
小さなカーネルネットワークをアップサンプリングすることでカーネルサイズを反復的に増加させる新しい手法により、限られた医療データの性能飽和を防止する。
これにより、CTとMRIの4つのタスクにおける最先端のパフォーマンスが向上する。
- 参考スコア(独自算出の注目度): 1.7828803695464128
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There has been exploding interest in embracing Transformer-based
architectures for medical image segmentation. However, the lack of large-scale
annotated medical datasets make achieving performances equivalent to those in
natural images challenging. Convolutional networks, in contrast, have higher
inductive biases and consequently, are easily trainable to high performance.
Recently, the ConvNeXt architecture attempted to modernize the standard ConvNet
by mirroring Transformer blocks. In this work, we improve upon this to design a
modernized and scalable convolutional architecture customized to challenges of
data-scarce medical settings. We introduce MedNeXt, a Transformer-inspired
large kernel segmentation network which introduces - 1) A fully ConvNeXt 3D
Encoder-Decoder Network for medical image segmentation, 2) Residual ConvNeXt up
and downsampling blocks to preserve semantic richness across scales, 3) A novel
technique to iteratively increase kernel sizes by upsampling small kernel
networks, to prevent performance saturation on limited medical data, 4)
Compound scaling at multiple levels (depth, width, kernel size) of MedNeXt.
This leads to state-of-the-art performance on 4 tasks on CT and MRI modalities
and varying dataset sizes, representing a modernized deep architecture for
medical image segmentation.
- Abstract(参考訳): 医療画像セグメンテーションのためにTransformerベースのアーキテクチャを採用することへの関心は爆発的に高まっている。
しかし、大規模な注釈付き医療データセットの欠如により、自然画像のそれと同等のパフォーマンスを達成することは困難である。
対照的に畳み込みネットワークは誘導バイアスが高く、その結果、高い性能で容易に訓練できる。
近年、convnextアーキテクチャはトランスフォーマーブロックをミラーリングすることで標準convnetの近代化を試みた。
そこで本研究では, 医療現場の課題に合わせてカスタマイズした, 現代的でスケーラブルな畳み込み型アーキテクチャの設計を改良した。
トランスフォーマーにインスパイアされた大規模カーネルセグメンテーションネットワークであるMedNeXtを導入し,1)医療画像セグメンテーションのための完全なConvNeXt 3Dエンコーダデコーダネットワークを導入する。
2) 規模にまたがる意味的豊かさを維持するため,残留ConvNeXtのアップアンドダウンサンプリングブロック。
3)小規模カーネルネットワークのアップサンプリングによるカーネルサイズを反復的に増加させ,限られた医療データの性能飽和を防止する新手法
4)MedNeXtの複数レベルの複合スケーリング(深さ,幅,カーネルサイズ)。
これにより、CTとMRIの4つのタスクにおける最先端のパフォーマンスと、さまざまなデータセットサイズが実現され、医療画像セグメンテーションのための近代化されたディープアーキテクチャが表される。
関連論文リスト
- LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation [2.0901574458380403]
医用画像分割のための軽量だが効率的な新しいモデル LiteNeXt を提案する。
LiteNeXtは、少量のパラメータ (0.71M) とギガ浮動小数点演算 (0.42) でスクラッチから訓練されている。
論文 参考訳(メタデータ) (2024-04-04T01:59:19Z) - CATS v2: Hybrid encoders for robust medical segmentation [12.194439938007672]
畳み込みニューラルネットワーク(CNN)は、医用画像分割タスクにおいて強力な性能を示した。
しかし、畳み込みカーネルの視野が限られているため、CNNがグローバル情報を完全に表現することは困難である。
ローカル情報とグローバル情報の両方を活用するハイブリッドエンコーダを用いたCATS v2を提案する。
論文 参考訳(メタデータ) (2023-08-11T20:21:54Z) - R2U++: A Multiscale Recurrent Residual U-Net with Dense Skip Connections
for Medical Image Segmentation [0.5735035463793008]
本稿では,新しいU-Netベースの医用画像セグメンテーションアーキテクチャR2U++を提案する。
提案したアーキテクチャでは, 単純な畳み込みバックボーンを, より深い再帰的な畳み込みブロックに置き換える。
エンコーダとデコーダのセマンティックギャップは、濃密なスキップ経路によって減少する。
論文 参考訳(メタデータ) (2022-06-03T19:42:44Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - UTNet: A Hybrid Transformer Architecture for Medical Image Segmentation [6.646135062704341]
トランスフォーマーアーキテクチャは多くの自然言語処理タスクで成功している。
医用画像セグメンテーションを強化するために,自己意識を畳み込みニューラルネットワークに統合する強力なハイブリッドトランスフォーマーアーキテクチャUTNetを提案する。
論文 参考訳(メタデータ) (2021-07-02T00:56:27Z) - Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation [63.46694853953092]
Swin-Unetは、医用画像セグメンテーション用のUnetライクなトランスフォーマーである。
トークン化されたイメージパッチは、TransformerベースのU字型デコーダデコーダアーキテクチャに供給される。
論文 参考訳(メタデータ) (2021-05-12T09:30:26Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。