論文の概要: UNeXt: MLP-based Rapid Medical Image Segmentation Network
- arxiv url: http://arxiv.org/abs/2203.04967v1
- Date: Wed, 9 Mar 2022 18:58:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 15:37:45.847407
- Title: UNeXt: MLP-based Rapid Medical Image Segmentation Network
- Title(参考訳): UNeXt:MLPベースのRapid Medical Image Segmentation Network
- Authors: Jeya Maria Jose Valanarasu and Vishal M. Patel
- Abstract要約: UNetとその最新の拡張であるTransUNetは、ここ数年で主要な医療画像分割手法である。
画像分割のための畳み込み多層パーセプトロンネットワークUNeXtを提案する。
パラメータ数を72倍に減らし,計算複雑性を68倍に減らし,推論速度を10倍に改善し,セグメンテーション性能も向上した。
- 参考スコア(独自算出の注目度): 80.16644725886968
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: UNet and its latest extensions like TransUNet have been the leading medical
image segmentation methods in recent years. However, these networks cannot be
effectively adopted for rapid image segmentation in point-of-care applications
as they are parameter-heavy, computationally complex and slow to use. To this
end, we propose UNeXt which is a Convolutional multilayer perceptron (MLP)
based network for image segmentation. We design UNeXt in an effective way with
an early convolutional stage and a MLP stage in the latent stage. We propose a
tokenized MLP block where we efficiently tokenize and project the convolutional
features and use MLPs to model the representation. To further boost the
performance, we propose shifting the channels of the inputs while feeding in to
MLPs so as to focus on learning local dependencies. Using tokenized MLPs in
latent space reduces the number of parameters and computational complexity
while being able to result in a better representation to help segmentation. The
network also consists of skip connections between various levels of encoder and
decoder. We test UNeXt on multiple medical image segmentation datasets and show
that we reduce the number of parameters by 72x, decrease the computational
complexity by 68x, and improve the inference speed by 10x while also obtaining
better segmentation performance over the state-of-the-art medical image
segmentation architectures. Code is available at
https://github.com/jeya-maria-jose/UNeXt-pytorch
- Abstract(参考訳): UNetとその最新の拡張であるTransUNetは、ここ数年で主要な医療画像分割手法である。
しかし、これらのネットワークはパラメータ重く計算が複雑で使用が遅いため、ポイントオブケアアプリケーションにおける高速画像分割には効果的に適用できない。
本研究では,画像分割のための畳み込み多層パーセプトロン(mlp)ベースのネットワークであるunextを提案する。
我々はUNeXtを初期畳み込みステージと後期段階のMLPステージで効果的に設計する。
我々は, 畳み込み特徴を効率的にトークン化し, 投影し, 表現をモデル化するトークン化MLPブロックを提案する。
性能をさらに向上するため,ローカル依存の学習に集中するために,入力のチャネルをMPPに切り替えることを提案する。
潜在空間でトークン化されたMLPを使用することで、パラメータの数と計算の複雑さを減らし、セグメンテーションに役立つより良い表現を得られる。
ネットワークは様々なレベルのエンコーダとデコーダの間のスキップ接続も構成している。
複数の医用画像セグメンテーションデータセット上でunextをテストした結果,パラメータ数を72倍削減し,計算複雑性を68倍削減し,推論速度を10倍向上するとともに,最先端の医用画像セグメンテーションアーキテクチャよりも優れたセグメンテーション性能を得ることができた。
コードはhttps://github.com/jeya-maria-jose/UNeXt-pytorchで入手できる。
関連論文リスト
- BiMLP: Compact Binary Architectures for Vision Multi-Layer Perceptrons [37.28828605119602]
本稿では,視覚多層パーセプトロン(MLP)のためのコンパクトバイナリアーキテクチャの設計問題について検討する。
従来のバイナライズ手法では,バイナリサンプリングの容量が限られていたため,性能が低かった。
本稿では,バイナリFC層の表現能力を高めることにより,バイナリミキシングとチャネルミキシング(BiMLP)モデルの性能を向上させることを提案する。
論文 参考訳(メタデータ) (2022-12-29T02:43:41Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Parameterization of Cross-Token Relations with Relative Positional
Encoding for Vision MLP [52.25478388220691]
視覚多層パーセプトロン(MLP)はコンピュータビジョンタスクにおいて有望な性能を示す。
トークンミキシングレイヤを使用して、トランスフォーマーが使用するマルチヘッド自己保持機構とは対照的に、クロストークンインタラクションをキャプチャする。
トークン混合のためのクロストークン関係を効率的に符号化する新しい位置空間ゲーティングユニット(PoSGU)を提案する。
論文 参考訳(メタデータ) (2022-07-15T04:18:06Z) - CenterCLIP: Token Clustering for Efficient Text-Video Retrieval [67.21528544724546]
CLIPでは、ビデオ内の連続するフレームの冗長性のために、離散的な視覚トークンシーケンスを生成する重要な視覚トークン化プロセスが、多くの均一なトークンを生成する。
これにより、計算コストが大幅に増加し、Webアプリケーションにおけるビデオ検索モデルの展開が妨げられる。
本稿では,最も代表的なトークンを抽出し,非意味トークンをドロップするマルチセグメントトークンクラスタリングアルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-05-02T12:02:09Z) - CoordX: Accelerating Implicit Neural Representation with a Split MLP
Architecture [2.6912336656165805]
多層パーセプトロン(MLP)を用いた暗黙の神経表現は、近年、様々なタスクで注目されている。
座標に基づく表現の推論と訓練を高速化する新しい分割アーキテクチャであるCoordXを提案する。
画像,映像,3次元形状表現および描画タスクのベースラインモデルと比較して,最大2.92倍のスピードアップを示す。
論文 参考訳(メタデータ) (2022-01-28T21:30:42Z) - RepMLPNet: Hierarchical Vision MLP with Re-parameterized Locality [113.1414517605892]
そこで本研究では,FC層に局所前処理を組み込む手法であるLocality Injectionを提案する。
RepMLPNetはCityscapesセマンティックセグメンテーションにシームレスに移行した最初の企業である。
論文 参考訳(メタデータ) (2021-12-21T10:28:17Z) - ConvMLP: Hierarchical Convolutional MLPs for Vision [7.874749885641495]
本稿では,視覚認識のための軽量でステージワイドな協調設計である階層型 ConMLP を提案する。
本研究では,ConvMLPをシームレスに転送し,少ないパラメータで競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2021-09-09T17:52:57Z) - Sparse-MLP: A Fully-MLP Architecture with Conditional Computation [7.901786481399378]
厳密な条件計算を伴うMoE(Mixture-of-Experts)は、注意に基づくモデルを、同等の計算コストでより多くのパラメータに拡張するための効果的なアーキテクチャであることが証明されている。
我々は、より効率的なアーキテクチャを実現するために、最近のMixerモデルをMoEで拡張するSparse-MLPを提案する。
論文 参考訳(メタデータ) (2021-09-05T06:43:08Z) - RepMLP: Re-parameterizing Convolutions into Fully-connected Layers for
Image Recognition [123.59890802196797]
画像認識のための多層パーセプトロン型ニューラルネットワーク構築ブロックであるRepMLPを提案する。
トレーニング中にRepMLP内に畳み込み層を構築し,それをFCにマージして推論を行う。
従来のCNNにRepMLPを挿入することで、ImageNetでは1.8%の精度、顔認識では2.9%、FLOPの低いCityscapeでは2.3%のmIoUを改善します。
論文 参考訳(メタデータ) (2021-05-05T06:17:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。