論文の概要: A New Multiple Max-pooling Integration Module and Cross Multiscale
Deconvolution Network Based on Image Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2003.11213v1
- Date: Wed, 25 Mar 2020 04:27:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 03:15:09.318416
- Title: A New Multiple Max-pooling Integration Module and Cross Multiscale
Deconvolution Network Based on Image Semantic Segmentation
- Title(参考訳): イメージセマンティクスセグメンテーションに基づく新しい多重maxプール統合モジュールとクロスマルチスケールデコンボリューションネットワーク
- Authors: Hongfeng You, Shengwei Tian, Long Yu, Xiang Ma, Yan Xing and Ning Xin
- Abstract要約: 本稿では,MC-Netと呼ばれる医用画像分割のための深部畳み込みネットワークモデルを提案する。
エンコーダのネットワーク構造では、従来の単一チャネルの畳み込みではなく、マルチスケールの畳み込みを用いる。
- 参考スコア(独自算出の注目度): 7.427799203626843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To better retain the deep features of an image and solve the sparsity problem
of the end-to-end segmentation model, we propose a new deep convolutional
network model for medical image pixel segmentation, called MC-Net. The core of
this network model consists of four parts, namely, an encoder network, a
multiple max-pooling integration module, a cross multiscale deconvolution
decoder network and a pixel-level classification layer. In the network
structure of the encoder, we use multiscale convolution instead of the
traditional single-channel convolution. The multiple max-pooling integration
module first integrates the output features of each submodule of the encoder
network and reduces the number of parameters by convolution using a kernel size
of 1. At the same time, each max-pooling layer (the pooling size of each layer
is different) is spliced after each convolution to achieve the translation
invariance of the feature maps of each submodule. We use the output feature
maps from the multiple max-pooling integration module as the input of the
decoder network; the multiscale convolution of each submodule in the decoder
network is cross-fused with the feature maps generated by the corresponding
multiscale convolution in the encoder network. Using the above feature map
processing methods solves the sparsity problem after the max-pooling
layer-generating matrix and enhances the robustness of the classification. We
compare our proposed model with the well-known Fully Convolutional Networks for
Semantic Segmentation (FCNs), DecovNet, PSPNet, U-net, SgeNet and other
state-of-the-art segmentation networks such as HyperDenseNet, MS-Dual,
Espnetv2, Denseaspp using one binary Kaggle 2018 data science bowl dataset and
two multiclass dataset and obtain encouraging experimental results.
- Abstract(参考訳): 画像の深い特徴を保持し、エンドツーエンドセグメンテーションモデルのスパーシティ問題を解決するため、医療用画像画素セグメンテーションのための新しい深層畳み込みネットワークモデルmc-netを提案する。
このネットワークモデルのコアは、エンコーダネットワーク、複数の最大プール統合モジュール、クロスマルチスケールデコンボリューションデコーダネットワーク、ピクセルレベルの分類層という4つの部分で構成されている。
エンコーダのネットワーク構造では、従来の単一チャネル畳み込みではなく、マルチスケール畳み込みを使用する。
多重maxプール統合モジュールは、まずエンコーダネットワークの各サブモジュールの出力機能を統合し、カーネルサイズ1.1の畳み込みによるパラメータ数を削減する。
同時に、各最大プーリング層(各層のプーリングサイズが異なる)は、各畳み込み後にスプライシングされ、各サブモジュールの特徴写像の変換不変性を達成する。
デコーダネットワークにおける各サブモジュールのマルチスケールの畳み込みは、エンコーダネットワークにおける対応するマルチスケールの畳み込みによって生成された特徴マップと相互に融合する。
上記の特徴写像処理手法を用いることで、最大プール層生成行列後の疎度問題を解消し、分類の堅牢性を高める。
提案モデルと,セマンティクスセグメンテーション (fcns), decovnet, pspnet, u-net, sgenet, およびhyperdensenet, ms-dual, espnetv2, denseasppなどの最先端セグメンテーションネットワークと, 1つのバイナリkaggle 2018 data science bowlデータセットと2つのマルチクラスデータセットを用いて比較し,実験結果を得た。
関連論文リスト
- Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors [4.95475852994362]
本稿では,バイナリ重み付きニューラルネットワークのサブビット圧縮を実現するために,ビット列を持つタイル型ニューラルネットワーク層に対する新しい量子化方式を提案する。
私たちは完全に接続された層と畳み込み層の両方にアプローチを採用しています。
論文 参考訳(メタデータ) (2024-07-16T15:55:38Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文 参考訳(メタデータ) (2023-03-18T11:26:36Z) - Deep Image Clustering with Contrastive Learning and Multi-scale Graph
Convolutional Networks [58.868899595936476]
コントラスト学習とマルチスケールグラフ畳み込みネットワーク(IcicleGCN)を用いた画像クラスタリング手法を提案する。
複数の画像データセットの実験は、最先端のIcicleGCNよりも優れたクラスタリング性能を示している。
論文 参考訳(メタデータ) (2022-07-14T19:16:56Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - Sharp U-Net: Depthwise Convolutional Network for Biomedical Image
Segmentation [1.1501261942096426]
U-Netはバイオメディカルイメージセグメンテーションに有効であることが証明されている。
我々は,シャープU-Netと呼ばれる,シンプルで効果的なエンコーダ・デコーダ完全畳み込み型ネットワークアーキテクチャを提案する。
実験の結果,提案したシャープU-Netモデルは,2進および多進のセグメンテーションタスクにおいて,最新の最先端ベースラインより一貫して優れているか,あるいは一致していることがわかった。
論文 参考訳(メタデータ) (2021-07-26T20:27:25Z) - FPS-Net: A Convolutional Fusion Network for Large-Scale LiDAR Point
Cloud Segmentation [30.736361776703568]
LiDARポイントクラウドに基づくシーン理解は、自動運転車が安全に運転するのに不可欠なタスクです。
既存のほとんどのメソッドは、情報容量を増やすために、画像チャネルとして異なるポイント属性/モダリティを積み重ねる。
fps-netは,最適なポイントクラウドセグメンテーションのために,投影画像チャネル間の一意性と不一致を生かす畳み込み型融合ネットワークである。
論文 参考訳(メタデータ) (2021-03-01T04:08:28Z) - MACU-Net for Semantic Segmentation of Fine-Resolution Remotely Sensed
Images [11.047174552053626]
MACU-Netは、マルチスケールのスキップ接続と非対称畳み込みベースのU-Netで、微細解像度のリモートセンシング画像を提供する。
本設計では,(1)低レベル・高レベルの特徴写像に含まれる意味的特徴と,(2)非対称な畳み込みブロックは,標準畳み込み層の特徴表現と特徴抽出能力を強化する。
2つのリモートセンシングデータセットで行った実験では、提案したMACU-NetがU-Net、U-NetPPL、U-Net 3+、その他のベンチマークアプローチを超越していることが示されている。
論文 参考訳(メタデータ) (2020-07-26T08:56:47Z) - Channel-Level Variable Quantization Network for Deep Image Compression [50.3174629451739]
チャネルレベルの可変量子化ネットワークを提案し、重要なチャネルに対してより多くの畳み込みを動的に割り当て、無視可能なチャネルに対して退避する。
提案手法は優れた性能を実現し,より優れた視覚的再構成を実現する。
論文 参考訳(メタデータ) (2020-07-15T07:20:39Z) - Encoder-Decoder Based Convolutional Neural Networks with
Multi-Scale-Aware Modules for Crowd Counting [6.893512627479196]
正確かつ効率的な群集カウントのための2つの修正ニューラルネットワークを提案する。
最初のモデルはM-SFANetと名付けられ、アラス空間ピラミッドプール(ASPP)とコンテキスト認識モジュール(CAN)が付属している。
第2のモデルはM-SegNetと呼ばれ、SFANetの双線形アップサンプリングをSegNetで使用される最大アンプールに置き換えることで生成される。
論文 参考訳(メタデータ) (2020-03-12T03:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。