論文の概要: MSCFNet: A Lightweight Network With Multi-Scale Context Fusion for
Real-Time Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2103.13044v1
- Date: Wed, 24 Mar 2021 08:28:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 13:59:15.557733
- Title: MSCFNet: A Lightweight Network With Multi-Scale Context Fusion for
Real-Time Semantic Segmentation
- Title(参考訳): MSCFNet: リアルタイムセマンティックセグメンテーションのためのマルチスケールコンテキストフュージョンを用いた軽量ネットワーク
- Authors: Guangwei Gao, Guoan Xu, Yi Yu, Jin Xie, Jian Yang, Dong Yue
- Abstract要約: マルチスケールコンテキスト融合スキーム(MSCFNet)を用いた新しい軽量ネットワークを考案する。
提案されたMSCFNetは1.15Mパラメータのみを含み、71.9%のMean IoUを実現し、1つのTitan XP GPU構成で50 FPS以上で実行できる。
- 参考スコア(独自算出の注目度): 27.232578592161673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, how to strike a good trade-off between accuracy and
inference speed has become the core issue for real-time semantic segmentation
applications, which plays a vital role in real-world scenarios such as
autonomous driving systems and drones. In this study, we devise a novel
lightweight network using a multi-scale context fusion (MSCFNet) scheme, which
explores an asymmetric encoder-decoder architecture to dispose this problem.
More specifically, the encoder adopts some developed efficient asymmetric
residual (EAR) modules, which are composed of factorization depth-wise
convolution and dilation convolution. Meanwhile, instead of complicated
computation, simple deconvolution is applied in the decoder to further reduce
the amount of parameters while still maintaining high segmentation accuracy.
Also, MSCFNet has branches with efficient attention modules from different
stages of the network to well capture multi-scale contextual information. Then
we combine them before the final classification to enhance the expression of
the features and improve the segmentation efficiency. Comprehensive experiments
on challenging datasets have demonstrated that the proposed MSCFNet, which
contains only 1.15M parameters, achieves 71.9\% Mean IoU on the Cityscapes
testing dataset and can run at over 50 FPS on a single Titan XP GPU
configuration.
- Abstract(参考訳): 近年,自律走行システムやドローンなどの現実のシナリオにおいて重要な役割を果たすリアルタイムセマンティックセグメンテーションアプリケーションにおいて,精度と推論速度の良好なトレードオフを実現する方法が課題となっている。
本研究では,非対称エンコーダ・デコーダアーキテクチャを探索し,マルチスケールコンテキスト融合(MSCFNet)方式を用いた新しい軽量ネットワークを提案する。
より具体的には、エンコーダは分解の深さ方向の畳み込みと拡張畳み込みからなる効率の良い非対称残差(ear)モジュールを採用する。
一方、複雑な計算の代わりにデコーダに単純なデコンボリューションを適用し、高いセグメンテーション精度を維持しながらパラメータの量をさらに削減する。
また、MSCFNetはネットワークの異なるステージからの効率的な注意モジュールを持つブランチを持ち、マルチスケールのコンテキスト情報をうまくキャプチャする。
そして、これらを最終分類の前に組み合わせて特徴の表現を高め、セグメンテーション効率を向上させる。
挑戦的なデータセットに関する総合的な実験によると、提案されているMSCFNetは、たった1.15Mパラメータしか含んでおらず、Cityscapesのテストデータセットで71.9\%のMean IoUを達成し、1つのTitan XP GPU構成で50FPS以上で実行できる。
関連論文リスト
- CSFNet: A Cosine Similarity Fusion Network for Real-Time RGB-X Semantic Segmentation of Driving Scenes [0.0]
マルチモーダルなセマンティックセグメンテーション手法は、高い計算複雑性と低い推論速度に悩まされる。
本稿では,リアルタイムRGB-XセマンティックセマンティックセグメンテーションモデルとしてCosine similarity Fusion Network (CSFNet)を提案する。
CSFNetは最先端の手法と競合する精度を持ち、速度に関しては最先端の手法である。
論文 参考訳(メタデータ) (2024-07-01T14:34:32Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - LENet: Lightweight And Efficient LiDAR Semantic Segmentation Using
Multi-Scale Convolution Attention [0.0]
本稿では,LDARに基づくセマンティックセマンティックセマンティクスのためのエンコーダデコーダ構造を持つLENetと呼ばれるプロジェクションベースのセマンティクスセマンティクスセマンティクスネットワークを提案する。
エンコーダは、特徴を捉えるために、様々な受信フィールドサイズを持つ新しいマルチスケール・コンボリューション・アテンション(MSCA)モジュールで構成されている。
提案手法は, 最先端のセマンティックセグメンテーション法と比較して, 軽量で, 効率的で, 堅牢であることを示す。
論文 参考訳(メタデータ) (2023-01-11T02:51:38Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Receptive Field-based Segmentation for Distributed CNN Inference
Acceleration in Collaborative Edge Computing [93.67044879636093]
協調エッジコンピューティングネットワークにおける分散畳み込みニューラルネットワーク(CNN)を用いた推論高速化について検討する。
我々は,CNNモデルを複数の畳み込み層に分割するために,融合層並列化を用いた新しい協調エッジコンピューティングを提案する。
論文 参考訳(メタデータ) (2022-07-22T18:38:11Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - EADNet: Efficient Asymmetric Dilated Network for Semantic Segmentation [8.449677920206817]
cityscapesデータセットにおける実験結果から,本提案手法は,軽量セマンティクスセグメンテーションネットワークにおいて,最小パラメータ数(わずか 0.35m)で67.1のセグメンテーションmiouを実現する。
論文 参考訳(メタデータ) (2021-03-16T08:46:57Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。