論文の概要: PP-LiteSeg: A Superior Real-Time Semantic Segmentation Model
- arxiv url: http://arxiv.org/abs/2204.02681v1
- Date: Wed, 6 Apr 2022 09:02:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-07 13:07:31.062311
- Title: PP-LiteSeg: A Superior Real-Time Semantic Segmentation Model
- Title(参考訳): PP-LiteSeg: リアルタイムセマンティックセマンティックセグメンテーションモデル
- Authors: Juncai Peng, Yi Liu, Shiyu Tang, Yuying Hao, Lutao Chu, Guowei Chen,
Zewu Wu, Zeyu Chen, Zhiliang Yu, Yuning Du, Qingqing Dang, Baohua Lai, Qiwen
Liu, Xiaoguang Hu, Dianhai Yu, Yanjun Ma
- Abstract要約: PP-LiteSegはリアルタイムセマンティックセグメンテーションタスクのための新しい軽量モデルである。
Cityscapesのテストセットでは、PP-LiteSegはNVIDIA GTX 1080Tiで72.0% mIoU/273.6 FPSと77.5% mIoU/102.6 FPSを達成した。
- 参考スコア(独自算出の注目度): 10.40626811401541
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world applications have high demands for semantic segmentation methods.
Although semantic segmentation has made remarkable leap-forwards with deep
learning, the performance of real-time methods is not satisfactory. In this
work, we propose PP-LiteSeg, a novel lightweight model for the real-time
semantic segmentation task. Specifically, we present a Flexible and Lightweight
Decoder (FLD) to reduce computation overhead of previous decoder. To strengthen
feature representations, we propose a Unified Attention Fusion Module (UAFM),
which takes advantage of spatial and channel attention to produce a weight and
then fuses the input features with the weight. Moreover, a Simple Pyramid
Pooling Module (SPPM) is proposed to aggregate global context with low
computation cost. Extensive evaluations demonstrate that PP-LiteSeg achieves a
superior trade-off between accuracy and speed compared to other methods. On the
Cityscapes test set, PP-LiteSeg achieves 72.0% mIoU/273.6 FPS and 77.5%
mIoU/102.6 FPS on NVIDIA GTX 1080Ti. Source code and models are available at
PaddleSeg: https://github.com/PaddlePaddle/PaddleSeg.
- Abstract(参考訳): 実世界のアプリケーションにはセマンティックセグメンテーション法に対する高い要求がある。
セマンティックセグメンテーションはディープラーニングによって飛躍的な進歩を遂げているが、リアルタイムメソッドのパフォーマンスは満足できない。
本研究では,リアルタイムセマンティックセグメンテーションタスクのための新しい軽量モデルPP-LiteSegを提案する。
具体的には,従来のデコーダの計算オーバーヘッドを低減するために,フレキシブル・軽量デコーダ(FLD)を提案する。
特徴表現を強化するために,空間的およびチャネル的注意を生かして重みを生成し,その重みで入力特徴を融合させる統一注意融合モジュール(UAFM)を提案する。
さらに、計算コストの低いグローバルコンテキストを集約するために、単純なピラミッドプールモジュール(SPPM)を提案する。
PP-LiteSegは,他の手法に比べて精度と速度のトレードオフが優れていることを示す。
Cityscapesのテストセットでは、PP-LiteSegはNVIDIA GTX 1080Tiで72.0% mIoU/273.6 FPSと77.5% mIoU/102.6 FPSを達成した。
ソースコードとモデルはPaddleSegで入手できる。
関連論文リスト
- PP-MobileSeg: Explore the Fast and Accurate Semantic Segmentation Model
on Mobile Devices [4.784867435788648]
PP-MobileSegは、モバイルデバイス上で最先端のパフォーマンスを実現するセマンティックセグメンテーションモデルである。
VIMは最終予測に存在するクラスのみを補間することで、モデルのレイテンシを低減する。
実験の結果,PP-MobileSegは他の手法に比べて精度,モデルサイズ,レイテンシのトレードオフが優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-11T11:43:10Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - SFNet: Faster and Accurate Semantic Segmentation via Semantic Flow [88.97790684009979]
性能を改善するための一般的な実践は、強力な意味表現を持つ高解像度の特徴写像を得ることである。
隣接レベルの特徴マップ間のテキストセマンティックフローを学習するためのフローアライメントモジュール(FAM)を提案する。
また,高分解能特徴写像と低分解能特徴写像を直接整列するGated Dual Flow Alignment Moduleを提案する。
論文 参考訳(メタデータ) (2022-07-10T08:25:47Z) - S$^2$-FPN: Scale-ware Strip Attention Guided Feature Pyramid Network for Real-time Semantic Segmentation [6.744210626403423]
本稿では,リアルタイム道路シーンセマンティックセグメンテーションにおける精度/速度のトレードオフを実現するための新しいモデルを提案する。
具体的には、スケール対応ストリップ注意誘導特徴ピラミッドネットワーク(S$2-FPN)という軽量モデルを提案する。
我々のネットワークは,アテンションピラミッドフュージョン(APF)モジュール,スケール対応ストリップアテンションモジュール(SSAM)モジュール,グローバルフィーチャーアップサンプル(GFU)モジュールの3つの主要モジュールで構成されている。
論文 参考訳(メタデータ) (2022-06-15T05:02:49Z) - Revisiting Multi-Scale Feature Fusion for Semantic Segmentation [90.32746095413447]
本稿では,高精度なセマンティックセグメンテーションには高い内部分解能もアトラス畳み込みも不要であることを示す。
我々は,内部分解能が高く,高コストなアトラス畳み込みをもたない,ESegと呼ばれる簡易なセグメンテーションモデルを開発した。
我々の単純な手法は、複数のデータセットにまたがる先行技術よりも高速で精度を向上できる。
論文 参考訳(メタデータ) (2022-03-23T19:14:11Z) - Layout-to-Image Translation with Double Pooling Generative Adversarial
Networks [76.83075646527521]
入力レイアウトからフォトリアリスティックでセマンティックに一貫性のある結果を生成するための新しいDouble Pooing GAN(DPGAN)を提案する。
また,角形プールモジュール (SPM) と矩形プールモジュール (RPM) からなる新しい二重プールモジュール (DPM) を提案する。
論文 参考訳(メタデータ) (2021-08-29T19:55:14Z) - Deep Dual-resolution Networks for Real-time and Accurate Semantic
Segmentation of Road Scenes [0.23090185577016442]
道路シーンのリアルタイムセマンティックセグメンテーションのための新しいディープデュアルリゾリューションネットワーク(DDRNets)を提案する。
提案手法は,Cityscapes と CamVid 両方のデータセットにおける精度と速度の新たなトレードオフを実現する。
論文 参考訳(メタデータ) (2021-01-15T12:56:18Z) - Real-time Semantic Segmentation via Spatial-detail Guided Context
Propagation [49.70144583431999]
本研究では,リアルタイムセマンティックセグメンテーションを実現するための空間詳細ガイド付きコンテキスト伝搬ネットワーク(SGCPNet)を提案する。
浅い層の空間的詳細を利用して低解像度のグローバルコンテキストの伝播を誘導し、失われた空間情報を効果的に再構成することができる。
69.5%のmIoUセグメンテーション精度を実現し、GeForce GTX 1080 Tiの768x1536イメージ上で178.5 FPSに達する。
論文 参考訳(メタデータ) (2020-05-22T07:07:26Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。