論文の概要: Dense Dual-Path Network for Real-time Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2010.10778v1
- Date: Wed, 21 Oct 2020 06:11:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 00:16:42.551621
- Title: Dense Dual-Path Network for Real-time Semantic Segmentation
- Title(参考訳): リアルタイムセマンティクスセグメンテーションのための高密度デュアルパスネットワーク
- Authors: Xinneng Yang, Yan Wu, Junqiao Zhao, Feilin Liu
- Abstract要約: 本稿では,資源制約下でのリアルタイムセマンティックセグメンテーションのための新しいDual-Path Network(DDPNet)を提案する。
DDPNetは、GTX 1080Tiカードの1024 X 2048解像度の入力に対して52.6 FPSで75.3% mIoUを達成した。
- 参考スコア(独自算出の注目度): 7.8381744043673045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation has achieved remarkable results with high computational
cost and a large number of parameters. However, real-world applications require
efficient inference speed on embedded devices. Most previous works address the
challenge by reducing depth, width and layer capacity of network, which leads
to poor performance. In this paper, we introduce a novel Dense Dual-Path
Network (DDPNet) for real-time semantic segmentation under resource
constraints. We design a light-weight and powerful backbone with dense
connectivity to facilitate feature reuse throughout the whole network and the
proposed Dual-Path module (DPM) to sufficiently aggregate multi-scale contexts.
Meanwhile, a simple and effective framework is built with a skip architecture
utilizing the high-resolution feature maps to refine the segmentation output
and an upsampling module leveraging context information from the feature maps
to refine the heatmaps. The proposed DDPNet shows an obvious advantage in
balancing accuracy and speed. Specifically, on Cityscapes test dataset, DDPNet
achieves 75.3% mIoU with 52.6 FPS for an input of 1024 X 2048 resolution on a
single GTX 1080Ti card. Compared with other state-of-the-art methods, DDPNet
achieves a significant better accuracy with a comparable speed and fewer
parameters.
- Abstract(参考訳): セマンティックセグメンテーションは、高い計算コストと多数のパラメータで顕著な結果を得た。
しかし、実世界のアプリケーションは組み込みデバイス上で効率的な推論速度を必要とする。
以前のほとんどの作業では、ネットワークの深さ、幅、層容量を削減し、パフォーマンスを低下させるという課題に対処している。
本稿では,資源制約下でのリアルタイムセマンティックセグメンテーションのためのDense Dual-Path Network(DDPNet)を提案する。
ネットワーク全体の機能再利用を容易にするために,軽量で強力なバックボーンを設計し,マルチスケールコンテキストを十分に集約するために提案するデュアルパスモジュール(DPM)を提案する。
一方,高分解能な特徴マップを利用してセグメント化出力を洗練するためのスキップアーキテクチャと,特徴マップからコンテキスト情報を利用してヒートマップを洗練するためのアップサンプリングモジュールを備える。
提案するddpnetは,精度と速度のバランスにおいて明らかに有利である。
具体的には、Cityscapesのテストデータセットにおいて、DDPNetは1枚のGTX 1080Tiカード上で1024 X 2048解像度の入力に対して52.6 FPSで75.3% mIoUを達成した。
他の最先端の手法と比較すると、DDPNetは同等の速度と少ないパラメータで大幅に精度が向上する。
関連論文リスト
- Reparameterizable Dual-Resolution Network for Real-time Semantic Segmentation [15.83905822380148]
RDRNetは、リアルタイムセマンティックセグメンテーションに特化したDual-Resolution Networkである。
RDRNetは2分岐アーキテクチャを採用し、トレーニング中にマルチパスブロックを利用し、推論時にそれらをシングルパスブロックに再パラメータ化する。
Cityscapes、CamVid、Pascal VOC 2012データセットの実験結果は、RDRNetが既存の最先端モデルよりもパフォーマンスとスピードの両方で優れていることを示している。
論文 参考訳(メタデータ) (2024-06-18T10:59:10Z) - DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention [15.360769793764526]
本稿では,リアルタイム物体検出のための軽量アテンション方式を用いて,DPNetというデュアルパスネットワークを提案する。
DPNetは、検出精度と実装効率の間の最先端のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-09-28T09:11:01Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - SFNet: Faster and Accurate Semantic Segmentation via Semantic Flow [88.97790684009979]
性能を改善するための一般的な実践は、強力な意味表現を持つ高解像度の特徴写像を得ることである。
隣接レベルの特徴マップ間のテキストセマンティックフローを学習するためのフローアライメントモジュール(FAM)を提案する。
また,高分解能特徴写像と低分解能特徴写像を直接整列するGated Dual Flow Alignment Moduleを提案する。
論文 参考訳(メタデータ) (2022-07-10T08:25:47Z) - DPNET: Dual-Path Network for Efficient Object Detectioj with Lightweight
Self-Attention [16.13989397708127]
DPNetは、軽量な自己注意を伴う効率的なオブジェクト検出のためのデュアルパスネットワークである。
COCOデータセットでは29.0%のAPを達成し、320x320の画像に対して1.14 GFLOPと2.27Mモデルサイズしか達成していない。
論文 参考訳(メタデータ) (2021-10-31T13:38:16Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - Rethinking BiSeNet For Real-time Semantic Segmentation [6.622485130017622]
BiSeNetはリアルタイムセグメンテーションのための人気のある2ストリームネットワークであることが証明されている。
本稿では,stdc( short-term dense concatenate network)と呼ばれる新しい構造を提案する。
論文 参考訳(メタデータ) (2021-04-27T13:49:47Z) - Binary DAD-Net: Binarized Driveable Area Detection Network for
Autonomous Driving [94.40107679615618]
本稿では,二項化駆動型領域検出ネットワーク(バイナリDAD-Net)を提案する。
エンコーダ、ボトルネック、デコーダ部分の2重みとアクティベーションのみを使用する。
パブリックデータセット上で、最先端のセマンティックセグメンテーションネットワークより優れています。
論文 参考訳(メタデータ) (2020-06-15T07:09:01Z) - BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time
Semantic Segmentation [118.46210049742993]
バイラテラル空間ネットワーク(BiSeNet V2)と呼ばれる,速度と精度のトレードオフが良好である効率的なアーキテクチャを提案する。
2,048x1の入力に対して、我々はCityscapesテストセットで72.6%の平均IoUを1つのNVIDIA GeForce 1080 Tiカードで156 FPSで達成した。
論文 参考訳(メタデータ) (2020-04-05T10:26:38Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。