論文の概要: A De-raining semantic segmentation network for real-time foreground
segmentation
- arxiv url: http://arxiv.org/abs/2104.07877v1
- Date: Fri, 16 Apr 2021 04:09:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 03:29:56.128397
- Title: A De-raining semantic segmentation network for real-time foreground
segmentation
- Title(参考訳): リアルタイム前景セグメンテーションのためのデライニングセマンティックセグメンテーションネットワーク
- Authors: Fanyi Wang, Yihui Zhang
- Abstract要約: 本稿では,降雨環境におけるセグメンテーションのための軽量ネットワークであるDeraining Semantic Accuracy Network (DRSNet)を提案する。
雨滴の特性を解析することにより、MultiScaleSE Blockは入力画像のエンコードを目標としている。
異なるエンコーダ層とデコーダ層とのセマンティック情報を組み合わせるために,非対称スキップを用いることを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few researches have been proposed specifically for real-time semantic
segmentation in rainy environments. However, the demand in this area is huge
and it is challenging for lightweight networks. Therefore, this paper proposes
a lightweight network which is specially designed for the foreground
segmentation in rainy environments, named De-raining Semantic Segmentation
Network (DRSNet). By analyzing the characteristics of raindrops, the
MultiScaleSE Block is targetedly designed to encode the input image, it uses
multi-scale dilated convolutions to increase the receptive field, and SE
attention mechanism to learn the weights of each channels. In order to combine
semantic information between different encoder and decoder layers, it is
proposed to use Asymmetric Skip, that is, the higher semantic layer of encoder
employs bilinear interpolation and the output passes through pointwise
convolution, then added element-wise to the lower semantic layer of decoder.
According to the control experiments, the performances of MultiScaleSE Block
and Asymmetric Skip compared with SEResNet18 and Symmetric Skip respectively
are improved to a certain degree on the Foreground Accuracy index. The
parameters and the floating point of operations (FLOPs) of DRSNet is only 0.54M
and 0.20GFLOPs separately. The state-of-the-art results and real-time
performances are achieved on both the UESTC all-day Scenery add rain
(UAS-add-rain) and the Baidu People Segmentation add rain (BPS-add-rain)
benchmarks with the input sizes of 192*128, 384*256 and 768*512. The speed of
DRSNet exceeds all the networks within 1GFLOPs, and Foreground Accuracy index
is also the best among the similar magnitude networks on both benchmarks.
- Abstract(参考訳): 降雨環境におけるリアルタイムセマンティックセグメンテーションのための研究は少ない。
しかし、この分野の需要は巨大であり、軽量ネットワークでは困難である。
そこで,本稿では,降雨環境における前景セグメンテーションのための軽量ネットワークとして,De-raining Semantic Segmentation Network (DRSNet)を提案する。
雨滴の特徴を解析することにより、マルチスケールSEブロックは入力画像の符号化を目標とし、マルチスケール拡張畳み込みを用いて受容界を増大させ、SEアテンション機構を用いて各チャネルの重みを学習する。
異なるエンコーダ層とデコーダ層間のセマンティック情報を結合するために、非対称スキープを用いることを提案し、すなわち、エンコーダの上位セマンティック層は双線形補間を用い、出力はポイントワイド畳み込みを通過し、デコーダの下位セマンティック層に要素ワイズを加える。
制御実験の結果,SEResNet18とSymmetric Skipと比較して,MultiScaleSEブロックと非対称スキップの性能は,フォアグラウンド精度指数である程度向上した。
DRSNetのパラメータと浮動小数点(FLOP)は、それぞれ0.54Mと0.20GFLOPのみである。
UESTC all-day Scenery add rain (UAS-add-rain)とBaidu People Segmentation add rain (BPS-add-rain)ベンチマークの両方で、入力サイズ192*128, 384*256, 768*512。
DRSNetの速度は1GFLOPs内の全ネットワークを上回り、フォアグラウンド精度指数も両方のベンチマークで同様の大きさのネットワークの中で最高である。
関連論文リスト
- Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Adjacent Context Coordination Network for Salient Object Detection in
Optical Remote Sensing Images [102.75699068451166]
本稿では,光RSI-SODのためのエンコーダ・デコーダアーキテクチャにおいて,隣接した特徴のコーディネートを探索するための新しいアジャセントコンテキストコーディネートネットワーク(ACCoNet)を提案する。
提案されたACCoNetは、9つの評価基準の下で22の最先端メソッドを上回り、1つのNVIDIA Titan X GPU上で81fpsで動作する。
論文 参考訳(メタデータ) (2022-03-25T14:14:55Z) - Deep Multi-Branch Aggregation Network for Real-Time Semantic
Segmentation in Street Scenes [32.54045305607654]
多くの最先端のリアルタイムセマンティックセグメンテーション手法は、空間的詳細や文脈情報を犠牲にして高速な推論を行う傾向にある。
街路シーンにおけるリアルタイムセマンティックセグメンテーションを実現するために,エンコーダ・デコーダ構造に基づく新しいディープ・マルチブランチ・アグリゲーション・ネットワーク(DMA-Net)を提案する。
提案したDMA-Netは,1個のNVIDIA GTX 1080Ti GPUのみを用いて,それぞれ46.7 FPSと119.8 FPSの予測速度で,平均77.0%,平均73.6%のUnion(mIoU)が得られる。
論文 参考訳(メタデータ) (2022-03-08T12:07:32Z) - Stage-Aware Feature Alignment Network for Real-Time Semantic
Segmentation of Street Scenes [59.81228011432776]
街路シーンのリアルタイムなセマンティックセグメンテーションのためのSFANet(Stage-Aware Feature Alignment Network)を提案する。
デコーダにおける各ステージのユニークな役割を考慮に入れ、新しいステージ認識機能拡張ブロック(FEB)は、エンコーダからの特徴マップの空間的詳細と文脈的情報を強化するように設計されている。
実験の結果,提案したSFANetは,ストリートシーンのリアルタイムセマンティックセグメンテーションにおける精度と速度のバランスが良好であることがわかった。
論文 参考訳(メタデータ) (2022-03-08T11:46:41Z) - Shift-Memory Network for Temporal Scene Segmentation [2.3986080077861787]
時間領域のセマンティックセグメンテーションを拡張し,動きによる空間的精度を高める。
我々は、ストリーミング入力上のシフトモードネットワークを用いて、ゼロレイテンシ出力を保証する。
実験はシフトモードと同様の精度を達成するが、高速な推論速度とはるかに少ないメモリで実現できる。
論文 参考訳(メタデータ) (2022-02-17T01:42:34Z) - MSCFNet: A Lightweight Network With Multi-Scale Context Fusion for
Real-Time Semantic Segmentation [27.232578592161673]
マルチスケールコンテキスト融合スキーム(MSCFNet)を用いた新しい軽量ネットワークを考案する。
提案されたMSCFNetは1.15Mパラメータのみを含み、71.9%のMean IoUを実現し、1つのTitan XP GPU構成で50 FPS以上で実行できる。
論文 参考訳(メタデータ) (2021-03-24T08:28:26Z) - EADNet: Efficient Asymmetric Dilated Network for Semantic Segmentation [8.449677920206817]
cityscapesデータセットにおける実験結果から,本提案手法は,軽量セマンティクスセグメンテーションネットワークにおいて,最小パラメータ数(わずか 0.35m)で67.1のセグメンテーションmiouを実現する。
論文 参考訳(メタデータ) (2021-03-16T08:46:57Z) - HyperSeg: Patch-wise Hypernetwork for Real-time Semantic Segmentation [95.47168925127089]
本稿では,エンコーダがデコーダのパラメータ(重み)をエンコードして生成する,新しいリアルタイムセマンティックセグメンテーションネットワークを提案する。
我々は、より高レベルなコンテキスト特徴を描画するためのネストされたU-Netからなる新しいタイプのハイパーネットワークを設計する。
論文 参考訳(メタデータ) (2020-12-21T18:58:18Z) - MACU-Net for Semantic Segmentation of Fine-Resolution Remotely Sensed
Images [11.047174552053626]
MACU-Netは、マルチスケールのスキップ接続と非対称畳み込みベースのU-Netで、微細解像度のリモートセンシング画像を提供する。
本設計では,(1)低レベル・高レベルの特徴写像に含まれる意味的特徴と,(2)非対称な畳み込みブロックは,標準畳み込み層の特徴表現と特徴抽出能力を強化する。
2つのリモートセンシングデータセットで行った実験では、提案したMACU-NetがU-Net、U-NetPPL、U-Net 3+、その他のベンチマークアプローチを超越していることが示されている。
論文 参考訳(メタデータ) (2020-07-26T08:56:47Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。