論文の概要: Real-time Semantic Segmentation via Spatial-detail Guided Context
Propagation
- arxiv url: http://arxiv.org/abs/2005.11034v5
- Date: Sat, 19 Mar 2022 05:18:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 09:26:01.976011
- Title: Real-time Semantic Segmentation via Spatial-detail Guided Context
Propagation
- Title(参考訳): 空間分割型コンテキスト伝搬によるリアルタイム意味セグメンテーション
- Authors: Shijie Hao and Yuan Zhou and Yanrong Guo and Richang Hong and Jun
Cheng and Meng Wang
- Abstract要約: 本研究では,リアルタイムセマンティックセグメンテーションを実現するための空間詳細ガイド付きコンテキスト伝搬ネットワーク(SGCPNet)を提案する。
浅い層の空間的詳細を利用して低解像度のグローバルコンテキストの伝播を誘導し、失われた空間情報を効果的に再構成することができる。
69.5%のmIoUセグメンテーション精度を実現し、GeForce GTX 1080 Tiの768x1536イメージ上で178.5 FPSに達する。
- 参考スコア(独自算出の注目度): 49.70144583431999
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, vision-based computing tasks play an important role in various
real-world applications. However, many vision computing tasks, e.g. semantic
segmentation, are usually computationally expensive, posing a challenge to the
computing systems that are resource-constrained but require fast response
speed. Therefore, it is valuable to develop accurate and real-time vision
processing models that only require limited computational resources. To this
end, we propose the Spatial-detail Guided Context Propagation Network (SGCPNet)
for achieving real-time semantic segmentation. In SGCPNet, we propose the
strategy of spatial-detail guided context propagation. It uses the spatial
details of shallow layers to guide the propagation of the low-resolution global
contexts, in which the lost spatial information can be effectively
reconstructed. In this way, the need for maintaining high-resolution features
along the network is freed, therefore largely improving the model efficiency.
On the other hand, due to the effective reconstruction of spatial details, the
segmentation accuracy can be still preserved. In the experiments, we validate
the effectiveness and efficiency of the proposed SGCPNet model. On the
Citysacpes dataset, for example, our SGCPNet achieves 69.5% mIoU segmentation
accuracy, while its speed reaches 178.5 FPS on 768x1536 images on a GeForce GTX
1080 Ti GPU card. In addition, SGCPNet is very lightweight and only contains
0.61 M parameters.
- Abstract(参考訳): 今日では、視覚ベースのコンピューティングタスクは、様々な現実世界のアプリケーションにおいて重要な役割を果たす。
しかし、セマンティックセグメンテーションのような多くの視覚コンピューティングタスクは通常計算コストが高く、リソースに制約があるが応答速度が速いコンピュータシステムに挑戦している。
したがって、限られた計算資源しか必要としない正確なリアルタイムビジョン処理モデルを開発することは重要である。
そこで本研究では,リアルタイムセマンティックセグメンテーションを実現するための空間詳細ガイド付きコンテキスト伝搬ネットワーク(SGCPNet)を提案する。
SGCPNetでは,空間的詳細誘導型コンテキスト伝搬の戦略を提案する。
浅い層の空間的詳細を使用して、失われた空間情報を効果的に再構築できる低解像度のグローバルコンテキストの伝播を導く。
このように、ネットワークに沿って高解像度の機能を維持する必要性は解放され、モデル効率が大幅に向上する。
一方,空間的詳細の効果的な再構成により,セグメンテーション精度は維持される。
実験では,提案したSGCPNetモデルの有効性と有効性を検証する。
例えばcitysacpesデータセットでは、sgcpnetは69.5%のmiouセグメンテーション精度を達成し、geforce gtx 1080 ti gpuカード上の768x1536イメージでは178.5fpsに達する。
さらに、sgcpnetは非常に軽量で 0.61 m のパラメータしか含まない。
関連論文リスト
- Spatial-information Guided Adaptive Context-aware Network for Efficient
RGB-D Semantic Segmentation [9.198120596225968]
計算パラメータを削減し,アルゴリズムの堅牢性を保証する,効率的な軽量エンコーダデコーダネットワークを提案する。
また,NYUv2,SUN RGB-D,Cityscapesのデータセットを用いた実験結果から,本手法は最先端手法よりもセグメンテーション精度,推定時間,パラメータのトレードオフが良好であることが示された。
論文 参考訳(メタデータ) (2023-08-11T09:02:03Z) - Rethinking BiSeNet For Real-time Semantic Segmentation [6.622485130017622]
BiSeNetはリアルタイムセグメンテーションのための人気のある2ストリームネットワークであることが証明されている。
本稿では,stdc( short-term dense concatenate network)と呼ばれる新しい構造を提案する。
論文 参考訳(メタデータ) (2021-04-27T13:49:47Z) - Real-time Semantic Segmentation with Context Aggregation Network [14.560708848716754]
本稿では,2分岐畳み込みニューラルネットワークを提案する。
本研究では,2つのセマンティックセグメンテーションデータセット,すなわちCityscapesデータセットとUAVidデータセットについて評価を行った。
論文 参考訳(メタデータ) (2020-11-02T14:16:23Z) - Real-time Semantic Segmentation with Fast Attention [94.88466483540692]
本稿では,高解像度画像と映像をリアルタイムにセマンティックセグメンテーションするための新しいアーキテクチャを提案する。
提案したアーキテクチャは我々の空間的注意の速さに依存しており、これは一般的な自己注意機構の単純かつ効率的な修正である。
複数のデータセットに対する結果から,既存の手法に比べて精度と速度が向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-07T22:37:16Z) - Spatial Information Guided Convolution for Real-Time RGBD Semantic
Segmentation [79.78416804260668]
本稿では,効率的なRGB機能と3次元空間情報統合を実現するための空間情報ガイドコンボリューション(S-Conv)を提案する。
S-Convは、3次元空間情報によって導かれる畳み込みカーネルのサンプリングオフセットを推測する能力を有する。
我々はさらにS-Convを空間情報ガイド畳み込みネットワーク(SGNet)と呼ばれるセグメンテーションネットワークに組み込みます。
論文 参考訳(メタデータ) (2020-04-09T13:38:05Z) - BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time
Semantic Segmentation [118.46210049742993]
バイラテラル空間ネットワーク(BiSeNet V2)と呼ばれる,速度と精度のトレードオフが良好である効率的なアーキテクチャを提案する。
2,048x1の入力に対して、我々はCityscapesテストセットで72.6%の平均IoUを1つのNVIDIA GeForce 1080 Tiカードで156 FPSで達成した。
論文 参考訳(メタデータ) (2020-04-05T10:26:38Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。