論文の概要: Semantic Segmentation With Multi Scale Spatial Attention For Self
Driving Cars
- arxiv url: http://arxiv.org/abs/2007.12685v3
- Date: Wed, 30 Sep 2020 22:56:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 05:01:27.945733
- Title: Semantic Segmentation With Multi Scale Spatial Attention For Self
Driving Cars
- Title(参考訳): マルチスケール空間注意による自律走行車の意味セグメンテーション
- Authors: Abhinav Sagar, RajKumar Soundrapandiyan
- Abstract要約: 本稿では,様々なスケールのマルチスケール特徴融合を用いた新しいニューラルネットワークを提案し,その精度と効率的なセマンティックイメージセグメンテーションを提案する。
我々は、ResNetベースの特徴抽出器、ダウンサンプリング部における拡張畳み込み層、アップサンプリング部におけるアトラス畳み込み層を使用し、コンキャット操作を用いてそれらをマージした。
より文脈的な情報をエンコードし、ネットワークの受容領域を強化するため、新しいアテンションモジュールが提案されている。
- 参考スコア(独自算出の注目度): 2.7317088388886384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a novel neural network using multi scale feature
fusion at various scales for accurate and efficient semantic image
segmentation. We used ResNet based feature extractor, dilated convolutional
layers in downsampling part, atrous convolutional layers in the upsampling part
and used concat operation to merge them. A new attention module is proposed to
encode more contextual information and enhance the receptive field of the
network. We present an in depth theoretical analysis of our network with
training and optimization details. Our network was trained and tested on the
Camvid dataset and Cityscapes dataset using mean accuracy per class and
Intersection Over Union (IOU) as the evaluation metrics. Our model outperforms
previous state of the art methods on semantic segmentation achieving mean IOU
value of 74.12 while running at >100 FPS.
- Abstract(参考訳): 本稿では,複数スケールのマルチスケール特徴フュージョンを用いたニューラルニューラルネットワークについて,高精度かつ効率的なセマンティックイメージセグメンテーションを提案する。
resnetベースの特徴抽出器、ダウンサンプリング部の拡張畳み込み層、アップサンプリング部の重畳み込み層を使用し、それらをマージするためにconcat操作を用いた。
より文脈的な情報をエンコードし、ネットワークの受容領域を強化する新しいアテンションモジュールを提案する。
我々は、トレーニングと最適化の詳細を含むネットワークの奥行き理論解析を提示する。
私たちのネットワークはcamvidデータセットとcityscapeデータセットで、クラスごとの平均精度とiou(intersection over union)を評価指標としてトレーニングとテストを行いました。
提案モデルは,100fps以上の動作で平均iou値を74.12で達成する意味セグメンテーションに関する従来の手法を上回っている。
関連論文リスト
- Early Fusion of Features for Semantic Segmentation [10.362589129094975]
本稿では,効率的な画像分割を実現するために,分類器ネットワークとリバースHRNetアーキテクチャを統合する新しいセグメンテーションフレームワークを提案する。
私たちの手法は、Mapillary Vistas、Cityscapes、CamVid、COCO、PASCAL-VOC2012など、いくつかのベンチマークデータセットで厳格にテストされています。
その結果,画像解析における様々な応用の可能性を示し,高いセグメンテーション精度を実現する上で,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-02-08T22:58:06Z) - MCFNet: Multi-scale Covariance Feature Fusion Network for Real-time
Semantic Segmentation [6.0118706234809975]
我々は,Multi-scale Covariance Feature Fusion Network (MCFNet)と呼ばれるバイラテラルネットワーク(BiseNet)に基づく新しいアーキテクチャを提案する。
具体的には、新しい機能改善モジュールと新しい機能融合モジュールを導入する。
提案したCityscapes,CamVidデータセットのモデルを評価し,最先端の手法と比較した。
論文 参考訳(メタデータ) (2023-12-12T12:20:27Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Semantic Labeling of High Resolution Images Using EfficientUNets and
Transformers [5.177947445379688]
畳み込みニューラルネットワークとディープトランスを組み合わせた新しいセグメンテーションモデルを提案する。
提案手法は,最先端技術と比較してセグメント化精度が向上することを示す。
論文 参考訳(メタデータ) (2022-06-20T12:03:54Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - AASeg: Attention Aware Network for Real Time Semantic Segmentation [0.0]
本稿では,AASeg (Attention Aware Network) という,リアルタイムなセマンティックイメージセグメンテーションのためのネットワークを提案する。
ネットワークは,空間的意図 (SA) とチャネル的意図 (CA) を用いたチャネル情報を含む。
本研究では,Cityscapes,ADE20KおよびCamvidデータセットを用いた包括的解析,定量的実験結果,アブレーション研究を用いて,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-07-27T20:01:55Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - Densely Connected Recurrent Residual (Dense R2UNet) Convolutional Neural
Network for Segmentation of Lung CT Images [0.342658286826597]
本稿では,U-Netモデルアーキテクチャに基づくリカレントCNN,Residual Network,Dense Convolutional Networkの合成について述べる。
ベンチマークLung Lesionデータセットで検証したモデルでは、同等のモデルよりもセグメンテーションタスクのパフォーマンスが向上した。
論文 参考訳(メタデータ) (2021-02-01T06:34:10Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。
PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-03-24T04:55:43Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。