論文の概要: GSANet: Semantic Segmentation with Global and Selective Attention
- arxiv url: http://arxiv.org/abs/2003.00830v1
- Date: Fri, 14 Feb 2020 00:09:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 03:46:35.842100
- Title: GSANet: Semantic Segmentation with Global and Selective Attention
- Title(参考訳): GSANet:グローバルおよび選択的注意によるセマンティックセグメンテーション
- Authors: Qingfeng Liu, Mostafa El-Khamy, Dongwoon Bai, Jungwon Lee
- Abstract要約: セマンティックセグメンテーションのための新しいディープラーニングアーキテクチャを提案する。
我々はGSANetがMobileNetEdgeとより正確なセグメンテーションをもたらすことを示し、Xceptionのような強力なFXNを持つことを示した。
GSANetはADE20kとCityscapesのデータセットの最先端セマンティックセマンティックセマンティクスの精度を改善している。
- 参考スコア(独自算出の注目度): 37.26671754212935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel deep learning architecture for semantic
segmentation. The proposed Global and Selective Attention Network (GSANet)
features Atrous Spatial Pyramid Pooling (ASPP) with a novel sparsemax global
attention and a novel selective attention that deploys a condensation and
diffusion mechanism to aggregate the multi-scale contextual information from
the extracted deep features. A selective attention decoder is also proposed to
process the GSA-ASPP outputs for optimizing the softmax volume. We are the
first to benchmark the performance of semantic segmentation networks with the
low-complexity feature extraction network (FXN) MobileNetEdge, that is
optimized for low latency on edge devices. We show that GSANet can result in
more accurate segmentation with MobileNetEdge, as well as with strong FXNs,
such as Xception. GSANet improves the state-of-art semantic segmentation
accuracy on both the ADE20k and the Cityscapes datasets.
- Abstract(参考訳): 本稿では,意味セグメンテーションのための新しいディープラーニングアーキテクチャを提案する。
提案したGSANet(Global and Selective Attention Network)は,Atrous Spatial Pyramid Pooling (ASPP) を特徴とし,新たな疎度なグローバルアテンションと,抽出した深部特徴から多スケールのコンテキスト情報を集約する凝縮拡散機構を展開させる新規な選択的アテンションを特徴としている。
GSA-ASPP出力を処理し、ソフトマックスボリュームを最適化するために、選択的アテンションデコーダも提案されている。
エッジデバイスでの低レイテンシに最適化されたfxn(low-complexity feature extraction network)mobilenetedgeを用いて,セマンティックセグメンテーションネットワークのパフォーマンスを初めてベンチマークした。
我々はGSANetがMobileNetEdgeとより正確なセグメンテーションをもたらすことを示し、Xceptionのような強力なFXNを持つことを示した。
GSANetはADE20kとCityscapesのデータセットの最先端セマンティックセマンティックセマンティクスの精度を改善している。
関連論文リスト
- Domain Adaptive Semantic Segmentation by Optimal Transport [13.133890240271308]
セマンティックシーンセグメンテーションは、それが含んでいるセマンティック情報の豊かさから、多くの注目を集めています。
現在のアプローチは主に畳み込みニューラルネットワーク(CNN)に基づいているが、多くのラベルに依存している。
本稿では、最適輸送(OT)とこの問題に対処するためのアテンションメカニズムに基づくドメイン適応(DA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-29T03:33:54Z) - LENet: Lightweight And Efficient LiDAR Semantic Segmentation Using
Multi-Scale Convolution Attention [0.0]
本稿では,LDARに基づくセマンティックセマンティックセマンティクスのためのエンコーダデコーダ構造を持つLENetと呼ばれるプロジェクションベースのセマンティクスセマンティクスセマンティクスネットワークを提案する。
エンコーダは、特徴を捉えるために、様々な受信フィールドサイズを持つ新しいマルチスケール・コンボリューション・アテンション(MSCA)モジュールで構成されている。
提案手法は, 最先端のセマンティックセグメンテーション法と比較して, 軽量で, 効率的で, 堅牢であることを示す。
論文 参考訳(メタデータ) (2023-01-11T02:51:38Z) - EAA-Net: Rethinking the Autoencoder Architecture with Intra-class
Features for Medical Image Segmentation [4.777011444412729]
We propose a light-weight end-to-end segmentation framework based on multi-task learning, called Edge Attention autoencoder Network (EAA-Net)。
提案手法は,クラス間特徴の抽出にセグメンテーションネットワークを利用するだけでなく,フォアグラウンド内でのクラス内特徴の抽出にも再構成ネットワークを適用する。
実験結果から,医用画像分割作業において,本手法が良好に機能することが確認された。
論文 参考訳(メタデータ) (2022-08-19T07:42:55Z) - AttendSeg: A Tiny Attention Condenser Neural Network for Semantic
Segmentation on the Edge [71.80459780697956]
デバイス上のセマンティックセグメンテーションに適した,低精度でコンパクトなディープニューラルネットワークである textbfAttendSeg を紹介する。
attendsegは、空間-チャネル選択的注意を改善するために軽量注意凝縮器からなるセルフアテンションネットワークアーキテクチャを持っている。
論文 参考訳(メタデータ) (2021-04-29T19:19:04Z) - A Novel Adaptive Deep Network for Building Footprint Segmentation [0.0]
衛星画像から地図へ変換することで得られる不正確な境界の問題を解くために,Pix2Pixを用いた新しいネットワーク手法を提案する。
本フレームワークは,第1発生器が局所化特徴を抽出し,第2発生器から抽出した境界特徴とマージし,すべての詳細構造エッジを分割する2つの生成器を含む。
提案したネットワークの結果の質を高めるために異なる戦略が実装され、提案ネットワークはセグメント化精度において最先端ネットワークよりも高い性能を示し、全ての評価指標に対する大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-02-27T18:13:48Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Semantic Segmentation With Multi Scale Spatial Attention For Self
Driving Cars [2.7317088388886384]
本稿では,様々なスケールのマルチスケール特徴融合を用いた新しいニューラルネットワークを提案し,その精度と効率的なセマンティックイメージセグメンテーションを提案する。
我々は、ResNetベースの特徴抽出器、ダウンサンプリング部における拡張畳み込み層、アップサンプリング部におけるアトラス畳み込み層を使用し、コンキャット操作を用いてそれらをマージした。
より文脈的な情報をエンコードし、ネットワークの受容領域を強化するため、新しいアテンションモジュールが提案されている。
論文 参考訳(メタデータ) (2020-06-30T20:19:09Z) - Learning to Predict Context-adaptive Convolution for Semantic
Segmentation [66.27139797427147]
長距離コンテキスト情報は、高性能なセマンティックセグメンテーションを実現するために不可欠である。
空間的に変化する特徴重み付けベクトルを予測するためのコンテキスト適応畳み込みネットワーク(CaC-Net)を提案する。
当社のCaC-Netは,3つの公開データセット上でのセグメンテーション性能に優れています。
論文 参考訳(メタデータ) (2020-04-17T13:09:17Z) - BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time
Semantic Segmentation [118.46210049742993]
バイラテラル空間ネットワーク(BiSeNet V2)と呼ばれる,速度と精度のトレードオフが良好である効率的なアーキテクチャを提案する。
2,048x1の入力に対して、我々はCityscapesテストセットで72.6%の平均IoUを1つのNVIDIA GeForce 1080 Tiカードで156 FPSで達成した。
論文 参考訳(メタデータ) (2020-04-05T10:26:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。