論文の概要: EADNet: Efficient Asymmetric Dilated Network for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2103.08914v1
- Date: Tue, 16 Mar 2021 08:46:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 19:27:57.141410
- Title: EADNet: Efficient Asymmetric Dilated Network for Semantic Segmentation
- Title(参考訳): EADNet: セマンティックセグメンテーションのための効率的な非対称拡張ネットワーク
- Authors: Qihang Yang and Tao Chen and Jiayuan Fan and Ye Lu and Chongyan Zuo
and Qinghua Chi
- Abstract要約: cityscapesデータセットにおける実験結果から,本提案手法は,軽量セマンティクスセグメンテーションネットワークにおいて,最小パラメータ数(わずか 0.35m)で67.1のセグメンテーションmiouを実現する。
- 参考スコア(独自算出の注目度): 8.449677920206817
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to real-time image semantic segmentation needs on power constrained edge
devices, there has been an increasing desire to design lightweight semantic
segmentation neural network, to simultaneously reduce computational cost and
increase inference speed. In this paper, we propose an efficient asymmetric
dilated semantic segmentation network, named EADNet, which consists of multiple
developed asymmetric convolution branches with different dilation rates to
capture the variable shapes and scales information of an image. Specially, a
multi-scale multi-shape receptive field convolution (MMRFC) block with only a
few parameters is designed to capture such information. Experimental results on
the Cityscapes dataset demonstrate that our proposed EADNet achieves
segmentation mIoU of 67.1 with smallest number of parameters (only 0.35M) among
mainstream lightweight semantic segmentation networks.
- Abstract(参考訳): 電力制約エッジデバイスでのリアルタイム画像意味セマンティクスセグメンテーションの必要性から、軽量な意味セマンティクスセグメンテーションニューラルネットワークを設計して、計算コストの削減と推論速度の向上を同時に実現したいという願望が高まっている。
本稿では,可変形状をキャプチャし,画像の情報をスケールするための拡張率が異なる複数の非対称畳み込み枝からなる,eadnetと呼ばれる効率的な非対称拡張意味セグメンテーションネットワークを提案する。
特に、少数のパラメータしか持たないMMRFC(multi-scale multi-shape receptive field convolution)ブロックは、そのような情報をキャプチャするために設計されている。
cityscapesデータセットにおける実験結果から,本提案手法は,軽量セマンティクスセグメンテーションネットワークにおいて,最小パラメータ数(わずか 0.35m)で67.1のセグメンテーションmiouを実現する。
関連論文リスト
- Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - LENet: Lightweight And Efficient LiDAR Semantic Segmentation Using
Multi-Scale Convolution Attention [0.0]
本稿では,LDARに基づくセマンティックセマンティックセマンティクスのためのエンコーダデコーダ構造を持つLENetと呼ばれるプロジェクションベースのセマンティクスセマンティクスセマンティクスネットワークを提案する。
エンコーダは、特徴を捉えるために、様々な受信フィールドサイズを持つ新しいマルチスケール・コンボリューション・アテンション(MSCA)モジュールで構成されている。
提案手法は, 最先端のセマンティックセグメンテーション法と比較して, 軽量で, 効率的で, 堅牢であることを示す。
論文 参考訳(メタデータ) (2023-01-11T02:51:38Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - PocketNet: A Smaller Neural Network for 3D Medical Image Segmentation [0.0]
私たちは、パラメータの数の3%未満を使用しながら、従来のCNNに匹敵するセグメンテーション結果を達成するPocketNetと呼ばれる新しいCNNアーキテクチャを導き出します。
我々は,PocketNetが従来のCNNに匹敵するセグメンテーション結果を達成し,パラメータ数の3%未満を用いていることを示す。
論文 参考訳(メタデータ) (2021-04-21T20:10:30Z) - A De-raining semantic segmentation network for real-time foreground
segmentation [0.0]
本稿では,降雨環境におけるセグメンテーションのための軽量ネットワークであるDeraining Semantic Accuracy Network (DRSNet)を提案する。
雨滴の特性を解析することにより、MultiScaleSE Blockは入力画像のエンコードを目標としている。
異なるエンコーダ層とデコーダ層とのセマンティック情報を組み合わせるために,非対称スキップを用いることを提案する。
論文 参考訳(メタデータ) (2021-04-16T04:09:13Z) - MSCFNet: A Lightweight Network With Multi-Scale Context Fusion for
Real-Time Semantic Segmentation [27.232578592161673]
マルチスケールコンテキスト融合スキーム(MSCFNet)を用いた新しい軽量ネットワークを考案する。
提案されたMSCFNetは1.15Mパラメータのみを含み、71.9%のMean IoUを実現し、1つのTitan XP GPU構成で50 FPS以上で実行できる。
論文 参考訳(メタデータ) (2021-03-24T08:28:26Z) - CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。
PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-03-24T04:55:43Z) - EPSNet: Efficient Panoptic Segmentation Network with Cross-layer
Attention Fusion [5.815742965809424]
高速な推論速度でパノプティカルセグメンテーションタスクに取り組むために,EPSNet(Efficient Panoptic Network)を提案する。
基本的に、EPSNetはプロトタイプマスクとマスク係数の単純な線形結合に基づいてマスクを生成する。
共有プロトタイプの品質を高めるために,我々は"クロスレイヤーアテンション融合モジュール"と呼ばれるモジュールを採用した。
論文 参考訳(メタデータ) (2020-03-23T09:11:44Z) - Gated Path Selection Network for Semantic Segmentation [72.44994579325822]
我々は,適応的な受容場を学習することを目的とした,GPSNetという新しいネットワークを開発した。
GPSNetにおいて、我々はまず2次元のマルチスケールネットワーク、SuperNetを設計する。
望ましいセマンティックコンテキストを動的に選択するために、ゲート予測モジュールがさらに導入される。
論文 参考訳(メタデータ) (2020-01-19T12:32:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。