論文の概要: DRBANET: A Lightweight Dual-Resolution Network for Semantic Segmentation
with Boundary Auxiliary
- arxiv url: http://arxiv.org/abs/2111.00509v1
- Date: Sun, 31 Oct 2021 14:20:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 15:37:31.280837
- Title: DRBANET: A Lightweight Dual-Resolution Network for Semantic Segmentation
with Boundary Auxiliary
- Title(参考訳): drbanet:境界補助付き意味セグメンテーションのための軽量なデュアルレゾリューションネットワーク
- Authors: Linjie Wang, Quan Zhou, Chenfeng Jiang, Xiaofu Wu, and Longin Jan
Latecki
- Abstract要約: 本稿では,境界情報を用いてセマンティックセグメンテーション結果を洗練することを目的とした,DRBANetと呼ばれる軽量なデュアルレゾリューションネットワークを提案する。
DRBANetは、高分解能分岐(HRB)と低分解能分岐(LRB)を含むデュアル並列アーキテクチャを採用している。
CityscapesとCamVidデータセットの実験により,セグメント化精度と実行効率との有望なトレードオフを実現することができた。
- 参考スコア(独自算出の注目度): 15.729067807920236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the powerful ability to encode image details and semantics, many
lightweight dual-resolution networks have been proposed in recent years.
However, most of them ignore the benefit of boundary information. This paper
introduces a lightweight dual-resolution network, called DRBANet, aiming to
refine semantic segmentation results with the aid of boundary information.
DRBANet adopts dual parallel architecture, including: high resolution branch
(HRB) and low resolution branch (LRB). Specifically, HRB mainly consists of a
set of Efficient Inverted Bottleneck Modules (EIBMs), which learn feature
representations with larger receptive fields. LRB is composed of a series of
EIBMs and an Extremely Lightweight Pyramid Pooling Module (ELPPM), where ELPPM
is utilized to capture multi-scale context through hierarchical residual
connections. Finally, a boundary supervision head is designed to capture object
boundaries in HRB. Extensive experiments on Cityscapes and CamVid datasets
demonstrate that our method achieves promising trade-off between segmentation
accuracy and running efficiency.
- Abstract(参考訳): 画像の詳細とセマンティクスをエンコードできる強力な能力により、近年、多くの軽量なデュアルレゾリューションネットワークが提案されている。
しかし、その多くは境界情報の利点を無視している。
本稿では,境界情報を用いてセマンティックセグメンテーション結果を洗練することを目的とした,DRBANetと呼ばれる軽量なデュアルレゾリューションネットワークを提案する。
DRBANetは、高分解能分岐(HRB)と低分解能分岐(LRB)を含む二重並列アーキテクチャを採用している。
具体的には、HRBは主に、より大きな受容場を持つ特徴表現を学習する効率的な反転ブートネックモジュール(EIBM)からなる。
lrbは一連のeibmと非常に軽量なピラミッドプーリングモジュール(elppm)で構成されており、elppmは階層的な残差接続を通じてマルチスケールのコンテキストをキャプチャするために利用される。
最後に、境界監督ヘッドは、HRB内のオブジェクト境界をキャプチャするために設計されている。
CityscapesとCamVidデータセットの大規模な実験により,セグメント化精度と実行効率のトレードオフが期待できることを示した。
関連論文リスト
- BAFNet: Bilateral Attention Fusion Network for Lightweight Semantic Segmentation of Urban Remote Sensing Images [6.153725909241752]
本研究では,高分解能な都市リモートセンシング画像の分割を効率的に行うために,両側注意融合ネットワーク(BAFNet)と呼ばれる軽量なセマンティックセマンティックセマンティクスネットワークを提案する。
BAFNetは高度な軽量モデルを精度で上回るが、2つのデータセット上の非軽量な最先端メソッドに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-16T13:25:42Z) - Bilateral Reference for High-Resolution Dichotomous Image Segmentation [109.35828258964557]
高分解能ジコトコス像分割(DIS)のための新しい両側参照フレームワーク(BiRefNet)を導入する。
それは2つの重要な構成要素から構成される: 局在モジュール (LM) と再構成モジュール (RM) と、提案した両側参照 (BiRef) である。
RM内では、画像の階層的パッチがソース参照を提供し、勾配マップがターゲット参照として機能する、再構成プロセスにBiRefを利用する。
論文 参考訳(メタデータ) (2024-01-07T07:56:47Z) - ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale
Residual Connections for Medical Image Segmentation [7.921517156237902]
本稿では,拡張型マルチスケール残差ネットワーク(ESDMR-Net)を提案する。
完全な畳み込みネットワークであり、モバイルデバイスのようなリソースに制約のあるコンピューティングハードウェアに適している。
5つの異なる応用例から7つのデータセットについて実験を行った。
論文 参考訳(メタデータ) (2023-12-17T02:15:49Z) - MFPNet: Multi-scale Feature Propagation Network For Lightweight Semantic
Segmentation [5.58363644107113]
マルチスケール特徴伝達ネットワーク(Net)と呼ばれる,新しい軽量セグメンテーションアーキテクチャを提案する。
フレキシブル・ボトルネック・残差モジュール(BRM)からなる対称残差ブロックを有するロバスト・デコーダ構造を設計する。
遅延長範囲のコンテキスト関係をモデル化する能力の利点を生かして、グラフ畳み込みネットワーク(GCN)を活用し、BRMブロック間のマルチスケールフィーチャの伝搬を容易にする。
論文 参考訳(メタデータ) (2023-09-10T02:02:29Z) - DuAT: Dual-Aggregation Transformer Network for Medical Image
Segmentation [21.717520350930705]
トランスフォーマーベースのモデルはコンピュータビジョンタスクで成功することが広く実証されている。
しかし、それらはしばしば大きなパターンの特徴によって支配され、局所的な詳細が失われる。
本稿では、2つの革新的な設計を特徴とするDuATと呼ばれるDual-Aggregation Transformer Networkを提案する。
大腸内視鏡画像における皮膚病変像とポリープの分画における最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-12-21T07:54:02Z) - Full-Duplex Strategy for Video Object Segmentation [141.43983376262815]
Full- Strategy Network (FSNet)はビデオオブジェクトセグメンテーション(VOS)のための新しいフレームワークである
我々のFSNetは、融合復号ステージの前に、クロスモーダルな機能パス(すなわち、送信と受信)を同時に実行します。
我々のFSNetは、VOSとビデオの有能なオブジェクト検出タスクの両方において、他の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-06T14:50:50Z) - BridgeNet: A Joint Learning Network of Depth Map Super-Resolution and
Monocular Depth Estimation [60.34562823470874]
本稿では,DSR(Deep Map Super- resolution)とMDE(Monocular depth Estimation)の併用学習ネットワークを提案する。
1つは特徴符号化プロセスのために設計された高周波アテンションブリッジ(HABdg)で、これはDSRタスクを誘導するMDEタスクの高周波情報を学ぶ。
もう一つは、深度マップ再構築プロセス用に設計されたコンテンツガイダンスブリッジ(CGBdg)であり、MDEタスクのためにDSRタスクから学んだコンテンツガイダンスを提供する。
論文 参考訳(メタデータ) (2021-07-27T01:28:23Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。