論文の概要: A novel dual skip connection mechanism in U-Nets for building footprint
extraction
- arxiv url: http://arxiv.org/abs/2303.09064v1
- Date: Thu, 16 Mar 2023 03:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:55:13.326737
- Title: A novel dual skip connection mechanism in U-Nets for building footprint
extraction
- Title(参考訳): 建物足跡抽出のためのu-netにおける新しいデュアルスキップ接続機構
- Authors: Bipul Neupane, Jagannath Aryal, and Abbas Rajabifard
- Abstract要約: U-Net用デュアルスキップ接続機構(DSCM)とU-Net3+用デュアルフルスケールスキップ接続機構(DFSCM)を提案する。
提案機構は,メルボルン市向けに開発したベンチマークWHU構築データセットとマルチレゾリューションデータセットで評価される,いくつかの新しいネットワークを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The importance of building footprints and their inventory has been recognised
as an enabler for multiple societal problems. Extracting urban building
footprint is complex and requires semantic segmentation of very high-resolution
(VHR) earth observation (EO) images. U-Net is a common deep learning
architecture for such segmentation. It has seen several re-incarnation
including U-Net++ and U-Net3+ with a focus on multi-scale feature aggregation
with re-designed skip connections. However, the exploitation of multi-scale
information is still evolving. In this paper, we propose a dual skip connection
mechanism (DSCM) for U-Net and a dual full-scale skip connection mechanism
(DFSCM) for U-Net3+. The DSCM in U-Net doubles the features in the encoder and
passes them to the decoder for precise localisation. Similarly, the DFSCM
incorporates increased low-level context information with high-level semantics
from feature maps in different scales. The DSCM is further tested in ResUnet
and different scales of U-Net. The proposed mechanisms, therefore, produce
several novel networks that are evaluated in a benchmark WHU building dataset
and a multi-resolution dataset that we develop for the City of Melbourne. The
results on the benchmark dataset demonstrate 17.7% and 18.4% gain in F1 score
and Intersection over Union (IoU) compared to the state-of-the-art vanilla
U-Net3+. In the same experimental setup, DSCM on U-Net and ResUnet provides a
gain in five accuracy measures against the original networks. The codes will be
available in a GitHub link after peer review.
- Abstract(参考訳): 建物の足跡とその在庫の重要性は、複数の社会問題を可能にするものとして認識されている。
都市建物のフットプリントの抽出は複雑であり、超高解像度(VHR)地球観測(EO)画像のセマンティックセグメンテーションを必要とする。
U-Netはそのようなセグメンテーションのための一般的なディープラーニングアーキテクチャである。
U-Net++やU-Net3+などいくつかの再導入があり、再設計されたスキップ接続によるマルチスケール機能集約に重点を置いている。
しかし,マルチスケール情報の活用はまだ進展途上である。
本論文では,U-Net用デュアルスキップ接続機構 (DSCM) とU-Net3+用デュアルフルスケールスキップ接続機構 (DFSCM) を提案する。
U-NetのDSCMはエンコーダの機能を2倍にし、デコーダに渡して正確なローカライゼーションを行う。
同様に、DFSCMは、異なるスケールのフィーチャーマップから高レベルなセマンティクスで低レベルなコンテキスト情報を増やしている。
DSCMはResUnetと異なるスケールのU-Netでさらにテストされている。
そこで提案するメカニズムは,メルボルン市向けに開発したベンチマークwhuビルディングデータセットとマルチレゾリューションデータセットで評価される,いくつかの新しいネットワークを生成する。
ベンチマークデータセットの結果は、最先端のバニラU-Net3+と比較して、F1スコアとIoU(Intersection over Union)の17.7%と18.4%の増加を示している。
同じ実験的なセットアップで、U-NetとResUnet上のDSCMは、元のネットワークに対して5つの精度の尺度を得られる。
コードは、ピアレビューの後にGitHubのリンクで入手できる。
関連論文リスト
- UIU-Net: U-Net in U-Net for Infrared Small Object Detection [36.72184013409837]
本稿では,U-NetフレームワークにおけるU-Netの簡易かつ効果的なUIU-Netを提案する。
名前が示すように、UIU-Netは小さなU-Netを大きなU-Netバックボーンに組み込み、オブジェクトのマルチレベルおよびマルチスケールの表現学習を可能にする。
提案したUIU-Netは、ビデオシーケンス赤外線小オブジェクトデータセットの強力な一般化性能も生み出す。
論文 参考訳(メタデータ) (2022-12-02T04:52:26Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - R2U++: A Multiscale Recurrent Residual U-Net with Dense Skip Connections
for Medical Image Segmentation [0.5735035463793008]
本稿では,新しいU-Netベースの医用画像セグメンテーションアーキテクチャR2U++を提案する。
提案したアーキテクチャでは, 単純な畳み込みバックボーンを, より深い再帰的な畳み込みブロックに置き換える。
エンコーダとデコーダのセマンティックギャップは、濃密なスキップ経路によって減少する。
論文 参考訳(メタデータ) (2022-06-03T19:42:44Z) - Towards Bi-directional Skip Connections in Encoder-Decoder Architectures
and Beyond [95.46272735589648]
本稿では,デコードされた機能をエンコーダに戻すための後方スキップ接続を提案する。
我々の設計は、任意のエンコーダ・デコーダアーキテクチャにおいて前方スキップ接続と共同で適用することができる。
本稿では,2相ニューラルネットワーク探索(NAS)アルゴリズム,すなわちBiX-NASを提案する。
論文 参考訳(メタデータ) (2022-03-11T01:38:52Z) - Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。
2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。
6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-08-18T14:14:22Z) - KiU-Net: Overcomplete Convolutional Architectures for Biomedical Image
and Volumetric Segmentation [71.79090083883403]
トラディショナル・エンコーダ・デコーダに基づく手法は, より小さな構造を検出でき, 境界領域を正確に分割できない。
本稿では,(1)入力の細部と正確なエッジを捉えることを学ぶ完全畳み込みネットワークKite-Netと,(2)高レベルの特徴を学習するU-Netの2つの枝を持つKiU-Netを提案する。
提案手法は,より少ないパラメータとより高速な収束の利点により,最近のすべての手法と比較して性能が向上する。
論文 参考訳(メタデータ) (2020-10-04T19:23:33Z) - MACU-Net for Semantic Segmentation of Fine-Resolution Remotely Sensed
Images [11.047174552053626]
MACU-Netは、マルチスケールのスキップ接続と非対称畳み込みベースのU-Netで、微細解像度のリモートセンシング画像を提供する。
本設計では,(1)低レベル・高レベルの特徴写像に含まれる意味的特徴と,(2)非対称な畳み込みブロックは,標準畳み込み層の特徴表現と特徴抽出能力を強化する。
2つのリモートセンシングデータセットで行った実験では、提案したMACU-NetがU-Net、U-NetPPL、U-Net 3+、その他のベンチマークアプローチを超越していることが示されている。
論文 参考訳(メタデータ) (2020-07-26T08:56:47Z) - Multi-Stage Hybrid Federated Learning over Large-Scale D2D-Enabled Fog
Networks [61.30171206892684]
ネットワークを多層クラスタベース構造とみなす階層内モデル学習と層間モデル学習のハイブリッドを開発する。
MH-FLは、デバイス間通信(D2D)を介して形成されたローカルネットワークを含む、クラスタ内のノード間のトポロジー構造を考察している。
異なるネットワーク層におけるデバイスを協調的/協調的にオーケストレーションし、モデルパラメータの局所的なコンセンサスを形成する。
論文 参考訳(メタデータ) (2020-07-18T20:03:07Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Encoder-Decoder Based Convolutional Neural Networks with
Multi-Scale-Aware Modules for Crowd Counting [6.893512627479196]
正確かつ効率的な群集カウントのための2つの修正ニューラルネットワークを提案する。
最初のモデルはM-SFANetと名付けられ、アラス空間ピラミッドプール(ASPP)とコンテキスト認識モジュール(CAN)が付属している。
第2のモデルはM-SegNetと呼ばれ、SFANetの双線形アップサンプリングをSegNetで使用される最大アンプールに置き換えることで生成される。
論文 参考訳(メタデータ) (2020-03-12T03:00:26Z) - Dense Dilated Convolutions Merging Network for Land Cover Classification [8.932848548221532]
リモートセンシング画像のランドカバー分類は、限られた量の注釈付きデータのために難しい課題である。
本稿では,高密度拡張畳み込みネットワーク(DDCM-Net)と呼ばれる新しいアーキテクチャを提案する。
提案するDDCM-Netの有効性,堅牢性,柔軟性を,ISPRS Potsdam および Vaihingen データセット上で実証する。
論文 参考訳(メタデータ) (2020-03-09T10:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。