論文の概要: A novel dual skip connection mechanism in U-Nets for building footprint
extraction
- arxiv url: http://arxiv.org/abs/2303.09064v1
- Date: Thu, 16 Mar 2023 03:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:55:13.326737
- Title: A novel dual skip connection mechanism in U-Nets for building footprint
extraction
- Title(参考訳): 建物足跡抽出のためのu-netにおける新しいデュアルスキップ接続機構
- Authors: Bipul Neupane, Jagannath Aryal, and Abbas Rajabifard
- Abstract要約: U-Net用デュアルスキップ接続機構(DSCM)とU-Net3+用デュアルフルスケールスキップ接続機構(DFSCM)を提案する。
提案機構は,メルボルン市向けに開発したベンチマークWHU構築データセットとマルチレゾリューションデータセットで評価される,いくつかの新しいネットワークを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The importance of building footprints and their inventory has been recognised
as an enabler for multiple societal problems. Extracting urban building
footprint is complex and requires semantic segmentation of very high-resolution
(VHR) earth observation (EO) images. U-Net is a common deep learning
architecture for such segmentation. It has seen several re-incarnation
including U-Net++ and U-Net3+ with a focus on multi-scale feature aggregation
with re-designed skip connections. However, the exploitation of multi-scale
information is still evolving. In this paper, we propose a dual skip connection
mechanism (DSCM) for U-Net and a dual full-scale skip connection mechanism
(DFSCM) for U-Net3+. The DSCM in U-Net doubles the features in the encoder and
passes them to the decoder for precise localisation. Similarly, the DFSCM
incorporates increased low-level context information with high-level semantics
from feature maps in different scales. The DSCM is further tested in ResUnet
and different scales of U-Net. The proposed mechanisms, therefore, produce
several novel networks that are evaluated in a benchmark WHU building dataset
and a multi-resolution dataset that we develop for the City of Melbourne. The
results on the benchmark dataset demonstrate 17.7% and 18.4% gain in F1 score
and Intersection over Union (IoU) compared to the state-of-the-art vanilla
U-Net3+. In the same experimental setup, DSCM on U-Net and ResUnet provides a
gain in five accuracy measures against the original networks. The codes will be
available in a GitHub link after peer review.
- Abstract(参考訳): 建物の足跡とその在庫の重要性は、複数の社会問題を可能にするものとして認識されている。
都市建物のフットプリントの抽出は複雑であり、超高解像度(VHR)地球観測(EO)画像のセマンティックセグメンテーションを必要とする。
U-Netはそのようなセグメンテーションのための一般的なディープラーニングアーキテクチャである。
U-Net++やU-Net3+などいくつかの再導入があり、再設計されたスキップ接続によるマルチスケール機能集約に重点を置いている。
しかし,マルチスケール情報の活用はまだ進展途上である。
本論文では,U-Net用デュアルスキップ接続機構 (DSCM) とU-Net3+用デュアルフルスケールスキップ接続機構 (DFSCM) を提案する。
U-NetのDSCMはエンコーダの機能を2倍にし、デコーダに渡して正確なローカライゼーションを行う。
同様に、DFSCMは、異なるスケールのフィーチャーマップから高レベルなセマンティクスで低レベルなコンテキスト情報を増やしている。
DSCMはResUnetと異なるスケールのU-Netでさらにテストされている。
そこで提案するメカニズムは,メルボルン市向けに開発したベンチマークwhuビルディングデータセットとマルチレゾリューションデータセットで評価される,いくつかの新しいネットワークを生成する。
ベンチマークデータセットの結果は、最先端のバニラU-Net3+と比較して、F1スコアとIoU(Intersection over Union)の17.7%と18.4%の増加を示している。
同じ実験的なセットアップで、U-NetとResUnet上のDSCMは、元のネットワークに対して5つの精度の尺度を得られる。
コードは、ピアレビューの後にGitHubのリンクで入手できる。
関連論文リスト
- A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - Spatial Layout Consistency for 3D Semantic Segmentation [0.7614628596146599]
本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-02T03:24:21Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - ThreshNet: An Efficient DenseNet using Threshold Mechanism to Reduce
Connections [1.2542322096299672]
本稿では,接続の方法をさらに最適化するためのしきい値機構を用いた新しいネットワークアーキテクチャを提案する。
ThreshNetは、DenseNetと比較して最大60%の推論時間を短縮し、トレーニング速度を最大35%高速化し、エラー率を20%削減する。
論文 参考訳(メタデータ) (2022-01-09T13:52:16Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z) - Dilated SpineNet for Semantic Segmentation [5.6590540986523035]
スケール順列ネットワークは、オブジェクト境界ボックス検出とインスタンスセグメンテーションに有望な結果を示した。
本研究では,このセマンティックセグメンテーションのメタアーキテクチャ設計を評価する。
我々は,DeepLabv3システムからNASによって発見されたネットワークであるSpineNet-Segを提案する。
論文 参考訳(メタデータ) (2021-03-23T02:39:04Z) - Efficient-CapsNet: Capsule Network with Self-Attention Routing [0.0]
深層畳み込みニューラルネットワークは、オブジェクト変換を埋め込むために、多数の機能マップを持つデータ拡張技術とレイヤを広範囲に活用する。
カプセルネットワークは、現在の畳み込みネットワークを拡張し、より効率的に全てのアフィン変換をエンコードするプロセスで人工的な視覚知覚を実現する、有望なソリューションである。
本稿では,カプセルネットワークの効率について検討し,その容量を160Kのパラメータをほとんど持たない極端なアーキテクチャで限界まで押し上げることにより,提案アーキテクチャがまだ最先端の結果が得られることを実証する。
論文 参考訳(メタデータ) (2021-01-29T09:56:44Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z) - ReActNet: Towards Precise Binary Neural Network with Generalized
Activation Functions [76.05981545084738]
本稿では,新たな計算コストを伴わずに,実数値ネットワークからの精度ギャップを埋めるため,バイナリネットワークを強化するためのいくつかのアイデアを提案する。
まず,パラメータフリーのショートカットを用いて,コンパクトな実数値ネットワークを修正・バイナライズすることで,ベースラインネットワークを構築する。
提案したReActNetはすべての最先端技術よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2020-03-07T02:12:02Z) - Convolutional Networks with Dense Connectivity [59.30634544498946]
Dense Convolutional Network (DenseNet)を導入し、フィードフォワード方式で各レイヤを他のすべてのレイヤに接続する。
各レイヤについて、先行するすべてのレイヤのフィーチャーマップをインプットとして使用し、それ自身のフィーチャーマップをその後のすべてのレイヤへのインプットとして使用します。
提案したアーキテクチャを、4つの高度に競争力のあるオブジェクト認識ベンチマークタスクで評価する。
論文 参考訳(メタデータ) (2020-01-08T06:54:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。