論文の概要: Dual skip connections in U-Net, ResUnet and U-Net3+ for remote
extraction of buildings
- arxiv url: http://arxiv.org/abs/2303.09064v4
- Date: Mon, 23 Oct 2023 00:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 13:26:33.636916
- Title: Dual skip connections in U-Net, ResUnet and U-Net3+ for remote
extraction of buildings
- Title(参考訳): 建物リモート抽出のためのU-Net, ResUnet, U-Net3+のデュアルスキップ接続
- Authors: Bipul Neupane, Jagannath Aryal, and Abbas Rajabifard
- Abstract要約: U-Netなどのセマンティックセグメンテーションネットワークを用いた高分解能地球観測(EO)画像から都市建物を抽出する。
それぞれの再イテレーションは、オブジェクトマッピングの精度を高めるために、マルチスケールの機能を利用する、より高密度なスキップ接続機構を利用することで、パフォーマンスを向上させることを目的としている。
我々は,3つのネットワーク(U-Net,ResUnet,U-Net3+)に対して,本質的な特徴マップを選択的に深化して性能向上を図るための3つの二重スキップ接続機構を開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Urban buildings are extracted from high-resolution Earth observation (EO)
images using semantic segmentation networks like U-Net and its successors. Each
re-iteration aims to improve performance by employing a denser skip connection
mechanism that harnesses multi-scale features for accurate object mapping.
However, denser connections increase network parameters and do not necessarily
contribute to precise segmentation. In this paper, we develop three dual skip
connection mechanisms for three networks (U-Net, ResUnet, and U-Net3+) to
selectively deepen the essential feature maps for improved performance. The
three mechanisms are evaluated on feature maps of different scales, producing
nine new network configurations. They are evaluated against their original
vanilla configurations on four building footprint datasets of different spatial
resolutions, including a multi-resolution (0.3+0.6+1.2m) dataset that we
develop for complex urban environments. The evaluation revealed that densifying
the large- and small-scale features in U-Net and U-Net3+ produce up to 0.905
F1, more than TransUnet (0.903) and Swin-Unet (0.882) in our new dataset with
up to 19x fewer parameters. The results conclude that selectively densifying
feature maps and skip connections enhances network performance without a
substantial increase in parameters. The findings and the new dataset will
contribute to the computer vision domain and urban planning decision processes.
- Abstract(参考訳): U-Netなどのセマンティックセグメンテーションネットワークを用いた高分解能地球観測(EO)画像から都市建物を抽出する。
それぞれの再イテレーションは、正確なオブジェクトマッピングにマルチスケール機能を利用する、より密なスキップ接続機構を使用することで、パフォーマンスの向上を目標としている。
しかし、より密接な接続はネットワークパラメータを増やし、必ずしも正確なセグメンテーションに寄与しない。
本稿では,3つのネットワーク(U-Net,ResUnet,U-Net3+)に対して,本質的な特徴マップを選択的に深化して性能向上を図るための3つの二重スキップ接続機構を開発する。
3つのメカニズムを異なるスケールの特徴マップで評価し、9つの新しいネットワーク構成を生成する。
それらは、複雑な都市環境のために開発する多重解像度(0.3+0.6+1.2m)データセットを含む、異なる空間解像度の4つの建築フットプリントデータセットの当初のバニラ構成に対して評価される。
評価の結果,U-NetとU-Net3+の大規模かつ小規模な特徴は最大0.905 F1, TransUnet (0.903), Swin-Unet (0.882), 最大19倍のパラメータを持つ新しいデータセットより大きいことがわかった。
その結果,機能マップとスキップ接続を選択的に拡張することで,パラメータが大幅に増加することなくネットワーク性能が向上することがわかった。
調査結果と新たなデータセットは,コンピュータビジョン領域と都市計画決定プロセスに寄与する。
関連論文リスト
- A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - Spatial Layout Consistency for 3D Semantic Segmentation [0.7614628596146599]
本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-02T03:24:21Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - ThreshNet: An Efficient DenseNet using Threshold Mechanism to Reduce
Connections [1.2542322096299672]
本稿では,接続の方法をさらに最適化するためのしきい値機構を用いた新しいネットワークアーキテクチャを提案する。
ThreshNetは、DenseNetと比較して最大60%の推論時間を短縮し、トレーニング速度を最大35%高速化し、エラー率を20%削減する。
論文 参考訳(メタデータ) (2022-01-09T13:52:16Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z) - Dilated SpineNet for Semantic Segmentation [5.6590540986523035]
スケール順列ネットワークは、オブジェクト境界ボックス検出とインスタンスセグメンテーションに有望な結果を示した。
本研究では,このセマンティックセグメンテーションのメタアーキテクチャ設計を評価する。
我々は,DeepLabv3システムからNASによって発見されたネットワークであるSpineNet-Segを提案する。
論文 参考訳(メタデータ) (2021-03-23T02:39:04Z) - Efficient-CapsNet: Capsule Network with Self-Attention Routing [0.0]
深層畳み込みニューラルネットワークは、オブジェクト変換を埋め込むために、多数の機能マップを持つデータ拡張技術とレイヤを広範囲に活用する。
カプセルネットワークは、現在の畳み込みネットワークを拡張し、より効率的に全てのアフィン変換をエンコードするプロセスで人工的な視覚知覚を実現する、有望なソリューションである。
本稿では,カプセルネットワークの効率について検討し,その容量を160Kのパラメータをほとんど持たない極端なアーキテクチャで限界まで押し上げることにより,提案アーキテクチャがまだ最先端の結果が得られることを実証する。
論文 参考訳(メタデータ) (2021-01-29T09:56:44Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z) - ReActNet: Towards Precise Binary Neural Network with Generalized
Activation Functions [76.05981545084738]
本稿では,新たな計算コストを伴わずに,実数値ネットワークからの精度ギャップを埋めるため,バイナリネットワークを強化するためのいくつかのアイデアを提案する。
まず,パラメータフリーのショートカットを用いて,コンパクトな実数値ネットワークを修正・バイナライズすることで,ベースラインネットワークを構築する。
提案したReActNetはすべての最先端技術よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2020-03-07T02:12:02Z) - Convolutional Networks with Dense Connectivity [59.30634544498946]
Dense Convolutional Network (DenseNet)を導入し、フィードフォワード方式で各レイヤを他のすべてのレイヤに接続する。
各レイヤについて、先行するすべてのレイヤのフィーチャーマップをインプットとして使用し、それ自身のフィーチャーマップをその後のすべてのレイヤへのインプットとして使用します。
提案したアーキテクチャを、4つの高度に競争力のあるオブジェクト認識ベンチマークタスクで評価する。
論文 参考訳(メタデータ) (2020-01-08T06:54:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。