論文の概要: Rethinking the U-Net, ResUnet, and U-Net3+ architectures with dual skip
connections for building footprint extraction
- arxiv url: http://arxiv.org/abs/2303.09064v2
- Date: Wed, 26 Apr 2023 00:51:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 17:31:13.742969
- Title: Rethinking the U-Net, ResUnet, and U-Net3+ architectures with dual skip
connections for building footprint extraction
- Title(参考訳): 建物足跡抽出のためのデュアルスキップ接続を用いたu-net, resunet, u-net3+アーキテクチャの再検討
- Authors: Bipul Neupane, Jagannath Aryal, and Abbas Rajabifard
- Abstract要約: 本稿では,U-Net,ResUnet,U-Net3+の3つの新しい二重スキップ接続機構を提案する。
これにより、スキップ接続によって転送される機能マップが深まり、これらのネットワーク内のコンテキストとローカライゼーションの間のより正確なトレードオフを見つけることができる。
これらのメカニズムは3つのネットワークの異なるスケールの特徴マップで評価され、9つのネットワーク構成が生成される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The importance of building footprints and their inventory has been recognised
as foundational spatial information for multiple societal problems. Extracting
complex urban buildings involves the segmentation of very high-resolution (VHR)
earth observation (EO) images. U-Net is a common deep learning network and
foundation for its new incarnations like ResUnet, U-Net++ and U-Net3+ for such
segmentation. The re-incarnations look for efficiency gain by re-designing the
skip connection component and exploiting the multi-scale features in U-Net.
However, skip connections do not always improve these networks and context
information is lost in the multi-scale features. In this paper, we propose
three novel dual skip connection mechanisms for U-Net, ResUnet, and U-Net3+.
This deepens the feature maps forwarded by the skip connections to find a more
accurate trade-off between context and localisation within these networks. The
mechanisms are evaluated on feature maps of different scales in the three
networks, producing nine new network configurations. The networks are evaluated
against their original vanilla versions using four building footprint datasets
(three existing and one new) of different spatial resolutions: VHR (0.3m),
high-resolution (1m and 1.2m), and multi-resolution (0.3+0.6+1.2m). The
proposed mechanisms report efficiency gain on five evaluation measures for
U-Net and ResUnet, and up to 17.7% and 18.4% gain in F1 score and Intersection
over Union (IoU) for U-Net3+. The codes will be available in a GitHub link
after peer review.
- Abstract(参考訳): 建物の足跡とその在庫の重要性は、複数の社会問題に対する基礎的な空間情報として認識されている。
複雑な都市建物の抽出には、超高解像度(VHR)地球観測(EO)画像の分割が含まれる。
U-Netは、ResUnet、U-Net++、U-Net3+のような新しいセグメンテーションの基礎となる、共通のディープラーニングネットワークである。
再導入は、スキップ接続コンポーネントを再設計し、U-Netのマルチスケール機能を活用することで効率向上を求める。
しかし、スキップ接続は必ずしもこれらのネットワークを改善しておらず、マルチスケール機能ではコンテキスト情報が失われる。
本稿では,u-net,resunet,u-net3+のデュアルスキップ接続機構を提案する。
これにより、スキップ接続によって転送される機能マップが深まり、これらのネットワーク内のコンテキストとローカライゼーションの間のより正確なトレードオフを見つけることができる。
これらのメカニズムは3つのネットワークの異なるスケールの特徴マップで評価され、9つのネットワーク構成が生成される。
ネットワークは、vhr (0.3m)、高解像度 (1mと1.2m)、マルチレゾリューション (0.3+0.6+1.2m) の4つの異なる空間解像度のビルディングフットプリントデータセット (3つの既存および1つの新しい) を使用して、元のバニラバージョンに対して評価される。
提案手法は、U-NetとResUnetの5つの評価尺度における効率向上を報告し、最大17.7%と18.4%のF1スコアとU-Net3+のIoU(Intersection over Union)の上昇を報告した。
コードは、ピアレビューの後にGitHubのリンクで入手できる。
関連論文リスト
- A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - Spatial Layout Consistency for 3D Semantic Segmentation [0.7614628596146599]
本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-02T03:24:21Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - ThreshNet: An Efficient DenseNet using Threshold Mechanism to Reduce
Connections [1.2542322096299672]
本稿では,接続の方法をさらに最適化するためのしきい値機構を用いた新しいネットワークアーキテクチャを提案する。
ThreshNetは、DenseNetと比較して最大60%の推論時間を短縮し、トレーニング速度を最大35%高速化し、エラー率を20%削減する。
論文 参考訳(メタデータ) (2022-01-09T13:52:16Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z) - Dilated SpineNet for Semantic Segmentation [5.6590540986523035]
スケール順列ネットワークは、オブジェクト境界ボックス検出とインスタンスセグメンテーションに有望な結果を示した。
本研究では,このセマンティックセグメンテーションのメタアーキテクチャ設計を評価する。
我々は,DeepLabv3システムからNASによって発見されたネットワークであるSpineNet-Segを提案する。
論文 参考訳(メタデータ) (2021-03-23T02:39:04Z) - Efficient-CapsNet: Capsule Network with Self-Attention Routing [0.0]
深層畳み込みニューラルネットワークは、オブジェクト変換を埋め込むために、多数の機能マップを持つデータ拡張技術とレイヤを広範囲に活用する。
カプセルネットワークは、現在の畳み込みネットワークを拡張し、より効率的に全てのアフィン変換をエンコードするプロセスで人工的な視覚知覚を実現する、有望なソリューションである。
本稿では,カプセルネットワークの効率について検討し,その容量を160Kのパラメータをほとんど持たない極端なアーキテクチャで限界まで押し上げることにより,提案アーキテクチャがまだ最先端の結果が得られることを実証する。
論文 参考訳(メタデータ) (2021-01-29T09:56:44Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z) - ReActNet: Towards Precise Binary Neural Network with Generalized
Activation Functions [76.05981545084738]
本稿では,新たな計算コストを伴わずに,実数値ネットワークからの精度ギャップを埋めるため,バイナリネットワークを強化するためのいくつかのアイデアを提案する。
まず,パラメータフリーのショートカットを用いて,コンパクトな実数値ネットワークを修正・バイナライズすることで,ベースラインネットワークを構築する。
提案したReActNetはすべての最先端技術よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2020-03-07T02:12:02Z) - Convolutional Networks with Dense Connectivity [59.30634544498946]
Dense Convolutional Network (DenseNet)を導入し、フィードフォワード方式で各レイヤを他のすべてのレイヤに接続する。
各レイヤについて、先行するすべてのレイヤのフィーチャーマップをインプットとして使用し、それ自身のフィーチャーマップをその後のすべてのレイヤへのインプットとして使用します。
提案したアーキテクチャを、4つの高度に競争力のあるオブジェクト認識ベンチマークタスクで評価する。
論文 参考訳(メタデータ) (2020-01-08T06:54:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。