論文の概要: PP-LinkNet: Improving Semantic Segmentation of High Resolution Satellite
Imagery with Multi-stage Training
- arxiv url: http://arxiv.org/abs/2010.06932v1
- Date: Wed, 14 Oct 2020 10:23:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 13:12:16.699241
- Title: PP-LinkNet: Improving Semantic Segmentation of High Resolution Satellite
Imagery with Multi-stage Training
- Title(参考訳): PP-LinkNet:多段訓練による高解像度衛星画像のセマンティックセグメンテーションの改善
- Authors: An Tran, Ali Zonoozi, Jagannadan Varadarajan, Hannes Kruppa
- Abstract要約: 道路網と建築物のフットプリント抽出は、地図の更新、交通規制、都市計画、ライドシェアリング、災害対応テキストテットックなど、多くのアプリケーションにとって不可欠である。
- 参考スコア(独自算出の注目度): 4.694536172504848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Road network and building footprint extraction is essential for many
applications such as updating maps, traffic regulations, city planning,
ride-hailing, disaster response \textit{etc}. Mapping road networks is
currently both expensive and labor-intensive. Recently, improvements in image
segmentation through the application of deep neural networks has shown
promising results in extracting road segments from large scale, high resolution
satellite imagery. However, significant challenges remain due to lack of enough
labeled training data needed to build models for industry grade applications.
In this paper, we propose a two-stage transfer learning technique to improve
robustness of semantic segmentation for satellite images that leverages noisy
pseudo ground truth masks obtained automatically (without human labor) from
crowd-sourced OpenStreetMap (OSM) data. We further propose Pyramid
Pooling-LinkNet (PP-LinkNet), an improved deep neural network for segmentation
that uses focal loss, poly learning rate, and context module. We demonstrate
the strengths of our approach through evaluations done on three popular
datasets over two tasks, namely, road extraction and building foot-print
detection. Specifically, we obtain 78.19\% meanIoU on SpaceNet building
footprint dataset, 67.03\% and 77.11\% on the road topology metric on SpaceNet
and DeepGlobe road extraction dataset, respectively.
- Abstract(参考訳): 道路網と建物の足跡抽出は、地図の更新、交通規制、都市計画、配車、災害対応 \textit{etc} など、多くのアプリケーションで不可欠である。
道路網のマッピングは、現在高価かつ労働集約的である。
近年,深層ニューラルネットワークの適用による画像分割の改善により,大規模高解像度衛星画像からの道路セグメント抽出に有望な結果が得られた。
しかし、業界グレードアプリケーションのモデル構築に必要な十分なラベル付きトレーニングデータが不足しているため、大きな課題が残っている。
本稿では,クラウドソースのOpenStreetMap(OSM)データから得られるノイズの多い擬似地中真実マスク(人的負担なしで)を活用する衛星画像のセマンティックセマンティックセマンティックセマンティクスの堅牢性を向上させるための2段階のトランスファー学習手法を提案する。
さらに、焦点損失、ポリラーニングレート、コンテキストモジュールを用いたセグメンテーションのための改良されたディープニューラルネットワークであるPraamid Pooling-LinkNet(PP-LinkNet)を提案する。
提案手法の強みは,2つの課題,すなわち道路抽出と足跡検出による3つの人気データセットの評価を通じて実証する。
具体的には、SpaceNet構築フットプリントデータセットで78.19\%の平均IoU、SpaceNetとDeepGlobe道路抽出データセットで67.03\%、77.11\%を得る。
関連論文リスト
- DeepTriNet: A Tri-Level Attention Based DeepLabv3+ Architecture for
Semantic Segmentation of Satellite Images [0.0]
本研究では,衛星画像のセマンティックセグメンテーションのための3レベルアテンションに基づくDeepLabv3+アーキテクチャ(DeepTriNet)を提案する。
提案手法は, 圧縮・励起ネットワーク (SENets) とトリレベルアテンションユニット (TAUs) をバニラのDeepLabv3+アーキテクチャと組み合わせたものである。
提案したDeepTriNetは、精度が98%と77%、IoU 80%と58%、精度が88%と68%で、それぞれ4クラスのLand-Cover.aiデータセットと15クラスのGID-2データセットで79%と55%のリコールで、従来の多くの手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-05T18:35:34Z) - PaRK-Detect: Towards Efficient Multi-Task Satellite Imagery Road
Extraction via Patch-Wise Keypoints Detection [12.145321599949236]
我々は、マルチタスク衛星画像道路抽出のための新しい手法、パッチワイド道路キーポイント検出(PaRK-Detect)を提案する。
筆者らのフレームワークは,パッチワイド道路キーポイントの位置と,それら間の近接関係を予測し,道路グラフを単一パスで構築する。
我々は,DeepGlobe, Massachusetts Roads, RoadTracerの既存の最先端手法に対するアプローチを評価し,競争力やより良い結果を得る。
論文 参考訳(メタデータ) (2023-02-26T08:26:26Z) - MultiScale Probability Map guided Index Pooling with Attention-based
learning for Road and Building Segmentation [18.838213902873616]
MSSDMPA-Net(Multi-Scale Supervised Dilated Multiple-Path Attention Network)を提案する。
MSSDMPA-NetはDAMIP(Dynamic Attention Map Guided Index Pooling)とDAMSCA(Dynamic Attention Map Guided Spatial and Channel Attention)という2つの新しいモジュールを備えている。
論文 参考訳(メタデータ) (2023-02-18T19:57:25Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z) - SPIN Road Mapper: Extracting Roads from Aerial Images via Spatial and
Interaction Space Graph Reasoning for Autonomous Driving [64.10636296274168]
道路抽出は、自律航法システムを構築するための重要なステップである。
この問題に対して単に畳み込みニューラルネットワーク(ConvNets)を使用することは、画像内の道路セグメント間の遠い依存関係をキャプチャする非効率であるため、効果がない。
本研究では,ConvNetに接続した時,特徴写像から投影された空間空間および相互作用空間上に構築されたグラフの推論を行う空間空間グラフ推論(SPIN)モジュールを提案する。
論文 参考訳(メタデータ) (2021-09-16T03:52:17Z) - DeepSatData: Building large scale datasets of satellite images for
training machine learning models [77.17638664503215]
本稿では,機械学習モデルの学習のための衛星画像データセットの自動生成のための設計検討を行う。
本稿では,ニューラルネットワークの深層学習と評価の観点から直面する課題について論じる。
論文 参考訳(メタデータ) (2021-04-28T15:13:12Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - Scribble-based Weakly Supervised Deep Learning for Road Surface
Extraction from Remote Sensing Images [7.1577508803778045]
そこで我々は,ScRoadExtractor という,スクリブルに基づく弱制御路面抽出手法を提案する。
スパーススクリブルからラベルなし画素への意味情報を伝達するために,道路ラベルの伝搬アルゴリズムを導入する。
道路ラベル伝搬アルゴリズムから生成された提案マスクを用いて、デュアルブランチエンコーダデコーダネットワークを訓練する。
論文 参考訳(メタデータ) (2020-10-25T12:40:30Z) - DiResNet: Direction-aware Residual Network for Road Extraction in VHR
Remote Sensing Images [12.081877372552606]
主に3つのコントリビューションを含む方向対応残差ネットワーク(DiResNet)を提案する。
提案手法は総合精度とF1スコアの両方に利点がある。
論文 参考訳(メタデータ) (2020-05-14T19:33:21Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。