論文の概要: MKANet: A Lightweight Network with Sobel Boundary Loss for Efficient
Land-cover Classification of Satellite Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2207.13866v1
- Date: Thu, 28 Jul 2022 03:29:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-29 12:29:29.268769
- Title: MKANet: A Lightweight Network with Sobel Boundary Loss for Efficient
Land-cover Classification of Satellite Remote Sensing Imagery
- Title(参考訳): MKANet:衛星リモートセンシング画像の効率的な土地被覆分類のためのソベル境界損失付き軽量ネットワーク
- Authors: Zhiqi Zhang, Wen Lu, Jinshan Cao, Guangqi Xie
- Abstract要約: ランドカバー分類は、各ピクセルを地球表面の特定の自然または人工のカテゴリに分類するマルチクラスタスクである。
我々は、MKANetと呼ばれる効率的な軽量セマンティックセグメンテーションネットワークを提案する。
MKANetは2つの土地被覆分類データセットの最先端の精度を取得し、他の競合する軽量ネットワークよりも2倍高速に推定できることを示す。
- 参考スコア(独自算出の注目度): 15.614937709070203
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Land cover classification is a multi-class segmentation task to classify each
pixel into a certain natural or man-made category of the earth surface, such as
water, soil, natural vegetation, crops, and human infrastructure. Limited by
hardware computational resources and memory capacity, most existing studies
preprocessed original remote sensing images by down sampling or cropping them
into small patches less than 512*512 pixels before sending them to a deep
neural network. However, down sampling images incurs spatial detail loss,
renders small segments hard to discriminate, and reverses the spatial
resolution progress obtained by decades of years of efforts. Cropping images
into small patches causes a loss of long-range context information, and
restoring the predicted results to their original size brings extra latency. In
response to the above weaknesses, we present an efficient lightweight semantic
segmentation network termed MKANet. Aimed at the characteristics of top view
high-resolution remote sensing imagery, MKANet utilizes sharing kernels to
simultaneously and equally handle ground segments of inconsistent scales, and
also employs parallel and shallow architecture to boost inference speed and
friendly support image patches more than 10X larger. To enhance boundary and
small segments discrimination, we also propose a method that captures category
impurity areas, exploits boundary information and exerts an extra penalty on
boundaries and small segment misjudgment. Both visual interpretations and
quantitative metrics of extensive experiments demonstrate that MKANet acquires
state-of-the-art accuracy on two land-cover classification datasets and infers
2X faster than other competitive lightweight networks. All these merits
highlight the potential of MKANet in practical applications.
- Abstract(参考訳): 土地被覆分類は、各ピクセルを水、土壌、自然植生、作物、人間のインフラなど、地球表面の特定の自然または人工のカテゴリーに分類する多クラス区分作業である。
ハードウェアの計算資源とメモリ容量に制限され、既存の研究のほとんどは、深層ニューラルネットワークに送信する前に、512*512ピクセル未満の小さなパッチにサンプリングまたはトリミングすることで、オリジナルのリモートセンシングイメージを前処理した。
しかし、画像のダウンサンプリングは空間的詳細損失を引き起こし、小さなセグメントを識別しにくくし、数十年の努力によって得られた空間分解能の進歩を逆転させる。
イメージを小さなパッチに分割すると、長距離のコンテキスト情報が失われ、予測結果が元のサイズに復元されるため、レイテンシが増大する。
上記の弱点に対応するために、MKANetと呼ばれる効率的な軽量セマンティックセグメンテーションネットワークを提案する。
トップビューの高解像度リモートセンシング画像の特徴を考慮し、MKANetはカーネルの共有を利用して、一貫性のないスケールのグラウンドセグメントを同時に均等に扱うとともに、推論速度とフレンドリーなサポートイメージパッチを10倍以上に向上させるために、並列および浅層アーキテクチャを採用している。
境界と小セグメントの識別を強化するために, カテゴリー不純物領域を捕捉し, 境界情報を活用し, 境界と小セグメントの判断に余分なペナルティを課す手法を提案する。
MKANetは2つの土地被覆分類データセットの最先端の精度を取得し、他の競合する軽量ネットワークよりも2倍高速に推定することを示した。
これらすべてのメリットは、実用アプリケーションにおけるMKANetの可能性を強調している。
関連論文リスト
- SaccadeDet: A Novel Dual-Stage Architecture for Rapid and Accurate Detection in Gigapixel Images [50.742420049839474]
SaccadeDetは、人間の目の動きにインスパイアされた、ギガピクセルレベルの物体検出のための革新的なアーキテクチャである。
PANDAデータセットを用いて評価した本手法は,最先端手法の8倍の高速化を実現する。
また、全スライドイメージングへの応用を通じて、ギガピクセルレベルの病理解析に有意な可能性を示す。
論文 参考訳(メタデータ) (2024-07-25T11:22:54Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Dense Siamese Network [86.23741104851383]
本稿では,Dense Siamese Network(DenseSiam)を提案する。
画像の2つのビュー間の類似性を最大化し、ピクセルの一貫性と領域の一貫性という2種類の一貫性を学習する。
最先端のセグメンテーション手法を2.1 mIoUで28%のトレーニングコストで上回っている。
論文 参考訳(メタデータ) (2022-03-21T15:55:23Z) - Learning Neural Light Fields with Ray-Space Embedding Networks [51.88457861982689]
我々は、コンパクトで、光線に沿った統合放射率を直接予測する新しいニューラル光場表現を提案する。
提案手法は,Stanford Light Field データセットのような,高密度の前方向きデータセットの最先端品質を実現する。
論文 参考訳(メタデータ) (2021-12-02T18:59:51Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - A Novel Upsampling and Context Convolution for Image Semantic
Segmentation [0.966840768820136]
最近のセマンティックセグメンテーションの方法は、しばしば深い畳み込みニューラルネットワークを用いたエンコーダデコーダ構造を採用している。
ネットワーク内の画像の空間情報を効率的に保存するために,ガイドフィルタに基づく高密度アップサンプリング畳み込み法を提案する。
ADE20KとPascal-Contextのベンチマークデータセットでは,それぞれ82.86%,81.62%の画素精度を記録した。
論文 参考訳(メタデータ) (2021-03-20T06:16:42Z) - An Empirical Method to Quantify the Peripheral Performance Degradation
in Deep Networks [18.808132632482103]
畳み込みニューラルネットワーク(CNN)カーネルは、各畳み込み層に結合する。
より深いネットワークとストライドベースのダウンサンプリングを組み合わせることで、この領域の伝播は、画像の無視できない部分をカバーすることができる。
我々のデータセットは、高解像度の背景にオブジェクトを挿入することで構築され、画像境界に対してターゲットオブジェクトを特定の位置に配置するサブイメージを収穫することができる。
マスクR-CNNの動作を目標位置の選択にわたって探索することにより、画像境界付近、特に画像コーナーにおいて、パフォーマンス劣化の明確なパターンが明らかになる。
論文 参考訳(メタデータ) (2020-12-04T18:00:47Z) - High Quality Remote Sensing Image Super-Resolution Using Deep Memory
Connected Network [21.977093907114217]
単一画像の超解像は、ターゲット検出や画像分類といった多くの用途において重要である。
本稿では,畳み込みニューラルネットワークによる高画質超解像画像の再構成手法として,DeepMemory Connected Network (DMCN)を提案する。
論文 参考訳(メタデータ) (2020-10-01T15:06:02Z) - Multi-scale Cloud Detection in Remote Sensing Images using a Dual
Convolutional Neural Network [4.812718493682455]
CNNは、リモートセンシング画像のピクセルレベルの分類において、最先端の技術を進歩させた。
アンサンプとフル解像度の画像を逐次処理する2つのCNNモデルコンポーネントのアーキテクチャを提案する。
パッチによるCNNベースラインの画素精度は16%向上した。
論文 参考訳(メタデータ) (2020-06-01T10:27:42Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。