論文の概要: Greenhouse Segmentation on High-Resolution Optical Satellite Imagery
using Deep Learning Techniques
- arxiv url: http://arxiv.org/abs/2007.11222v1
- Date: Wed, 22 Jul 2020 06:12:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 23:24:35.936589
- Title: Greenhouse Segmentation on High-Resolution Optical Satellite Imagery
using Deep Learning Techniques
- Title(参考訳): 深層学習技術を用いた高解像度光衛星画像の温室分離
- Authors: Orkhan Baghirli, Imran Ibrahimli, and Tarlan Mammadzada
- Abstract要約: 本稿では,光衛星アゼルスキー (SPOT-7) が取得した画像の画素ワイズ分類のための音響手法を提案する。
U-Netのようなアーキテクチャのカスタマイズされたバリエーションは、温室を特定するために使用される。
拡張畳み込みとスキップ接続を独自に組み込んだ2つのモデルが提案されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Greenhouse segmentation has pivotal importance for climate-smart agricultural
land-use planning. Deep learning-based approaches provide state-of-the-art
performance in natural image segmentation. However, semantic segmentation on
high-resolution optical satellite imagery is a challenging task because of the
complex environment. In this paper, a sound methodology is proposed for
pixel-wise classification on images acquired by the Azersky (SPOT-7) optical
satellite. In particular, customized variations of U-Net-like architectures are
employed to identify greenhouses. Two models are proposed which uniquely
incorporate dilated convolutions and skip connections, and the results are
compared to that of the baseline U-Net model. The dataset used consists of
pan-sharpened orthorectified Azersky images (red, green, blue,and near infrared
channels) with 1.5-meter resolution and annotation masks, collected from 15
regions in Azerbaijan where the greenhouses are densely congested. The images
cover the cumulative area of 1008 $km^2$ and annotation masks contain 47559
polygons in total. The $F_1, Kappa, AUC$, and $IOU$ scores are used for
performance evaluation. It is observed that the use of the deconvolutional
layers alone throughout the expansive path does not yield satisfactory results;
therefore, they are either replaced or coupled with bilinear interpolation. All
models benefit from the hard example mining (HEM) strategy. It is also reported
that the best accuracy of $93.29\%$ ($F_1\,score$) is recorded when the
weighted binary cross-entropy loss is coupled with the dice loss. Experimental
results showed that both of the proposed models outperformed the baseline U-Net
architecture such that the best model proposed scored $4.48\%$ higher in
comparison to the baseline architecture.
- Abstract(参考訳): 温室栽培は気候に配慮した土地利用計画において重要な役割を担っている。
ディープラーニングに基づくアプローチは、自然な画像セグメンテーションにおける最先端のパフォーマンスを提供する。
しかし,高分解能衛星画像におけるセマンティクスセグメンテーションは複雑な環境のため難しい課題である。
本稿では,光衛星アゼルスキー (SPOT-7) が取得した画像の画素単位の分類法を提案する。
特に、u-netライクなアーキテクチャのカスタマイズされたバリエーションが温室の識別に使われている。
拡張畳み込みとスキップ接続を独自に組み込んだ2つのモデルを提案し,その結果をベースラインu-netモデルと比較した。
使用したデータセットは、温室が密集しているアゼルバイジャンの15の地域から収集された、1.5メートルの解像度とアノテーションマスクを備えた、パンシャーペンで修正されたアゼルスキー画像(赤、緑、青、近赤外チャネル)で構成されている。
画像は累積面積1008ドル^2$、アノテーションマスクは合計47559個のポリゴンを含んでいる。
F_1, Kappa, AUC$, $IOU$スコアはパフォーマンス評価に使用される。
展開経路全体では, 脱畳畳み込み層を単独で使用すると, 良好な結果が得られず, 両線形補間に置き換えるか, 結合するかのどちらかが観察される。
すべてのモデルはハード・サンプル・マイニング(HEM)戦略の恩恵を受ける。
また、重み付きバイナリクロスエントロピー損失とサイコロ損失が結合された場合に、9,3.29\%(F_1\,score$)の最良の精度を記録することも報告されている。
実験の結果、提案したモデルがベースラインのU-Netアーキテクチャより優れており、ベースラインのアーキテクチャと比較して最良のモデルの方が4.48\%高い結果が得られた。
関連論文リスト
- A Simple and Generalist Approach for Panoptic Segmentation [57.94892855772925]
汎用的なビジョンモデルは、様々なビジョンタスクのための1つの同じアーキテクチャを目指している。
このような共有アーキテクチャは魅力的に思えるかもしれないが、ジェネラリストモデルは、その好奇心に満ちたモデルよりも優れている傾向にある。
一般モデルの望ましい性質を損なうことなく、2つの重要なコントリビューションを導入することでこの問題に対処する。
論文 参考訳(メタデータ) (2024-08-29T13:02:12Z) - Evaluation of Deep Learning Semantic Segmentation for Land Cover Mapping on Multispectral, Hyperspectral and High Spatial Aerial Imagery [0.0]
気候変動の台頭で、土地被覆マッピングは環境モニタリングにおいて緊急に必要となってきた。
本研究では,Unet,Linknet,FPN,PSPnetなどのセマンティックセグメンテーション手法を用いて植生や水などの分類を行った。
LinkNetモデルは、すべてのデータセットで0.92の精度でIoUで取得した。
論文 参考訳(メタデータ) (2024-06-20T11:40:12Z) - Combining UPerNet and ConvNeXt for Contrails Identification to reduce
Global Warming [0.0]
本研究は,地球規模の衛星画像における航空機のコントラル検出に着目し,コントラルモデルの改善と気候変動への影響を緩和する。
NOAA GOES-16衛星画像のための革新的なデータ前処理技術を開発した。
クラス不均衡に取り組むために、トレーニングデータセットは、正の反則ラベルを持つイメージのみを含む。
論文 参考訳(メタデータ) (2023-10-07T13:59:05Z) - Enhanced Sharp-GAN For Histopathology Image Synthesis [63.845552349914186]
病理組織像合成は、正確ながん検出のためのディープラーニングアプローチの訓練において、データ不足の問題に対処することを目的としている。
核トポロジと輪郭正則化を用いて合成画像の品質を向上させる新しい手法を提案する。
提案手法は、Sharp-GANを2つのデータセット上の4つの画像品質指標すべてで上回る。
論文 参考訳(メタデータ) (2023-01-24T17:54:01Z) - A Strategy Optimized Pix2pix Approach for SAR-to-Optical Image
Translation Task [0.9176056742068814]
マルチモーダル・ラーニング・フォー・アース・アース・チャレンジ(MultiEarth 2022)における画像と画像の翻訳タスクの分析とアプローチについて要約する。
戦略最適化の観点では、クラウド分類は、教師あり学習のようなアプローチを支援するために、濃密なクラウドカバレッジを持つ光学画像のフィルタリングに利用される。
その結果,リモートセンシングタスクにおけるSAR-to-optical Translationへの大きな可能性,特に長期環境モニタリングと保護の支援が示唆された。
論文 参考訳(メタデータ) (2022-06-27T04:41:37Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文 参考訳(メタデータ) (2021-11-12T16:45:20Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Aggregated Contextual Transformations for High-Resolution Image
Inpainting [57.241749273816374]
画像の高精細化のための拡張GANモデルAggregated Contextual-Transformation GAN (AOT-GAN)を提案する。
そこで,提案するAOTブロックの複数のレイヤを積み重ねることで,AOT-GANのジェネレータを構築する。
テクスチャ合成を改善するため,AOT-GANの識別をマスク予測タスクでトレーニングすることで強化する。
論文 参考訳(メタデータ) (2021-04-03T15:50:17Z) - Road Segmentation for Remote Sensing Images using Adversarial Spatial
Pyramid Networks [28.32775611169636]
合成画像生成と道路分割に構造化領域適応を適用した新しいモデルを提案する。
マルチレベルの特徴マップから学び、特徴のセマンティクスを改善するために、新しいスケールワイズアーキテクチャが導入された。
我々のモデルは、14.89Mパラメータと86.78B FLOPを持つマサチューセッツのデータセット上で、最先端の78.86 IOUを達成し、4倍少ないFLOPを持つが、より高精度(+3.47% IOU)である。
論文 参考訳(メタデータ) (2020-08-10T11:00:19Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。