論文の概要: Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images
- arxiv url: http://arxiv.org/abs/2111.06812v1
- Date: Fri, 12 Nov 2021 16:45:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 14:22:31.425777
- Title: Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images
- Title(参考訳): Sci-Net:空中画像からの建物検出のためのスケール不変モデル
- Authors: Hasan Nasrallah, Ali J. Ghandour
- Abstract要約: 本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Buildings' segmentation is a fundamental task in the field of earth
observation and aerial imagery analysis. Most existing deep learning based
algorithms in the literature can be applied on fixed or narrow-ranged spatial
resolution imagery. In practical scenarios, users deal with a wide spectrum of
images resolution and thus, often need to resample a given aerial image to
match the spatial resolution of the dataset used to train the deep learning
model. This however, would result in a severe degradation in the quality of the
output segmentation masks. To deal with this issue, we propose in this research
a Scale-invariant neural network (Sci-Net) that is able to segment buildings
present in aerial images at different spatial resolutions. Specifically, we
modified the U-Net architecture and fused it with dense Atrous Spatial Pyramid
Pooling (ASPP) to extract fine-grained multi-scale representations. We compared
the performance of our proposed model against several state of the art models
on the Open Cities AI dataset, and showed that Sci-Net provides a steady
improvement margin in performance across all resolutions available in the
dataset.
- Abstract(参考訳): 建物のセグメンテーションは、地球観測と空中画像解析の分野における基本的な課題である。
文献中の既存のディープラーニングベースのアルゴリズムのほとんどは、固定あるいは狭い空間解像度画像に適用することができる。
実際のシナリオでは、ユーザーは幅広い画像解像度を扱うため、深層学習モデルのトレーニングに使用されるデータセットの空間解像度に合わせて、与えられた空中画像を再サンプリングする必要があることが多い。
しかし、これは出力セグメンテーションマスクの品質が著しく低下する結果となる。
そこで本研究では,空間分解能の異なる空中画像に存在する建物をセグメント化できるsci-net(scale-invariant neural network)を提案する。
具体的には,U-Netアーキテクチャを改良し,高密度のAtrous Space Pyramid Pooling (ASPP) と融合し,微細なマルチスケール表現を抽出した。
提案モデルの性能を,オープンシティaiデータセットにおけるアートモデルのいくつかの状態と比較し,sci-netがデータセットで利用可能なすべての解像度において,一定のパフォーマンス向上率を提供することを示した。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Joint Learning of Deep Texture and High-Frequency Features for
Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。
セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。
原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文 参考訳(メタデータ) (2022-09-07T17:30:40Z) - Progressive Domain Adaptation with Contrastive Learning for Object
Detection in the Satellite Imagery [0.0]
最先端のオブジェクト検出手法は、小さくて密度の高いオブジェクトを特定するのにほとんど失敗している。
本稿では,特徴抽出プロセスを改善する小型物体検出パイプラインを提案する。
未確認データセットにおけるオブジェクト識別の劣化を緩和できることを示す。
論文 参考訳(メタデータ) (2022-09-06T15:16:35Z) - Exploiting Digital Surface Models for Inferring Super-Resolution for
Remotely Sensed Images [2.3204178451683264]
本稿では,SRRモデルにリアルなリモートセンシング画像の出力を強制する新しい手法を提案する。
画像の通常のデジタル表面モデル(nDSM)から推定されるピクセルレベルの情報を知覚的損失として特徴空間の類似性に頼る代わりに、モデルが考慮する。
視覚検査に基づいて、推定された超解像画像は、特に優れた品質を示す。
論文 参考訳(メタデータ) (2022-05-09T06:02:50Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - SaNet: Scale-aware neural Network for Parsing Multiple Spatial
Resolution Aerial Images [0.0]
複数空間分解能空中画像解析のためのスケールアウェアニューラルネットワーク (SaNet) を提案する。
スケール変動による大小のオブジェクト間の不均衡なセグメンテーション品質に対処するため、SaNetは密に接続されたフィーチャーネットワーク(DCFPN)モジュールを展開します。
情報的特徴損失を軽減するため、SFRモジュールをネットワークに組み込み、空間的関係強化を伴うスケール不変の特徴を学習する。
論文 参考訳(メタデータ) (2021-03-14T14:19:46Z) - Boundary Regularized Building Footprint Extraction From Satellite Images
Using Deep Neural Network [6.371173732947292]
本稿では,1つの衛星画像から構築事例を共同で検出し,ノイズの多い建物の境界形状を規則化する,新しいディープニューラルネットワークを提案する。
本モデルでは,オブジェクトの局所化,認識,セマンティックラベリング,幾何学的形状抽出を同時に行うことができる。
論文 参考訳(メタデータ) (2020-06-23T17:24:09Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。