論文の概要: BuildSeg: A General Framework for the Segmentation of Buildings
- arxiv url: http://arxiv.org/abs/2301.06190v1
- Date: Sun, 15 Jan 2023 21:09:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 16:52:26.639240
- Title: BuildSeg: A General Framework for the Segmentation of Buildings
- Title(参考訳): BuildSeg: 建物のセグメンテーションのための一般的なフレームワーク
- Authors: Lei Li, Tianfang Zhang, Stefan Oehmcke, Fabian Gieseke, Christian Igel
- Abstract要約: 空中画像と3Dレーザースキャン(LiDAR)からのセグメンテーションの構築は,背景の多様性,建築テクスチャ,画質の面で難しい課題である。
本稿では,セグメント構造に迅速に適用可能な汎用的なアプローチを用いて,emphBuildSegという汎用フレームワークを提案する。
- 参考スコア(独自算出の注目度): 19.296282254565885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building segmentation from aerial images and 3D laser scanning (LiDAR) is a
challenging task due to the diversity of backgrounds, building textures, and
image quality. While current research using different types of convolutional
and transformer networks has considerably improved the performance on this
task, even more accurate segmentation methods for buildings are desirable for
applications such as automatic mapping. In this study, we propose a general
framework termed \emph{BuildSeg} employing a generic approach that can be
quickly applied to segment buildings. Different data sources were combined to
increase generalization performance. The approach yields good results for
different data sources as shown by experiments on high-resolution
multi-spectral and LiDAR imagery of cities in Norway, Denmark and France. We
applied ConvNeXt and SegFormer based models on the high resolution aerial image
dataset from the MapAI-competition. The methods achieved an IOU of 0.7902 and a
boundary IOU of 0.6185. We used post-processing to account for the rectangular
shape of the objects. This increased the boundary IOU from 0.6185 to 0.6189.
- Abstract(参考訳): 空中画像と3Dレーザースキャン(LiDAR)からのセグメンテーションの構築は,背景の多様性,建築テクスチャ,画質の面で難しい課題である。
様々な種類の畳み込みネットワークとトランスフォーマーネットワークを用いた最近の研究は、このタスクの性能を大幅に向上させたが、自動マッピングのようなアプリケーションでは、より正確な建物のセグメンテーション方法が望ましい。
本研究では,セグメントビルディングに迅速に適用可能な汎用的なアプローチを用いた汎用フレームワークである \emph{buildseg} を提案する。
異なるデータソースが組み合わされ、一般化性能が向上した。
このアプローチは、ノルウェー、デンマーク、フランスの都市の高解像度マルチスペクトルおよびLiDAR画像の実験で示されているように、異なるデータソースに対して良い結果をもたらす。
我々は,MapAIコンペティションによる高解像度空中画像データセットに基づいて,ConvNeXtとSegFormerに基づくモデルを適用した。
この方法は0.7902のIOUと0.6185の境界IOUを達成した。
対象物の長方形を考慮した後処理を用いた。
これにより IOU は 0.6185 から 0.6189 に増加した。
関連論文リスト
- MLMT-CNN for Object Detection and Segmentation in Multi-layer and Multi-spectral Images [4.2623421577291225]
画像バンド間の依存関係を利用して3次元ARローカライゼーションを生成するマルチタスク深層学習フレームワークを提案する。
我々のフレームワークは、すべてのモードで平均0.72 IoUと0.90 F1スコアを達成する。
論文 参考訳(メタデータ) (2024-07-19T17:21:53Z) - Real-Time Image Segmentation via Hybrid Convolutional-Transformer Architecture Search [49.81353382211113]
マルチヘッド自己認識を高分解能表現CNNに効率的に組み込むという課題に対処する。
本稿では,高解像度機能の利点をフル活用したマルチターゲットマルチブランチ・スーパーネット手法を提案する。
本稿では,Hybrid Convolutional-Transformer Architecture Search (HyCTAS)法を用いて,軽量畳み込み層とメモリ効率のよい自己保持層を最適に組み合わせたモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T15:47:54Z) - Simple and Effective Synthesis of Indoor 3D Scenes [78.95697556834536]
1枚以上の画像から3D屋内シーンを没入する問題について検討する。
我々の狙いは、新しい視点から高解像度の画像とビデオを作成することである。
本稿では,不完全点雲の再投影から高解像度のRGB-D画像へ直接マップするイメージ・ツー・イメージのGANを提案する。
論文 参考訳(メタデータ) (2022-04-06T17:54:46Z) - Panoptic SwiftNet: Pyramidal Fusion for Real-time Panoptic Segmentation [0.0]
多くのアプリケーションは、安価なハードウェアや組み込みハードウェアの大規模な入力解像度よりも高速な推論を必要とする。
マルチスケール特徴抽出のためのバックボーン容量をトレードオフすることで,この目標を達成することを提案する。
本稿では,Cityscapes,Vistas,COCO,BSB-Aerialデータセットについてパノラマ実験を行った。
論文 参考訳(メタデータ) (2022-03-15T13:47:40Z) - Boosting Robustness of Image Matting with Context Assembling and Strong
Data Augmentation [83.31087402305306]
トリマップへのロバストさと、異なる領域の画像への一般化はまだ未定である。
マルチレベルコンテキストアッセンブルと強力なデータ拡張により高ロバスト性(RMat)を実現する画像マッチング手法を提案する。
論文 参考訳(メタデータ) (2022-01-18T11:45:17Z) - Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文 参考訳(メタデータ) (2021-11-12T16:45:20Z) - Continental-Scale Building Detection from High Resolution Satellite
Imagery [5.56205296867374]
アーキテクチャ,損失関数,正規化,事前学習,自己学習,後処理のバリエーションについて検討し,インスタンスセグメンテーション性能を向上する。
アフリカ全土の100万枚の衛星画像のデータセットを用いて、手動でラベル付けされた建築事例を含む実験が行われた。
本稿では,このモデルを用いた建物検出の性能向上のための新しい手法について報告する。
論文 参考訳(メタデータ) (2021-07-26T15:48:14Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - Object Detection in Aerial Images: A Large-Scale Benchmark and
Challenges [124.48654341780431]
航空画像(DOTA)におけるオブジェクトデテクションの大規模データセットとODAIの総合的ベースラインについて述べる。
提案するDOTAデータセットは,11,268個の空中画像から収集した18カテゴリのオブジェクト指向ボックスアノテーションの1,793,658個のオブジェクトインスタンスを含む。
70以上の構成を持つ10の最先端アルゴリズムをカバーするベースラインを構築し,各モデルの速度と精度を評価した。
論文 参考訳(メタデータ) (2021-02-24T11:20:55Z) - Contextual Pyramid Attention Network for Building Segmentation in Aerial
Imagery [12.241693880896348]
航空画像からの抽出は、都市計画、変更検出、災害管理といった問題にいくつかの応用がある。
コンテキストピラミッドアテンション(CPA)を用いた長距離依存関係のキャプチャにより,異なるサイズのセグメンテーションを改善することを提案する。
提案手法は,現在の最先端手法よりも1.8点,既存のベースラインよりも12.6点高い1.8点を後処理なしで改善する。
論文 参考訳(メタデータ) (2020-04-15T11:36:26Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。