論文の概要: Geometry-Aware Segmentation of Remote Sensing Images via Implicit Height
Estimation
- arxiv url: http://arxiv.org/abs/2006.05848v2
- Date: Tue, 22 Sep 2020 01:48:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:49:49.659886
- Title: Geometry-Aware Segmentation of Remote Sensing Images via Implicit Height
Estimation
- Title(参考訳): 入射高さ推定によるリモートセンシング画像の幾何学的セグメンテーション
- Authors: Xiang Li, Lingjing Wang, Yi Fang
- Abstract要約: 航空画像の正確なセマンティックラベリングを関節高さ推定により達成する幾何認識セグメンテーションモデルを提案する。
本研究では,ハイトデコーダ分岐から3次元幾何学的特徴とセマンティックセグメンテーション分岐から2次元文脈的特徴を融合した新しい幾何学的認識型畳み込みモジュールを開発する。
提案したモデルでは,手作りの機能や後処理を使わずに,両方のデータセットで顕著なパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 15.900382629390297
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies have shown the benefits of using additional elevation data
(e.g., DSM) for enhancing the performance of the semantic segmentation of
aerial images. However, previous methods mostly adopt 3D elevation information
as additional inputs. While in many real-world applications, one does not have
the corresponding DSM information at hand and the spatial resolution of
acquired DSM images usually do not match the aerial images. To alleviate this
data constraint and also take advantage of 3D elevation information, in this
paper, we introduce a geometry-aware segmentation model that achieves accurate
semantic labeling of aerial images via joint height estimation. Instead of
using a single-stream encoder-decoder network for semantic labeling, we design
a separate decoder branch to predict the height map and use the DSM images as
side supervision to train this newly designed decoder branch. In this way, our
model does not require DSM as model input and still benefits from the helpful
3D geometric information during training. Moreover, we develop a new
geometry-aware convolution module that fuses the 3D geometric features from the
height decoder branch and the 2D contextual features from the semantic
segmentation branch. The fused feature embeddings can produce geometry-aware
segmentation maps with enhanced performance. Our model is trained with DSM
images as side supervision, while in the inference stage, it does not require
DSM data and directly predicts the semantic labels in an end-to-end fashion.
Experiments on ISPRS Vaihingen and Potsdam datasets demonstrate the
effectiveness of the proposed method for the semantic segmentation of aerial
images. The proposed model achieves remarkable performance on both datasets
without using any hand-crafted features or post-processing.
- Abstract(参考訳): 最近の研究では、空中画像のセマンティックセグメンテーションの性能を高めるために追加の標高データ(例えばDSM)を使用することの利点が示されている。
しかし、従来の方法は3次元標高情報を付加的な入力として採用することが多い。
多くの実世界のアプリケーションでは、対応するDSM情報を手元に持っておらず、取得したDSM画像の空間分解能は、通常、空中画像と一致しない。
本稿では,このデータ制約を緩和し,かつ3次元標高情報を活用するために,高度推定による空中画像の正確な意味ラベリングを実現する幾何認識セグメンテーションモデルを提案する。
セマンティックラベリングのためにシングルストリームエンコーダデコーダネットワークを使用する代わりに、高さマップを予測するための分離デコーダブランチを設計し、新たに設計されたデコーダブランチをトレーニングするためのサイドインスペクタとしてDSMイメージを使用する。
このように、このモデルではdsmをモデル入力として必要とせず、トレーニング中に有用な3d幾何学的情報の恩恵を受けることができます。
さらに,高さデコーダ枝からの3次元幾何学的特徴と意味的セグメンテーション枝からの2次元文脈的特徴を融合する,幾何認識畳み込みモジュールを開発した。
融合した特徴埋め込みは、性能を向上した幾何対応セグメンテーションマップを作成することができる。
我々のモデルは,DSMイメージを副監督としてトレーニングする一方で,推論段階ではDSMデータを必要とせず,エンドツーエンドで意味ラベルを直接予測する。
ISPRS Vaihingen と Potsdam のデータセットを用いた実験により,航空画像のセマンティックセグメンテーションにおける提案手法の有効性が示された。
提案モデルは,手作りの機能や後処理を使わずに,両データセットで顕著な性能を実現する。
関連論文リスト
- DatasetNeRF: Efficient 3D-aware Data Factory with Generative Radiance Fields [68.94868475824575]
本稿では,無限で高品質な3Dアノテーションを3Dポイントクラウドセグメンテーションとともに生成できる新しいアプローチを提案する。
我々は3次元生成モデルに先立って強力なセマンティクスを活用してセマンティクスデコーダを訓練する。
トレーニングが完了すると、デコーダは遅延空間を効率よく一般化し、無限のデータの生成を可能にする。
論文 参考訳(メタデータ) (2023-11-18T21:58:28Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal
Distillation for 3D Shape Recognition [55.38462937452363]
本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。
複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文 参考訳(メタデータ) (2022-07-07T07:23:20Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - Machine-learned 3D Building Vectorization from Satellite Imagery [7.887221474814986]
自動3Dビルディングの再構築とベクトル化のための機械学習に基づく手法を提案する。
単チャネルフォトグラム化デジタルサーフェスモデル(DSM)とパンクロマティック画像(PAN)を入力として、まず非構築オブジェクトをフィルタリングし、形状の構築を洗練する。
改良されたDSMと入力されたPAN画像はセマンティックセグメンテーションネットワークを介して、建物の屋根の端と角を検出する。
論文 参考訳(メタデータ) (2021-04-13T19:57:30Z) - H3D: Benchmark on Semantic Segmentation of High-Resolution 3D Point
Clouds and textured Meshes from UAV LiDAR and Multi-View-Stereo [4.263987603222371]
本稿では,3つの方法でユニークな3次元データセットを提案する。
ヘシグハイム(ドイツ語: Hessigheim, H3D)は、ドイツの都市。
片手で3次元データ分析の分野での研究を促進するとともに、新しいアプローチの評価とランク付けを目的としている。
論文 参考訳(メタデータ) (2021-02-10T09:33:48Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - Height estimation from single aerial images using a deep ordinal
regression network [12.991266182762597]
単体画像からの高度推定の曖昧で未解決な問題に対処する。
深層学習、特に深層畳み込みニューラルネットワーク(CNN)の成功により、いくつかの研究は、単一の空中画像から高さ情報を推定することを提案した。
本稿では,高さ値を間隔増加間隔に分割し,回帰問題を順序回帰問題に変換することを提案する。
論文 参考訳(メタデータ) (2020-06-04T12:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。