論文の概要: HiT: Building Mapping with Hierarchical Transformers
- arxiv url: http://arxiv.org/abs/2309.09643v2
- Date: Wed, 10 Jan 2024 09:50:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-11 17:03:48.322470
- Title: HiT: Building Mapping with Hierarchical Transformers
- Title(参考訳): HiT: 階層型トランスフォーマーによるマッピングの構築
- Authors: Mingming Zhang, Qingjie Liu, Yunhong Wang
- Abstract要約: 階層変換器を用いた簡易かつ斬新な建物マッピング手法HiTを提案する。
HiTは、分類とバウンディングボックス回帰ヘッドに平行なポリゴンヘッドを追加することによって、2段階検出アーキテクチャの上に構築される。
本手法は, 最先端手法と比較して, 事例分割と多角形メトリクスの両面において, 新たな最先端化を実現している。
- 参考スコア(独自算出の注目度): 43.31497052507252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based methods have been extensively explored for automatic
building mapping from high-resolution remote sensing images over recent years.
While most building mapping models produce vector polygons of buildings for
geographic and mapping systems, dominant methods typically decompose polygonal
building extraction in some sub-problems, including segmentation,
polygonization, and regularization, leading to complex inference procedures,
low accuracy, and poor generalization. In this paper, we propose a simple and
novel building mapping method with Hierarchical Transformers, called HiT,
improving polygonal building mapping quality from high-resolution remote
sensing images. HiT builds on a two-stage detection architecture by adding a
polygon head parallel to classification and bounding box regression heads. HiT
simultaneously outputs building bounding boxes and vector polygons, which is
fully end-to-end trainable. The polygon head formulates a building polygon as
serialized vertices with the bidirectional characteristic, a simple and elegant
polygon representation avoiding the start or end vertex hypothesis. Under this
new perspective, the polygon head adopts a transformer encoder-decoder
architecture to predict serialized vertices supervised by the designed
bidirectional polygon loss. Furthermore, a hierarchical attention mechanism
combined with convolution operation is introduced in the encoder of the polygon
head, providing more geometric structures of building polygons at vertex and
edge levels. Comprehensive experiments on two benchmarks (the CrowdAI and Inria
datasets) demonstrate that our method achieves a new state-of-the-art in terms
of instance segmentation and polygonal metrics compared with state-of-the-art
methods. Moreover, qualitative results verify the superiority and effectiveness
of our model under complex scenes.
- Abstract(参考訳): 近年,高分解能リモートセンシング画像から自動ビルマッピングを行うための深層学習に基づく手法が広く研究されている。
ほとんどの建物マッピングモデルは、地理的およびマッピングシステムのための建物のベクトル多角形を生成するが、支配的な手法は、分割、多角化、正規化を含むいくつかのサブプロブレムにおいてポリゴン構造抽出を分解し、複雑な推論手順、低い精度、低い一般化をもたらす。
本論文では,高分解能リモートセンシング画像から多角形建物マッピングの品質を向上させるhitと呼ばれる階層的トランスフォーマーを用いた簡易かつ新しい建物マッピング手法を提案する。
HiTは、分類とバウンディングボックス回帰ヘッドに平行なポリゴンヘッドを追加することで、2段階検出アーキテクチャに基づいている。
HiTは、完全にエンドツーエンドのトレーニングが可能な、バウンディングボックスとベクトルポリゴンを同時に出力する。
ポリゴンヘッドは、二方向特性を持つ直列化された頂点としてのビルディングポリゴンを定式化し、始端頂点仮説を避ける単純かつエレガントなポリゴン表現である。
この新たな視点の下では、ポリゴンヘッドはトランスフォーマーエンコーダデコーダアーキテクチャを採用し、設計された双方向ポリゴン損失によって制御されるシリアライズされた頂点を予測する。
さらに、ポリゴンヘッドのエンコーダに畳み込み操作と組み合わされた階層的注意機構を導入し、頂点およびエッジレベルでポリゴンを構築するより幾何学的な構造を提供する。
2つのベンチマーク(CrowdAIとInriaのデータセット)の総合的な実験により、我々の手法は、最先端の手法と比較して、インスタンスのセグメンテーションと多角的メトリクスの点で、新しい最先端の手法を実現することを示した。
さらに,複雑な場面におけるモデルの優位性と有効性を検証する。
関連論文リスト
- GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z) - P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文 参考訳(メタデータ) (2024-06-05T04:38:45Z) - PolyBuilding: Polygon Transformer for End-to-End Building Extraction [9.196604757138825]
PolyBuildingはリモートセンシング画像から建物のベクトル表現を予測する。
モデルはそれらの関係を学習し、画像からコンテキスト情報を符号化し、構築ポリゴンの最終セットを予測する。
また、ピクセルレベルのカバレッジ、インスタンスレベルの精度とリコール、幾何学レベルの特性など、新たな最先端性を実現している。
論文 参考訳(メタデータ) (2022-11-03T04:53:17Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - Automated LoD-2 Model Reconstruction from Very-HighResolution
Satellite-derived Digital Surface Model and Orthophoto [1.2691047660244335]
本稿では,LoD-2ビルディングモデルを「分解最適化最適化」パラダイムに従って再構成するモデル駆動手法を提案する。
提案手法は,既存の手法に対するいくつかの技術的問題点に対処し,その有効性を実証した。
論文 参考訳(メタデータ) (2021-09-08T19:03:09Z) - Machine-learned 3D Building Vectorization from Satellite Imagery [7.887221474814986]
自動3Dビルディングの再構築とベクトル化のための機械学習に基づく手法を提案する。
単チャネルフォトグラム化デジタルサーフェスモデル(DSM)とパンクロマティック画像(PAN)を入力として、まず非構築オブジェクトをフィルタリングし、形状の構築を洗練する。
改良されたDSMと入力されたPAN画像はセマンティックセグメンテーションネットワークを介して、建物の屋根の端と角を検出する。
論文 参考訳(メタデータ) (2021-04-13T19:57:30Z) - DSG-Net: Learning Disentangled Structure and Geometry for 3D Shape
Generation [98.96086261213578]
DSG-Netは3次元形状の非交叉構造と幾何学的メッシュ表現を学習するディープニューラルネットワークである。
これは、幾何(構造)を不変に保ちながら構造(幾何学)のような不整合制御を持つ新しい形状生成アプリケーションの範囲をサポートする。
本手法は,制御可能な生成アプリケーションだけでなく,高品質な合成形状を生成できる。
論文 参考訳(メタデータ) (2020-08-12T17:06:51Z) - Quantization in Relative Gradient Angle Domain For Building Polygon
Estimation [88.80146152060888]
CNNアプローチは、しばしばノイズの多いエッジや丸いコーナーを含む不正確な建築形態を生成する。
CNNセグメンテーション出力から角状かつ簡潔なビルディングポリゴンを生成するために,ビルディングコーナーの事前知識を利用するモジュールを提案する。
提案手法は, 円形近似によるCNN出力を, より鮮明な形状の建物足跡に改良することを示した。
論文 参考訳(メタデータ) (2020-07-10T21:33:06Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。