論文の概要: HiT: Building Mapping with Hierarchical Transformers
- arxiv url: http://arxiv.org/abs/2309.09643v1
- Date: Mon, 18 Sep 2023 10:24:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 14:00:30.240812
- Title: HiT: Building Mapping with Hierarchical Transformers
- Title(参考訳): HiT: 階層型トランスフォーマーによるマッピングの構築
- Authors: Mingming Zhang, Qingjie Liu, Yunhong Wang
- Abstract要約: 階層変換器を用いた簡易かつ斬新な建物マッピング手法HiTを提案する。
HiTは、分類とバウンディングボックス回帰ヘッドに平行なポリゴンヘッドを追加することによって、2段階検出アーキテクチャの上に構築される。
本手法は, 最先端手法と比較して, 事例分割と多角形メトリクスの両面において, 新たな最先端化を実現している。
- 参考スコア(独自算出の注目度): 43.31497052507252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based methods have been extensively explored for automatic
building mapping from high-resolution remote sensing images over recent years.
While most building mapping models produce vector polygons of buildings for
geographic and mapping systems, dominant methods typically decompose polygonal
building extraction in some sub-problems, including segmentation,
polygonization, and regularization, leading to complex inference procedures,
low accuracy, and poor generalization. In this paper, we propose a simple and
novel building mapping method with Hierarchical Transformers, called HiT,
improving polygonal building mapping quality from high-resolution remote
sensing images. HiT builds on a two-stage detection architecture by adding a
polygon head parallel to classification and bounding box regression heads. HiT
simultaneously outputs building bounding boxes and vector polygons, which is
fully end-to-end trainable. The polygon head formulates a building polygon as
serialized vertices with the bidirectional characteristic, a simple and elegant
polygon representation avoiding the start or end vertex hypothesis. Under this
new perspective, the polygon head adopts a transformer encoder-decoder
architecture to predict serialized vertices supervised by the designed
bidirectional polygon loss. Furthermore, a hierarchical attention mechanism
combined with convolution operation is introduced in the encoder of the polygon
head, providing more geometric structures of building polygons at vertex and
edge levels. Comprehensive experiments on two benchmarks (the CrowdAI and Inria
datasets) demonstrate that our method achieves a new state-of-the-art in terms
of instance segmentation and polygonal metrics compared with state-of-the-art
methods. Moreover, qualitative results verify the superiority and effectiveness
of our model under complex scenes.
- Abstract(参考訳): 近年,高分解能リモートセンシング画像から自動ビルマッピングを行うための深層学習に基づく手法が広く研究されている。
ほとんどの建物マッピングモデルは、地理的およびマッピングシステムのための建物のベクトル多角形を生成するが、支配的な手法は、分割、多角化、正規化を含むいくつかのサブプロブレムにおいてポリゴン構造抽出を分解し、複雑な推論手順、低い精度、低い一般化をもたらす。
本論文では,高分解能リモートセンシング画像から多角形建物マッピングの品質を向上させるhitと呼ばれる階層的トランスフォーマーを用いた簡易かつ新しい建物マッピング手法を提案する。
HiTは、分類とバウンディングボックス回帰ヘッドに平行なポリゴンヘッドを追加することで、2段階検出アーキテクチャに基づいている。
HiTは、完全にエンドツーエンドのトレーニングが可能な、バウンディングボックスとベクトルポリゴンを同時に出力する。
ポリゴンヘッドは、二方向特性を持つ直列化された頂点としてのビルディングポリゴンを定式化し、始端頂点仮説を避ける単純かつエレガントなポリゴン表現である。
この新たな視点の下では、ポリゴンヘッドはトランスフォーマーエンコーダデコーダアーキテクチャを採用し、設計された双方向ポリゴン損失によって制御されるシリアライズされた頂点を予測する。
さらに、ポリゴンヘッドのエンコーダに畳み込み操作と組み合わされた階層的注意機構を導入し、頂点およびエッジレベルでポリゴンを構築するより幾何学的な構造を提供する。
2つのベンチマーク(CrowdAIとInriaのデータセット)の総合的な実験により、我々の手法は、最先端の手法と比較して、インスタンスのセグメンテーションと多角的メトリクスの点で、新しい最先端の手法を実現することを示した。
さらに,複雑な場面におけるモデルの優位性と有効性を検証する。
関連論文リスト
- SpaceMesh: A Continuous Representation for Learning Manifold Surface Meshes [61.110517195874074]
本稿では,ニューラルネットワークの出力として,複雑な接続性を持つ多様体多角形メッシュを直接生成する手法を提案する。
私たちの重要なイノベーションは、各メッシュで連続的な遅延接続空間を定義することです。
アプリケーションでは、このアプローチは生成モデルから高品質な出力を得るだけでなく、メッシュ修復のような挑戦的な幾何処理タスクを直接学習することを可能にする。
論文 参考訳(メタデータ) (2024-09-30T17:59:03Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文 参考訳(メタデータ) (2024-06-05T04:38:45Z) - PolyBuilding: Polygon Transformer for End-to-End Building Extraction [9.196604757138825]
PolyBuildingはリモートセンシング画像から建物のベクトル表現を予測する。
モデルはそれらの関係を学習し、画像からコンテキスト情報を符号化し、構築ポリゴンの最終セットを予測する。
また、ピクセルレベルのカバレッジ、インスタンスレベルの精度とリコール、幾何学レベルの特性など、新たな最先端性を実現している。
論文 参考訳(メタデータ) (2022-11-03T04:53:17Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - Automated LoD-2 Model Reconstruction from Very-HighResolution
Satellite-derived Digital Surface Model and Orthophoto [1.2691047660244335]
本稿では,LoD-2ビルディングモデルを「分解最適化最適化」パラダイムに従って再構成するモデル駆動手法を提案する。
提案手法は,既存の手法に対するいくつかの技術的問題点に対処し,その有効性を実証した。
論文 参考訳(メタデータ) (2021-09-08T19:03:09Z) - Machine-learned 3D Building Vectorization from Satellite Imagery [7.887221474814986]
自動3Dビルディングの再構築とベクトル化のための機械学習に基づく手法を提案する。
単チャネルフォトグラム化デジタルサーフェスモデル(DSM)とパンクロマティック画像(PAN)を入力として、まず非構築オブジェクトをフィルタリングし、形状の構築を洗練する。
改良されたDSMと入力されたPAN画像はセマンティックセグメンテーションネットワークを介して、建物の屋根の端と角を検出する。
論文 参考訳(メタデータ) (2021-04-13T19:57:30Z) - DSG-Net: Learning Disentangled Structure and Geometry for 3D Shape
Generation [98.96086261213578]
DSG-Netは3次元形状の非交叉構造と幾何学的メッシュ表現を学習するディープニューラルネットワークである。
これは、幾何(構造)を不変に保ちながら構造(幾何学)のような不整合制御を持つ新しい形状生成アプリケーションの範囲をサポートする。
本手法は,制御可能な生成アプリケーションだけでなく,高品質な合成形状を生成できる。
論文 参考訳(メタデータ) (2020-08-12T17:06:51Z) - Quantization in Relative Gradient Angle Domain For Building Polygon
Estimation [88.80146152060888]
CNNアプローチは、しばしばノイズの多いエッジや丸いコーナーを含む不正確な建築形態を生成する。
CNNセグメンテーション出力から角状かつ簡潔なビルディングポリゴンを生成するために,ビルディングコーナーの事前知識を利用するモジュールを提案する。
提案手法は, 円形近似によるCNN出力を, より鮮明な形状の建物足跡に改良することを示した。
論文 参考訳(メタデータ) (2020-07-10T21:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。