論文の概要: Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2412.07899v1
- Date: Tue, 10 Dec 2024 20:10:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:01:26.738739
- Title: Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery
- Title(参考訳): Pix2Poly:リモートセンシング画像からの終端多角形建物の足跡抽出のためのシーケンス予測手法
- Authors: Yeshwanth Kumar Adimoolam, Charalambos Poullis, Melinos Averkiou,
- Abstract要約: Pix2Polyは、リンググラフ形式で明示的な高品質なビルディングフットプリントを直接生成できる、エンドツーエンドのトレーニング可能で微分可能なディープニューラルネットワークである。
従来のグラフ学習手法と比較して,我々は,複雑で計算集約的な損失関数や複雑なトレーニングパイプラインを必要とせず,高品質な建築フットプリントと道路ネットワークを抽出する,真にエンドツーエンドのトレーニング可能なアプローチである。
- 参考スコア(独自算出の注目度): 2.867517731896504
- License:
- Abstract: Extraction of building footprint polygons from remotely sensed data is essential for several urban understanding tasks such as reconstruction, navigation, and mapping. Despite significant progress in the area, extracting accurate polygonal building footprints remains an open problem. In this paper, we introduce Pix2Poly, an attention-based end-to-end trainable and differentiable deep neural network capable of directly generating explicit high-quality building footprints in a ring graph format. Pix2Poly employs a generative encoder-decoder transformer to produce a sequence of graph vertex tokens whose connectivity information is learned by an optimal matching network. Compared to previous graph learning methods, ours is a truly end-to-end trainable approach that extracts high-quality building footprints and road networks without requiring complicated, computationally intensive raster loss functions and intricate training pipelines. Upon evaluating Pix2Poly on several complex and challenging datasets, we report that Pix2Poly outperforms state-of-the-art methods in several vector shape quality metrics while being an entirely explicit method. Our code is available at https://github.com/yeshwanth95/Pix2Poly.
- Abstract(参考訳): リモートセンシングデータから建築フットプリントのポリゴンを抽出することは、再建、ナビゲーション、マッピングなどの都市理解作業に不可欠である。
この地域では大きな進歩があったが、正確な多角形の建物の足跡を抽出することは未解決の問題である。
本稿では,注目に基づくエンドツーエンドのトレーニング可能かつ識別可能なディープニューラルネットワークであるPix2Polyについて紹介する。
Pix2Polyは生成エンコーダ・デコーダ変換器を用いて、最適マッチングネットワークによって接続情報が学習されるグラフ頂点トークンのシーケンスを生成する。
従来のグラフ学習手法と比較して,我々は,複雑で計算集約的なラスタ損失関数や複雑なトレーニングパイプラインを必要とせず,高品質な建築フットプリントと道路ネットワークを抽出する,真にエンドツーエンドのトレーニング可能なアプローチである。
Pix2Polyを複数の複雑で困難なデータセットで評価すると、Pix2Polyは、完全に明示的な手法であると同時に、いくつかのベクトル形状の品質指標において最先端の手法よりも優れていると報告する。
私たちのコードはhttps://github.com/yeshwanth95/Pix2Poly.comから入手可能です。
関連論文リスト
- P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文 参考訳(メタデータ) (2024-06-05T04:38:45Z) - Progressive Evolution from Single-Point to Polygon for Scene Text [79.29097971932529]
単点をコンパクトな多角形に効率よく変換できるPoint2Polygonを導入する。
まず認識信頼度に基づいてアンカーポイントを作成し,ポリゴンを垂直に水平に精製する。
また,本手法により生成したポリゴンを用いた学習において,GTと比較して精度の86%を達成し,さらに,提案したPoint2Polygonをシームレスに統合することにより,単一点スポッターにポリゴンの生成を促進させることができた。
論文 参考訳(メタデータ) (2023-12-21T12:08:27Z) - HiT: Building Mapping with Hierarchical Transformers [43.31497052507252]
階層変換器を用いた簡易かつ斬新な建物マッピング手法HiTを提案する。
HiTは、分類とバウンディングボックス回帰ヘッドに平行なポリゴンヘッドを追加することによって、2段階検出アーキテクチャの上に構築される。
本手法は, 最先端手法と比較して, 事例分割と多角形メトリクスの両面において, 新たな最先端化を実現している。
論文 参考訳(メタデータ) (2023-09-18T10:24:25Z) - PolyGNN: Polyhedron-based Graph Neural Network for 3D Building Reconstruction from Point Clouds [22.18061879431175]
PolyGNNは、再構成ポイントクラウドを構築するためのグラフニューラルネットワークである。
多面体分解によって得られる原始体を組み立てることを学ぶ。
都市間および実世界の点雲上での移動可能性解析を行う。
論文 参考訳(メタデータ) (2023-07-17T16:52:25Z) - PolyBuilding: Polygon Transformer for End-to-End Building Extraction [9.196604757138825]
PolyBuildingはリモートセンシング画像から建物のベクトル表現を予測する。
モデルはそれらの関係を学習し、画像からコンテキスト情報を符号化し、構築ポリゴンの最終セットを予測する。
また、ピクセルレベルのカバレッジ、インスタンスレベルの精度とリコール、幾何学レベルの特性など、新たな最先端性を実現している。
論文 参考訳(メタデータ) (2022-11-03T04:53:17Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - PatchRD: Detail-Preserving Shape Completion by Learning Patch Retrieval
and Deformation [59.70430570779819]
本稿では,3次元形状の欠落領域の幾何学的詳細化に焦点を当てたデータ駆動型形状補完手法を提案する。
私たちの重要な洞察は、部分的な入力から完全な欠落したリージョンへのパッチのコピーとデフォームです。
部分的な入力からパッチを抽出することで繰り返しパターンを活用し、ニューラルネットワークを用いてグローバルな構造的先行点を学習し、検索と変形の手順を導出する。
論文 参考訳(メタデータ) (2022-07-24T18:59:09Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - PolyNet: Polynomial Neural Network for 3D Shape Recognition with
PolyShape Representation [51.147664305955495]
3次元形状表現とその処理は3次元形状認識に大きな影響を及ぼす。
我々は、ディープニューラルネットワークに基づく手法(PolyNet)と特定のポリゴン表現(PolyShape)を提案する。
本研究では,3次元形状分類と検索作業におけるPolyNetの長所と長所を実証した。
論文 参考訳(メタデータ) (2021-10-15T06:45:59Z) - Voxel-based Network for Shape Completion by Leveraging Edge Generation [76.23436070605348]
エッジ生成(VE-PCN)を利用した点雲補完のためのボクセルネットワークを開発した。
まず点雲を正規のボクセル格子に埋め込み、幻覚した形状のエッジの助けを借りて完全な物体を生成する。
この分離されたアーキテクチャとマルチスケールのグリッド機能学習は、より現実的な表面上の詳細を生成することができる。
論文 参考訳(メタデータ) (2021-08-23T05:10:29Z) - Cascaded Refinement Network for Point Cloud Completion with
Self-supervision [74.80746431691938]
形状整形のための2分岐ネットワークを提案する。
第1分枝は、完全なオブジェクトを合成するためのカスケード形状補完サブネットワークである。
第2のブランチは、元の部分入力を再構築する自動エンコーダである。
論文 参考訳(メタデータ) (2020-10-17T04:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。