論文の概要: RoofSeg: An edge-aware transformer-based network for end-to-end roof plane segmentation
- arxiv url: http://arxiv.org/abs/2508.19003v1
- Date: Tue, 26 Aug 2025 13:03:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.847004
- Title: RoofSeg: An edge-aware transformer-based network for end-to-end roof plane segmentation
- Title(参考訳): RoofSeg: エンド・ツー・エンドの屋根面セグメンテーションのためのエッジ・アウェア・トランスフォーマー・ベースのネットワーク
- Authors: Siyuan You, Guozheng Xu, Pengwei Zhou, Qiwen Jin, Jian Yao, Li Li,
- Abstract要約: 屋根面のセグメンテーションは、空中光検出・測光(LiDAR)点雲から、詳細(LoD)2と3のレベルで3Dビルディングモデルを再構築するための重要な手順の1つである。
屋根面セグメンテーションの現在のアプローチは、手動で設計または学習された特徴に頼っている。
我々は,LDAR点雲から屋根面を真にエンドツーエンドに分割する,エッジ対応トランスフォーマーネットワークRoofSegを提案する。
- 参考スコア(独自算出の注目度): 7.458061089808731
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Roof plane segmentation is one of the key procedures for reconstructing three-dimensional (3D) building models at levels of detail (LoD) 2 and 3 from airborne light detection and ranging (LiDAR) point clouds. The majority of current approaches for roof plane segmentation rely on the manually designed or learned features followed by some specifically designed geometric clustering strategies. Because the learned features are more powerful than the manually designed features, the deep learning-based approaches usually perform better than the traditional approaches. However, the current deep learning-based approaches have three unsolved problems. The first is that most of them are not truly end-to-end, the plane segmentation results may be not optimal. The second is that the point feature discriminability near the edges is relatively low, leading to inaccurate planar edges. The third is that the planar geometric characteristics are not sufficiently considered to constrain the network training. To solve these issues, a novel edge-aware transformer-based network, named RoofSeg, is developed for segmenting roof planes from LiDAR point clouds in a truly end-to-end manner. In the RoofSeg, we leverage a transformer encoder-decoder-based framework to hierarchically predict the plane instance masks with the use of a set of learnable plane queries. To further improve the segmentation accuracy of edge regions, we also design an Edge-Aware Mask Module (EAMM) that sufficiently incorporates planar geometric prior of edges to enhance its discriminability for plane instance mask refinement. In addition, we propose an adaptive weighting strategy in the mask loss to reduce the influence of misclassified points, and also propose a new plane geometric loss to constrain the network training.
- Abstract(参考訳): 屋根面のセグメンテーションは、3次元(3D)の建物モデルを空中光検出・測光(LiDAR)点雲から細部(LoD)2と3のレベルで再構築するための重要な手順の1つである。
屋根面セグメンテーションの現在のアプローチの大半は、手動で設計または学習された機能に依存しており、それに続く幾何的クラスタリング戦略が特に設計されている。
学習した機能は手動で設計した機能よりも強力であるため、ディープラーニングベースのアプローチは通常、従来のアプローチよりもパフォーマンスがよい。
しかし、現在のディープラーニングベースのアプローチには3つの未解決の問題がある。
第一に、それらのほとんどは真にエンドツーエンドではなく、平面分割の結果は最適でないかもしれない。
第二に、エッジ近傍の点特徴の識別性は比較的低く、不正確な平面エッジをもたらす。
3つ目は、平面幾何学的特徴がネットワークトレーニングの制約として十分に考慮されていないことである。
これらの問題を解決するために、屋根面をLiDAR点雲から真にエンドツーエンドに分割する新しいエッジ対応トランスフォーマーネットワークRoofSegを開発した。
RoofSegでは、トランスフォーマーエンコーダ-デコーダベースのフレームワークを使用して、学習可能なプレーンクエリのセットを使用して、平面インスタンスマスクを階層的に予測する。
さらにエッジ領域のセグメンテーション精度を向上させるために,エッジの平面幾何学的事前を十分に組み込んだエッジ・アウェアマスク・モジュール(EAMM)を設計し,その識別性を高める。
さらに,誤分類点の影響を低減するためにマスク損失の適応重み付け戦略を提案し,ネットワークトレーニングを制約する新しい平面幾何損失を提案する。
関連論文リスト
- SPPSFormer: High-quality Superpoint-based Transformer for Roof Plane Instance Segmentation from Point Clouds [14.67024375365087]
変圧器は、ポイントクラウドの屋根面のインスタンスセグメンテーションにはほとんど使われていない。
既存のスーパーポイント変換器は、低品質のスーパーポイントを使用するため、限られた性能に悩まされる。
高品質なスーパーポイントが満足すべき2つの基準を確立し、それに対応する2段階のスーパーポイント生成プロセスを導入する。
論文 参考訳(メタデータ) (2025-05-30T11:23:16Z) - Plane2Depth: Hierarchical Adaptive Plane Guidance for Monocular Depth Estimation [38.81275292687583]
平面情報を適応的に利用し,階層的なフレームワーク内での深度予測を改善するPlane2Depthを提案する。
提案する平面案内深度発生器 (PGDG) では, 現場の平面をソフトにモデル化し, 画素ごとの平面係数を予測するためのプロトタイプとして, 一連の平面クエリを設計する。
提案するアダプティブプレーンクエリアグリゲーション(APGA)モジュールでは,マルチスケール平面特徴のアグリゲーションを改善するために,新たな機能インタラクションアプローチを導入する。
論文 参考訳(メタデータ) (2024-09-04T07:45:06Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - AirPlanes: Accurate Plane Estimation via 3D-Consistent Embeddings [26.845588648999417]
本研究では,3次元画像から平面面を推定する問題に対処する。
本稿では,平面へのクラスタリングにおける幾何を補完する多視点一貫した平面埋め込みを予測する手法を提案する。
我々は、ScanNetV2データセットの広範な評価を通じて、我々の新しい手法が既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2024-06-13T09:49:31Z) - Flatten Anything: Unsupervised Neural Surface Parameterization [76.4422287292541]
本研究では,FAM(Flatten Anything Model)を導入し,グローバルな自由境界面パラメータ化を実現する。
従来の手法と比較して,FAMは接続情報を活用することなく,個別の面上で直接動作する。
当社のFAMは前処理を必要とせずに完全に自動化されており,高度に複雑なトポロジを扱うことができる。
論文 参考訳(メタデータ) (2024-05-23T14:39:52Z) - ParaPoint: Learning Global Free-Boundary Surface Parameterization of 3D Point Clouds [52.03819676074455]
ParaPointは、グローバルな自由境界面パラメータ化を実現するための教師なしのニューラルネットワークパイプラインである。
この研究は、グローバルマッピングと自由境界の両方を追求するニューラルポイントクラウドパラメータ化を調査する最初の試みである。
論文 参考訳(メタデータ) (2024-03-15T14:35:05Z) - A boundary-aware point clustering approach in Euclidean and embedding spaces for roof plane segmentation [9.944505802346733]
空飛ぶLiDAR点雲からの屋根面のセグメンテーションは、3Dビルディングモデル再構築の重要な技術である。
平面分割の重要な課題の1つは、隣接する平面パッチを区別できる強力な機能をどのように設計するかである。
屋根面分割のためのマルチタスク深層ネットワークにより構築されたユークリッドおよび埋め込み空間における境界対応点クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T13:58:31Z) - Ground Plane Matters: Picking Up Ground Plane Prior in Monocular 3D
Object Detection [92.75961303269548]
先行する地平面は、モノクル3次元物体検出(M3OD)における非常に情報的な幾何学的手がかりである
本稿では,両問題を一度に解決するGPENetを提案する。
我々のGPENetは、他の手法よりも優れ、最先端のパフォーマンスを実現し、提案手法の有効性と優位性を示すことができる。
論文 参考訳(メタデータ) (2022-11-03T02:21:35Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。