論文の概要: The P$^3$ dataset: Pixels, Points and Polygons for Multimodal Building Vectorization
- arxiv url: http://arxiv.org/abs/2505.15379v1
- Date: Wed, 21 May 2025 11:16:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:59.522044
- Title: The P$^3$ dataset: Pixels, Points and Polygons for Multimodal Building Vectorization
- Title(参考訳): P$^3$データセット:マルチモーダル建築ベクトル化のための画素,点,ポリゴン
- Authors: Raphael Sulzer, Liuyun Duan, Nicolas Girard, Florent Lafarge,
- Abstract要約: P$3$データセットは、ベクトル化を構築するための大規模マルチモーダルベンチマークである。
データセットは100億点以上のLiDAR点を含み、デシメータレベルの精度と、地上サンプリング距離25cmのRGB画像を含んでいる。
- 参考スコア(独自算出の注目度): 9.112162560071937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the P$^3$ dataset, a large-scale multimodal benchmark for building vectorization, constructed from aerial LiDAR point clouds, high-resolution aerial imagery, and vectorized 2D building outlines, collected across three continents. The dataset contains over 10 billion LiDAR points with decimeter-level accuracy and RGB images at a ground sampling distance of 25 centimeter. While many existing datasets primarily focus on the image modality, P$^3$ offers a complementary perspective by also incorporating dense 3D information. We demonstrate that LiDAR point clouds serve as a robust modality for predicting building polygons, both in hybrid and end-to-end learning frameworks. Moreover, fusing aerial LiDAR and imagery further improves accuracy and geometric quality of predicted polygons. The P$^3$ dataset is publicly available, along with code and pretrained weights of three state-of-the-art models for building polygon prediction at https://github.com/raphaelsulzer/PixelsPointsPolygons .
- Abstract(参考訳): 本稿では,空中LiDAR点雲,高分解能空中画像,および3大陸にまたがるベクトル化2Dビルディングアウトラインから構築した大規模マルチモーダル・ベンチマークであるP$^3$データセットを提案する。
データセットは100億点以上のLiDAR点を含み、デシメータレベルの精度と、地上サンプリング距離25cmのRGB画像を含んでいる。
多くの既存のデータセットは画像のモダリティに重点を置いているが、P$^3$は高密度な3D情報も取り入れることで補完的な視点を提供する。
我々は、ハイブリッドとエンドツーエンドの学習フレームワークの両方において、LiDARポイントクラウドが多角形の構築を予測するための堅牢なモダリティとして機能することを実証した。
さらに、空中LiDARと画像の融合により、予測ポリゴンの精度と幾何学的品質が向上する。
P$^3$データセットは、コードに加えて、https://github.com/raphaelsulzer/PixelsPointsPolygonsでポリゴン予測を構築するための3つの最先端モデルの事前訓練された重みとともに、一般公開されている。
関連論文リスト
- Bridged Transformer for Vision and Point Cloud 3D Object Detection [92.86856146086316]
Bridged Transformer (BrT) は、3Dオブジェクト検出のためのエンドツーエンドアーキテクチャである。
BrTは3Dオブジェクトと2Dオブジェクトのバウンディングボックスを、ポイントとイメージパッチの両方から識別する。
BrTがSUN RGB-DおよびScanNetV2データセットの最先端手法を上回ることを示す。
論文 参考訳(メタデータ) (2022-10-04T05:44:22Z) - M$^2$-3DLaneNet: Exploring Multi-Modal 3D Lane Detection [30.250833348463633]
M$2$-3DLaneNetは、深度補完を通してLiDARデータから幾何情報を取り込むことで、2Dの機能を3D空間に持ち上げる。
大規模なOpenLaneデータセットの実験では、範囲に関係なく、M$2$-3DLaneNetの有効性が示されている。
論文 参考訳(メタデータ) (2022-09-13T13:45:18Z) - VPFNet: Improving 3D Object Detection with Virtual Point based LiDAR and
Stereo Data Fusion [62.24001258298076]
VPFNetは、ポイントクラウドとイメージデータを仮想のポイントで巧みに調整し集約する新しいアーキテクチャである。
当社のVPFNetは,KITTIテストセットで83.21%の中等度3D AP,91.86%中等度BEV APを達成し,2021年5月21日以来の1位となった。
論文 参考訳(メタデータ) (2021-11-29T08:51:20Z) - Frustum Fusion: Pseudo-LiDAR and LiDAR Fusion for 3D Detection [0.0]
本稿では,立体対から得られる高精度な点雲と,密度が高いが精度の低い点雲を結合する新しいデータ融合アルゴリズムを提案する。
我々は複数の3次元物体検出法を訓練し、核融合戦略が検出器の性能を継続的に改善することを示す。
論文 参考訳(メタデータ) (2021-11-08T19:29:59Z) - PC-DAN: Point Cloud based Deep Affinity Network for 3D Multi-Object
Tracking (Accepted as an extended abstract in JRDB-ACT Workshop at CVPR21) [68.12101204123422]
点雲は3次元座標における空間データの密集したコンパイルである。
我々は3次元多目的追跡(MOT)のためのPointNetベースのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-03T05:36:39Z) - Semantic Segmentation on Swiss3DCities: A Benchmark Study on Aerial
Photogrammetric 3D Pointcloud Dataset [67.44497676652173]
スイスの3つの都市から採取された総面積2.7 km2$の屋外3Dポイントクラウドデータセットを紹介した。
データセットは、ポイントごとのラベルによるセマンティックセグメンテーションのために手動でアノテートされ、高解像度カメラを備えたマルチローターによって取得された画像のフォトグラムを用いて構築される。
論文 参考訳(メタデータ) (2020-12-23T21:48:47Z) - KAPLAN: A 3D Point Descriptor for Shape Completion [80.15764700137383]
KAPLANは、一連の2D畳み込みを通じて局所的な形状情報を集約する3Dポイント記述子である。
各平面において、正規点や平面間距離のような点特性は2次元グリッドに集約され、効率的な2次元畳み込みエンコーダを持つ特徴表現に抽象化される。
公開データセットの実験では、KAPLANが3D形状の完成のために最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2020-07-31T21:56:08Z) - Polylidar3D -- Fast Polygon Extraction from 3D Data [0.0]
3Dポイントクラウド処理によってキャプチャされたフラットな表面は、ローカライゼーションやモデリングにしばしば使用される。
屋上マッピング,道路面検出,壁面検出のためのRGBDカメラにおいて,自律型マルチス・スピードセグメンテーションを実証する。
結果は常に優れた精度を示す。
論文 参考訳(メタデータ) (2020-07-23T15:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。