論文の概要: Twin Deformable Point Convolutions for Point Cloud Semantic Segmentation in Remote Sensing Scenes
- arxiv url: http://arxiv.org/abs/2405.19735v1
- Date: Thu, 30 May 2024 06:31:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-31 15:48:50.685653
- Title: Twin Deformable Point Convolutions for Point Cloud Semantic Segmentation in Remote Sensing Scenes
- Title(参考訳): リモートセンシングシーンにおける点雲セマンティックセマンティックセグメンテーションのための双変形点畳み込み
- Authors: Yong-Qiang Mao, Hanbo Bi, Xuexue Li, Kaiqiang Chen, Zhirui Wang, Xian Sun, Kun Fu,
- Abstract要約: 双変形点畳み込み(TDConvs)と呼ばれる新しい畳み込み作用素を提案する。
これらの演算子は、緯度-経度面と高度方向の変形可能なサンプリングポイントを学習することで適応的な特徴学習を実現することを目的としている。
既存のベンチマークの実験では、TDConvsが最高のセグメンテーション性能を達成していると結論付けています。
- 参考スコア(独自算出の注目度): 12.506628755166814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thanks to the application of deep learning technology in point cloud processing of the remote sensing field, point cloud segmentation has become a research hotspot in recent years, which can be applied to real-world 3D, smart cities, and other fields. Although existing solutions have made unprecedented progress, they ignore the inherent characteristics of point clouds in remote sensing fields that are strictly arranged according to latitude, longitude, and altitude, which brings great convenience to the segmentation of point clouds in remote sensing fields. To consider this property cleverly, we propose novel convolution operators, termed Twin Deformable point Convolutions (TDConvs), which aim to achieve adaptive feature learning by learning deformable sampling points in the latitude-longitude plane and altitude direction, respectively. First, to model the characteristics of the latitude-longitude plane, we propose a Cylinder-wise Deformable point Convolution (CyDConv) operator, which generates a two-dimensional cylinder map by constructing a cylinder-like grid in the latitude-longitude direction. Furthermore, to better integrate the features of the latitude-longitude plane and the spatial geometric features, we perform a multi-scale fusion of the extracted latitude-longitude features and spatial geometric features, and realize it through the aggregation of adjacent point features of different scales. In addition, a Sphere-wise Deformable point Convolution (SpDConv) operator is introduced to adaptively offset the sampling points in three-dimensional space by constructing a sphere grid structure, aiming at modeling the characteristics in the altitude direction. Experiments on existing popular benchmarks conclude that our TDConvs achieve the best segmentation performance, surpassing the existing state-of-the-art methods.
- Abstract(参考訳): リモートセンシング分野のポイントクラウド処理におけるディープラーニング技術の適用により、ポイントクラウドセグメンテーションは近年研究ホットスポットとなり、現実世界の3D、スマートシティ、その他の分野に適用できる。
既存のソリューションは前例のない進歩を遂げているが、緯度、経度、高度に応じて厳密に配置されたリモートセンシングフィールドにおける点雲の性質を無視しており、遠隔センシングフィールドにおける点雲のセグメンテーションに非常に便利である。
この特性を巧みに考察するために、緯度-経度平面における変形可能なサンプリング点と高度方向の学習により適応的な特徴学習を実現することを目的とした、双変形点畳み込み演算子(TDConvs)を提案する。
まず、緯度-経度平面の特性をモデル化するために、経度-経度方向のシリンダー状格子を構築して2次元シリンダーマップを生成するシリンダーワイズ・デフォルマブル・ポイント・コンボリューション(CyDConv)演算子を提案する。
さらに、緯度面の特徴と空間幾何学的特徴をよりよく統合するために、抽出した緯度面の特徴と空間幾何学的特徴をマルチスケールで融合させ、異なるスケールの隣接点特徴を集約することで実現した。
さらに、球面格子構造を構築し、高度方向の特性をモデル化することを目的として、3次元空間におけるサンプリングポイントを適応的にオフセットするために、球面回りの変形点畳み込み(SpDConv)演算子を導入する。
既存の人気ベンチマークの実験では、我々のTDConvsは、最先端の手法よりも優れたセグメンテーション性能を達成していると結論付けている。
関連論文リスト
- Dynamic 3D Point Cloud Sequences as 2D Videos [81.46246338686478]
3Dポイントクラウドシーケンスは、現実世界の環境における最も一般的で実用的な表現の1つとして機能する。
textitStructured Point Cloud Videos (SPCV) と呼ばれる新しい汎用表現を提案する。
SPCVは点雲列を空間的滑らかさと時間的一貫性を持つ2Dビデオとして再編成し、画素値は点の3D座標に対応する。
論文 参考訳(メタデータ) (2024-03-02T08:18:57Z) - PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic
Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。
また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。
プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文 参考訳(メタデータ) (2023-08-31T17:57:17Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Dual Adaptive Transformations for Weakly Supervised Point Cloud
Segmentation [78.6612285236938]
弱制御点雲分割のための新しいDATモデル(textbfDual textbfAdaptive textbfTransformations)を提案する。
我々は,大規模S3DISデータセットとScanNet-V2データセットの2つの人気バックボーンを用いたDATモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-19T05:43:14Z) - DSPoint: Dual-scale Point Cloud Recognition with High-frequency Fusion [17.797795508707864]
高周波核融合(DSPoint)を用いたデュアルスケール点雲認識を提案する。
ボクセルに畳み込みを施すという従来の設計を逆転させ、点に注意を向ける。
広く採用されているModelNet40,ShapeNet,S3DISの実験と改善により,DSPointの最先端性能が実証された。
論文 参考訳(メタデータ) (2021-11-19T17:25:54Z) - Point Cloud Upsampling via Disentangled Refinement [86.3641957163818]
3Dスキャンによって生成された点雲は、しばしばスパース、非均一、ノイズである。
近年のアップサンプリング手法は, 分布均一性と近接場を両立させながら, 密度の高い点集合を生成することを目的としている。
2つのカスケードサブネットワーク、高密度ジェネレータ、空間精錬器を定式化する。
論文 参考訳(メタデータ) (2021-06-09T02:58:42Z) - Semantic Segmentation for Real Point Cloud Scenes via Bilateral
Augmentation and Adaptive Fusion [38.05362492645094]
現実世界の複雑な環境を直感的に捉えることができますが、3Dデータの生の性質のため、機械認識にとって非常に困難です。
我々は、現実に収集された大規模クラウドデータに対して、重要な視覚的タスク、セマンティックセグメンテーションに集中する。
3つのベンチマークで最先端のネットワークと比較することにより,ネットワークの有効性を実証する。
論文 参考訳(メタデータ) (2021-03-12T04:13:20Z) - 3D Object Detection with Pointformer [29.935891419574602]
本稿では,3dポイントクラウドのためのトランスフォーマーバックボーンであるpointformerを提案する。
ローカルトランスフォーマーモジュールは、オブジェクトレベルでコンテキスト依存の領域特徴を学習するローカル領域のポイント間の相互作用をモデル化するために使用される。
Global Transformerは、シーンレベルでコンテキスト対応の表現を学ぶように設計されている。
論文 参考訳(メタデータ) (2020-12-21T15:12:54Z) - Pseudo-LiDAR Point Cloud Interpolation Based on 3D Motion Representation
and Spatial Supervision [68.35777836993212]
我々はPseudo-LiDAR点雲ネットワークを提案し、時間的および空間的に高品質な点雲列を生成する。
点雲間のシーンフローを活用することにより,提案ネットワークは3次元空間運動関係のより正確な表現を学習することができる。
論文 参考訳(メタデータ) (2020-06-20T03:11:04Z) - Intrinsic Point Cloud Interpolation via Dual Latent Space Navigation [38.61801196027949]
本稿では,点雲として表される3次元形状を補間・操作する学習手法を提案する。
提案手法は, 合成形状を可能とし, 同時に固有形状情報へのリンクを提供する2つの符号化空間を構築することに基づく。
論文 参考訳(メタデータ) (2020-04-03T16:28:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。