論文の概要: Trainable Pointwise Decoder Module for Point Cloud Segmentation
- arxiv url: http://arxiv.org/abs/2408.01548v1
- Date: Fri, 2 Aug 2024 19:29:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-06 19:40:03.133457
- Title: Trainable Pointwise Decoder Module for Point Cloud Segmentation
- Title(参考訳): ポイントクラウドセグメンテーションのためのトレーニング可能なポイントワイズデコーダモジュール
- Authors: Bike Chen, Chen Gong, Antti Tikanmäki, Juha Röning,
- Abstract要約: ポイントクラウドセグメンテーション(PCS)は、ポイントごとの予測を行い、ロボットや自動運転車が環境を理解することを可能にすることを目的としている。
後処理手法としてトレーニング可能なポイントワイズデコーダモジュール(PDM)を提案する。
また、データ拡張に仮想レンジ画像誘導コピー・ロータート・ペースト戦略を導入する。
- 参考スコア(独自算出の注目度): 12.233802912441476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point cloud segmentation (PCS) aims to make per-point predictions and enables robots and autonomous driving cars to understand the environment. The range image is a dense representation of a large-scale outdoor point cloud, and segmentation models built upon the image commonly execute efficiently. However, the projection of the point cloud onto the range image inevitably leads to dropping points because, at each image coordinate, only one point is kept despite multiple points being projected onto the same location. More importantly, it is challenging to assign correct predictions to the dropped points that belong to the classes different from the kept point class. Besides, existing post-processing methods, such as K-nearest neighbor (KNN) search and kernel point convolution (KPConv), cannot be trained with the models in an end-to-end manner or cannot process varying-density outdoor point clouds well, thereby enabling the models to achieve sub-optimal performance. To alleviate this problem, we propose a trainable pointwise decoder module (PDM) as the post-processing approach, which gathers weighted features from the neighbors and then makes the final prediction for the query point. In addition, we introduce a virtual range image-guided copy-rotate-paste (VRCrop) strategy in data augmentation. VRCrop constrains the total number of points and eliminates undesirable artifacts in the augmented point cloud. With PDM and VRCrop, existing range image-based segmentation models consistently perform better than their counterparts on the SemanticKITTI, SemanticPOSS, and nuScenes datasets.
- Abstract(参考訳): ポイントクラウドセグメンテーション(PCS)は、ポイントごとの予測を行い、ロボットや自動運転車が環境を理解することを可能にすることを目的としている。
レンジ画像は大規模屋外点雲の密度の高い表現であり、画像上に構築されたセグメンテーションモデルは一般的に効率的に実行される。
しかし、複数の点が同じ位置に投影されているにもかかわらず、各画像座標において1つの点だけが保持されるため、遠距離画像への点雲の投影は必然的に落下する。
さらに重要なのは、保持されたポイントクラスとは異なるクラスに属するドロップポイントに正しい予測を割り当てることは困難である。
さらに、K-nearest neighbor(KNN)探索やカーネルポイント畳み込み(KPConv)のような既存の後処理手法では、エンド・ツー・エンドでモデルでトレーニングすることはできず、また、様々な密度の屋外ポイント・クラウドを適切に処理できないため、モデルが準最適性能を達成することができる。
この問題を軽減するために,近隣住民から重み付けされた特徴を収集し,問合せ点の最終的な予測を行う後処理手法として,訓練可能なポイントワイドデコーダモジュール(PDM)を提案する。
さらに,データ拡張において仮想レンジ画像誘導コピーロートペースト(VRCrop)戦略を導入する。
VRCropは、ポイントの総数を制限し、拡張ポイントクラウドにおける望ましくないアーティファクトを排除します。
PDMとVRCropでは、既存のレンジイメージベースのセグメンテーションモデルは、SemanticKITTI、SemanticPOSS、nuScenesデータセットのそれよりも一貫してパフォーマンスが向上している。
関連論文リスト
- P2P-Bridge: Diffusion Bridges for 3D Point Cloud Denoising [81.92854168911704]
私たちは、Diffusion Schr"odingerブリッジをポイントクラウドに適応させる新しいフレームワークを通じて、ポイントクラウドを飾るタスクに取り組みます。
オブジェクトデータセットの実験では、P2P-Bridgeは既存のメソッドよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-08-29T08:00:07Z) - PosDiffNet: Positional Neural Diffusion for Point Cloud Registration in
a Large Field of View with Perturbations [27.45001809414096]
PosDiffNetは、3Dコンピュータビジョンにおけるポイントクラウド登録のモデルである。
ベルトラミフローに基づくグラフニューラル偏微分方程式(PDE)を用いて高次元特徴を求める。
我々は、点雲間のアライメントを容易にするために、高特徴類似度スコアから導かれる多レベル対応を用いる。
我々はPosDiffNetを複数の3Dポイントクラウドデータセット上で評価し、摂動を伴う広い視野でのポイントクラウド登録において、最先端(SOTA)性能を達成することを検証した。
論文 参考訳(メタデータ) (2024-01-06T08:58:15Z) - Point Cloud Pre-training with Diffusion Models [62.12279263217138]
我々は、ポイントクラウド拡散事前学習(PointDif)と呼ばれる新しい事前学習手法を提案する。
PointDifは、分類、セグメンテーション、検出など、さまざまな下流タスクのために、さまざまな現実世界のデータセット間で大幅に改善されている。
論文 参考訳(メタデータ) (2023-11-25T08:10:05Z) - GeoMAE: Masked Geometric Target Prediction for Self-supervised Point
Cloud Pre-Training [16.825524577372473]
幾何学的特徴再構成に基づくポイントクラウド表現学習フレームワークを提案する。
我々は,3つの自己教師型学習目標を特異点雲,すなわちセントロイド予測,正規推定,曲率予測と同定する。
私たちのパイプラインは概念的にはシンプルで、まずポイントのグループをランダムにマスキングし、次にTransformerベースのポイントクラウドエンコーダという2つの大きなステップで構成されています。
論文 参考訳(メタデータ) (2023-05-15T17:14:55Z) - Variational Relational Point Completion Network for Robust 3D
Classification [59.80993960827833]
可変点雲補完法は、局所的な詳細を欠くため、大域的な形状の骨格を生成する傾向がある。
本稿では2つの魅力的な特性を持つ変分フレームワークであるポイントコンプリートネットワーク(VRCNet)を提案する。
VRCNetは、現実世界のポイントクラウドスキャンにおいて、非常に一般化性と堅牢性を示している。
論文 参考訳(メタデータ) (2023-04-18T17:03:20Z) - EPCL: Frozen CLIP Transformer is An Efficient Point Cloud Encoder [60.52613206271329]
本稿では,冷凍CLIP変換器を用いて高品質のクラウドモデルをトレーニングするための textbfEfficient textbfPoint textbfCloud textbfLearning (EPCL) を提案する。
我々のEPCLは、2D-3Dデータをペア化せずに画像の特徴と点雲の特徴を意味的に整合させることで、2Dと3Dのモダリティを接続する。
論文 参考訳(メタデータ) (2022-12-08T06:27:11Z) - Point-Voxel Adaptive Feature Abstraction for Robust Point Cloud
Classification [6.40412293456886]
本稿では, 様々な汚職下でのロバストな点雲分類のためのPV-Ada (Point-Voxel based Adaptive) を提案する。
ModelNet-Cデータセットの実験では、PV-Adaが最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2022-10-27T14:49:53Z) - Shrinking unit: a Graph Convolution-Based Unit for CNN-like 3D Point
Cloud Feature Extractors [0.0]
我々は、画像領域からのインスピレーションの欠如が、そのようなギャップの主な原因であると主張している。
我々は,CNNのような3Dポイント・クラウド特徴抽出器の設計のために,Shrinkingユニットと呼ばれるグラフ畳み込み単位を提案する。
論文 参考訳(メタデータ) (2022-09-26T15:28:31Z) - REGTR: End-to-end Point Cloud Correspondences with Transformers [79.52112840465558]
我々は、注意機構が明示的な特徴マッチングとRANSACの役割を置き換えることができると推測する。
本稿では,最終文集合を直接予測するエンドツーエンドフレームワークを提案する。
提案手法は3DMatchおよびModelNetベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T06:01:00Z) - SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine
Reconstruction with Self-Projection Optimization [52.20602782690776]
実際のスキャンされたスパースデータからトレーニング用の大規模なペアリングスパーススキャンポイントセットを得るのは高価で面倒です。
本研究では,SPU-Net と呼ばれる自己監視型点群アップサンプリングネットワークを提案する。
本研究では,合成データと実データの両方について様々な実験を行い,最先端の教師付き手法と同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-08T14:14:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。