論文の概要: Masked Surfel Prediction for Self-Supervised Point Cloud Learning
- arxiv url: http://arxiv.org/abs/2207.03111v1
- Date: Thu, 7 Jul 2022 06:47:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-08 12:51:45.034920
- Title: Masked Surfel Prediction for Self-Supervised Point Cloud Learning
- Title(参考訳): 自己監督型ポイントクラウド学習のためのマスクサーフェル予測
- Authors: Yabin Zhang, Jiehong Lin, Chenhang He, Yongwei Chen, Kui Jia, Lei
Zhang
- Abstract要約: マスク付き自動符号化において局所幾何学情報を明示的に考慮する最初の試みを行い,Masked Surfel Prediction (MaskSurf)法を提案する。
具体的には、入力点雲が高い比でマスクされていることを考慮し、トランスフォーマーベースのエンコーダデコーダネットワークを学習し、基礎となるマスク付きサーフを推定する。
MaskSurfは3つの微調整戦略の下で6つの下流タスクで検証される。
- 参考スコア(独自算出の注目度): 40.16043026141161
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Masked auto-encoding is a popular and effective self-supervised learning
approach to point cloud learning. However, most of the existing methods
reconstruct only the masked points and overlook the local geometry information,
which is also important to understand the point cloud data. In this work, we
make the first attempt, to the best of our knowledge, to consider the local
geometry information explicitly into the masked auto-encoding, and propose a
novel Masked Surfel Prediction (MaskSurf) method. Specifically, given the input
point cloud masked at a high ratio, we learn a transformer-based
encoder-decoder network to estimate the underlying masked surfels by
simultaneously predicting the surfel positions (i.e., points) and per-surfel
orientations (i.e., normals). The predictions of points and normals are
supervised by the Chamfer Distance and a newly introduced Position-Indexed
Normal Distance in a set-to-set manner. Our MaskSurf is validated on six
downstream tasks under three fine-tuning strategies. In particular, MaskSurf
outperforms its closest competitor, Point-MAE, by 1.2\% on the real-world
dataset of ScanObjectNN under the OBJ-BG setting, justifying the advantages of
masked surfel prediction over masked point cloud reconstruction. Codes will be
available at https://github.com/YBZh/MaskSurf.
- Abstract(参考訳): masked auto-encodingは、ポイントクラウド学習に対する、人気で効果的な自己教師付き学習アプローチである。
しかし,既存の手法の多くはマスキングポイントのみを再構成し,局所幾何情報を見落としているため,ポイントクラウドデータを理解する上でも重要である。
本研究では,まず,マスク付き自動符号化に局所的幾何学的情報を明示的に考慮し,Masked Surfel Prediction (MaskSurf)法を提案する。
具体的には、入力点雲が高い比でマスクされていることを考慮し、トランスフォーマーベースのエンコーダデコーダネットワークを学習し、サーフ位置(すなわち、点)とサーフセルごとの向き(すなわち、正規)を同時に予測することで、基礎となるマスク付きサーフを推定する。
点と正規値の予測は、新たに導入されたシャムハ距離と位置インデックス正規値距離をセットツーセットで監視する。
私たちのMaskSurfは3つの微調整戦略の下で6つの下流タスクで検証されます。
特に、masksurfは、obj-bg設定下のscanobjectnnの実世界のデータセット上で、最も近い競合であるpoint-maeを1.2\%上回っており、マスキングドポイントクラウド再構築よりもマスクドサーフィン予測の利点を正当化している。
コードはhttps://github.com/ybzh/masksurfで入手できる。
関連論文リスト
- MGMap: Mask-Guided Learning for Online Vectorized HD Map Construction [17.16231247910372]
本稿では,情報領域を効果的に強調し,正確な地図要素の局所化を実現するマスク誘導方式MGMapを提案する。
具体的には、MGMapは2つの観点から強化されたマルチスケールBEV機能に基づいて学習マスクを採用する。
ベースラインと比較して,提案したMGMapは,入力モードが異なる場合,約10mAPの顕著な改善を実現している。
論文 参考訳(メタデータ) (2024-04-01T03:13:32Z) - CPCM: Contextual Point Cloud Modeling for Weakly-supervised Point Cloud
Semantic Segmentation [60.0893353960514]
疎アノテーションを用いた弱教師付きポイントクラウドセマンティックセマンティックセグメンテーションの課題について検討する。
本研究では,地域マスキング(RegionMask)戦略とコンテキストマスキングトレーニング(CMT)手法の2つの部分からなるコンテキストポイントクラウドモデリング(CPCM)手法を提案する。
論文 参考訳(メタデータ) (2023-07-19T04:41:18Z) - Self-supervised adversarial masking for 3D point cloud representation
learning [0.38233569758620056]
本稿では,点雲のマスキング関数を学習するための新しい逆法であるPointCAMを紹介する。
従来の手法と比較して,マスクをランダムに選択するのではなく,マスクの選択方法を学習する補助的ネットワークの適用を仮定する。
以上の結果から,学習したマスキング関数は,様々な下流タスクにおいて,最先端ないし競争的な性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-07-11T15:11:06Z) - GeoMAE: Masked Geometric Target Prediction for Self-supervised Point
Cloud Pre-Training [16.825524577372473]
幾何学的特徴再構成に基づくポイントクラウド表現学習フレームワークを提案する。
我々は,3つの自己教師型学習目標を特異点雲,すなわちセントロイド予測,正規推定,曲率予測と同定する。
私たちのパイプラインは概念的にはシンプルで、まずポイントのグループをランダムにマスキングし、次にTransformerベースのポイントクラウドエンコーダという2つの大きなステップで構成されています。
論文 参考訳(メタデータ) (2023-05-15T17:14:55Z) - Self-supervised Pre-training with Masked Shape Prediction for 3D Scene
Understanding [106.0876425365599]
Masked Shape Prediction (MSP)は、3Dシーンでマスクされた信号モデリングを行うための新しいフレームワークである。
MSPは3Dセマンティックキュー、すなわち幾何学的形状をマスクされた点の予測ターゲットとして使用する。
論文 参考訳(メタデータ) (2023-05-08T20:09:19Z) - MAPLE: Masked Pseudo-Labeling autoEncoder for Semi-supervised Point
Cloud Action Recognition [160.49403075559158]
本稿では,Pseudo-Labeling autoEncoder (textbfMAPLE) フレームワークを提案する。
特に、MAPLEのバックボーンとして、新規で効率的なtextbfDecoupled textbfspatial-textbftemporal TranstextbfFormer(textbfDestFormer)を設計する。
MAPLEは3つの公開ベンチマークにおいて優れた結果を得て、MSR-Action3の精度を8.08%向上させる。
論文 参考訳(メタデータ) (2022-09-01T12:32:40Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud
Pre-training [56.81809311892475]
Masked Autoencoders (MAE) は、言語と2次元画像変換器の自己教師付き事前学習において大きな可能性を示している。
我々は3次元点雲の階層的自己教師型学習のための強力なマルチスケールMAE事前学習フレームワークであるPoint-M2AEを提案する。
論文 参考訳(メタデータ) (2022-05-28T11:22:53Z) - Masked Discrimination for Self-Supervised Learning on Point Clouds [27.652157544218234]
マスク付きオートエンコーディングは、画像と言語領域における自己教師型学習において大きな成功を収めた。
PointNetのような標準的なバックボーンは、トレーニング中にマスクによって導入された分散ミスマッチのトレーニングとテストのミスマッチを適切に処理できない。
我々はこのギャップを、ポイントクラウドのための差別マスク事前学習フレームワークMaskPointを提案し、橋渡しする。
論文 参考訳(メタデータ) (2022-03-21T17:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。