論文の概要: Self-Supervised Point Cloud Representation Learning with Occlusion
Auto-Encoder
- arxiv url: http://arxiv.org/abs/2203.14084v1
- Date: Sat, 26 Mar 2022 14:06:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 14:37:23.878395
- Title: Self-Supervised Point Cloud Representation Learning with Occlusion
Auto-Encoder
- Title(参考訳): Occlusion Auto-Encoderを用いた自己教師付きポイントクラウド表現学習
- Authors: Junsheng Zhou, Xin Wen, Yu-Shen Liu, Yi Fang, Zhizhong Han
- Abstract要約: 本稿では,3D Occlusion Auto-Encoder(3D-OAE)を提案する。
私たちのキーとなるアイデアは、入力ポイントクラウドのローカルパッチをランダムに排除し、隠されたパッチを復元することで監督を確立することです。
従来の手法とは対照的に、我々の3D-OAEは大量のパッチを除去し、少数の可視パッチでしか予測できない。
- 参考スコア(独自算出の注目度): 63.77257588569852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning representations for point clouds is an important task in 3D computer
vision, especially without manually annotated supervision. Previous methods
usually take the common aid from auto-encoders to establish the
self-supervision by reconstructing the input itself. However, the existing
self-reconstruction based auto-encoders merely focus on the global shapes, and
ignore the hierarchical context between the local and global geometries, which
is a crucial supervision for 3D representation learning. To resolve this issue,
we present a novel self-supervised point cloud representation learning
framework, named 3D Occlusion Auto-Encoder (3D-OAE). Our key idea is to
randomly occlude some local patches of the input point cloud and establish the
supervision via recovering the occluded patches using the remaining visible
ones. Specifically, we design an encoder for learning the features of visible
local patches, and a decoder for leveraging these features to predict the
occluded patches. In contrast with previous methods, our 3D-OAE can remove a
large proportion of patches and predict them only with a small number of
visible patches, which enable us to significantly accelerate training and yield
a nontrivial self-supervisory performance. The trained encoder can be further
transferred to various downstream tasks. We demonstrate our superior
performances over the state-of-the-art methods in different discriminant and
generative applications under widely used benchmarks.
- Abstract(参考訳): ポイントクラウドの表現を学習することは、3dコンピュータビジョンにおいて、特に手作業による監督なしでは重要なタスクである。
以前の方法は、通常、オートエンコーダの共通の助けを借りて、入力自体を再構築することで自己超越を確立する。
しかし、既存の自己再構成に基づく自動エンコーダは、単にグローバルな形状にのみ焦点を合わせ、局所的およびグローバルなジオメトリ間の階層的文脈を無視する。
この問題を解決するために,3D Occlusion Auto-Encoder(3D-OAE)という,自己教師付きポイントクラウド表現学習フレームワークを提案する。
私たちのキーとなるアイデアは、入力ポイントクラウドのローカルパッチをランダムに排除し、残りの可視パッチを使用して隠されたパッチを復元することで監督を確立することです。
具体的には、視覚的局所パッチの特徴を学習するためのエンコーダと、これらの特徴を活用して隠蔽パッチを予測するデコーダを設計する。
従来の手法とは対照的に,我々の3D-OAEでは,多数のパッチを除去し,少数の可視パッチでしか予測できないため,トレーニングを著しく加速し,非自明な自己監督性能が得られる。
トレーニングされたエンコーダは、さらに様々な下流タスクに転送できる。
我々は、広く使用されているベンチマークにおいて、異なる判別アプリケーションや生成アプリケーションにおいて最先端のメソッドよりも優れた性能を示す。
関連論文リスト
- Towards Compact 3D Representations via Point Feature Enhancement Masked
Autoencoders [52.66195794216989]
本稿では,コンパクトな3D表現を学習するために,ポイント特徴強調マスク付きオートエンコーダ(Point-FEMAE)を提案する。
Point-FEMAEはグローバルブランチとローカルブランチで構成され、潜在意味的特徴をキャプチャする。
本手法は, クロスモーダル方式と比較して, 事前学習効率を著しく向上させる。
論文 参考訳(メタデータ) (2023-12-17T14:17:05Z) - Regress Before Construct: Regress Autoencoder for Point Cloud
Self-supervised Learning [18.10704604275133]
Masked Autoencoders (MAE) は、2Dおよび3Dコンピュータビジョンのための自己教師型学習において有望な性能を示した。
我々は、ポイントクラウド自己教師型学習のための回帰オートエンコーダの新しいスキーム、Point Regress AutoEncoder (Point-RAE)を提案する。
本手法は, 各種下流タスクの事前学習において効率よく, 一般化可能である。
論文 参考訳(メタデータ) (2023-09-25T17:23:33Z) - 3D Feature Prediction for Masked-AutoEncoder-Based Point Cloud Pretraining [45.58631796379208]
Masked Autoencoders (MAEs) は、最近ポイントクラウドのための3次元自己教師型事前トレーニングに導入されている。
本稿では,新しいアテンションベースデコーダを用いて,ポイント位置の復元を無視し,マスキングポイントの高次特徴を復元することを提案する。
我々は,3次元学習のための異なるエンコーダ構造を用いて,プリテキストタスクとデコーダ設計を検証し,様々なポイントクラウド解析タスクにおける事前学習ネットワークの利点を実証する。
論文 参考訳(メタデータ) (2023-04-14T03:25:24Z) - MAELi: Masked Autoencoder for Large-Scale LiDAR Point Clouds [13.426810473131642]
Masked AutoEncoder for LiDAR Point clouds (MAELi) は、復元中にエンコーダとデコーダの両方でLiDARポイントクラウドの空間性を直感的に活用する。
新たな再構築アプローチでは、MAELiは空空間と隠された空間を区別する。
これにより、MAELiは基礎となる3次元シーンの幾何学と意味論の理解を得る。
論文 参考訳(メタデータ) (2022-12-14T13:10:27Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - MAPLE: Masked Pseudo-Labeling autoEncoder for Semi-supervised Point
Cloud Action Recognition [160.49403075559158]
本稿では,Pseudo-Labeling autoEncoder (textbfMAPLE) フレームワークを提案する。
特に、MAPLEのバックボーンとして、新規で効率的なtextbfDecoupled textbfspatial-textbftemporal TranstextbfFormer(textbfDestFormer)を設計する。
MAPLEは3つの公開ベンチマークにおいて優れた結果を得て、MSR-Action3の精度を8.08%向上させる。
論文 参考訳(メタデータ) (2022-09-01T12:32:40Z) - Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud
Pre-training [56.81809311892475]
Masked Autoencoders (MAE) は、言語と2次元画像変換器の自己教師付き事前学習において大きな可能性を示している。
我々は3次元点雲の階層的自己教師型学習のための強力なマルチスケールMAE事前学習フレームワークであるPoint-M2AEを提案する。
論文 参考訳(メタデータ) (2022-05-28T11:22:53Z) - Implicit Autoencoder for Point-Cloud Self-Supervised Representation
Learning [39.521374237630766]
最もポピュラーでアクセスしやすい3D表現、すなわち点雲は、下層の連続した3D表面の離散的なサンプルを含む。
この離散化プロセスは3次元形状のサンプリングのバリエーションを導入し、真の3次元幾何学の伝達可能な知識を開発するのが困難になる。
標準的なオートエンコーディングパラダイムでは、エンコーダは3D形状だけでなく、3D形状の特定の離散サンプリングに関する情報を潜在コードにエンコードする。
これは、デコーダによって再構成された点雲が、原点と再構成された点との完全なマッピングがない限り、受け入れられないためである。
論文 参考訳(メタデータ) (2022-01-03T18:05:52Z) - A Self-Supervised Gait Encoding Approach with Locality-Awareness for 3D
Skeleton Based Person Re-Identification [65.18004601366066]
3Dスケルトン配列内の歩行特徴による人物再識別(Re-ID)は、いくつかの利点を持つ新しい話題である。
本稿では、ラベルのない骨格データを利用して人物の歩行表現を学習できる自己教師付き歩行符号化手法を提案する。
論文 参考訳(メタデータ) (2020-09-05T16:06:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。