論文の概要: Implicit Autoencoder for Point-Cloud Self-Supervised Representation
Learning
- arxiv url: http://arxiv.org/abs/2201.00785v5
- Date: Sun, 27 Aug 2023 18:01:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 02:15:09.559839
- Title: Implicit Autoencoder for Point-Cloud Self-Supervised Representation
Learning
- Title(参考訳): ポイントクラウド型自己監督表現学習のためのインプシットオートエンコーダ
- Authors: Siming Yan, Zhenpei Yang, Haoxiang Li, Chen Song, Li Guan, Hao Kang,
Gang Hua, Qixing Huang
- Abstract要約: 最もポピュラーでアクセスしやすい3D表現、すなわち点雲は、下層の連続した3D表面の離散的なサンプルを含む。
この離散化プロセスは3次元形状のサンプリングのバリエーションを導入し、真の3次元幾何学の伝達可能な知識を開発するのが困難になる。
標準的なオートエンコーディングパラダイムでは、エンコーダは3D形状だけでなく、3D形状の特定の離散サンプリングに関する情報を潜在コードにエンコードする。
これは、デコーダによって再構成された点雲が、原点と再構成された点との完全なマッピングがない限り、受け入れられないためである。
- 参考スコア(独自算出の注目度): 39.521374237630766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper advocates the use of implicit surface representation in
autoencoder-based self-supervised 3D representation learning. The most popular
and accessible 3D representation, i.e., point clouds, involves discrete samples
of the underlying continuous 3D surface. This discretization process introduces
sampling variations on the 3D shape, making it challenging to develop
transferable knowledge of the true 3D geometry. In the standard autoencoding
paradigm, the encoder is compelled to encode not only the 3D geometry but also
information on the specific discrete sampling of the 3D shape into the latent
code. This is because the point cloud reconstructed by the decoder is
considered unacceptable unless there is a perfect mapping between the original
and the reconstructed point clouds. This paper introduces the Implicit
AutoEncoder (IAE), a simple yet effective method that addresses the sampling
variation issue by replacing the commonly-used point-cloud decoder with an
implicit decoder. The implicit decoder reconstructs a continuous representation
of the 3D shape, independent of the imperfections in the discrete samples.
Extensive experiments demonstrate that the proposed IAE achieves
state-of-the-art performance across various self-supervised learning
benchmarks.
- Abstract(参考訳): 本稿では,自己教師付き3次元表現学習における暗黙的表面表現の利用を提唱する。
最も人気のある3D表現、すなわち点雲は、下層の連続した3D表面の離散的なサンプルを含む。
この離散化過程は、3次元形状のサンプリング変動を導入し、真の3次元幾何学の移動可能な知識を開発することが困難になる。
標準的なオートエンコーディングパラダイムでは、エンコーダは3D形状だけでなく、3D形状の特定の離散サンプリングに関する情報を潜在コードにエンコードする。
これは、デコーダによって再構成された点雲は、原点と再構成された点雲の間に完全なマッピングがない限り、受け入れられないと考えられるためである。
本稿では,一般的なポイントクラウドデコーダを暗黙的デコーダに置き換えることで,サンプリング変動問題に対処する単純かつ効果的な手法である暗黙的オートエンコーダ(iae)を提案する。
暗黙のデコーダは、離散標本の不完全さとは無関係に、3次元形状の連続的な表現を再構成する。
広範な実験により、iaeは様々な自己教師付き学習ベンチマークにおいて最先端のパフォーマンスを達成できることが示されている。
関連論文リスト
- DatasetNeRF: Efficient 3D-aware Data Factory with Generative Radiance
Fields [73.97131748433212]
本稿では,無限で高品質な3Dアノテーションを3Dポイントクラウドセグメンテーションとともに生成できる新しいアプローチを提案する。
我々は3次元生成モデルに先立って強力なセマンティクスを活用してセマンティクスデコーダを訓練する。
トレーニングが完了すると、デコーダは遅延空間を効率よく一般化し、無限のデータの生成を可能にする。
論文 参考訳(メタデータ) (2023-11-18T21:58:28Z) - 3D Feature Prediction for Masked-AutoEncoder-Based Point Cloud Pretraining [45.58631796379208]
Masked Autoencoders (MAEs) は、最近ポイントクラウドのための3次元自己教師型事前トレーニングに導入されている。
本稿では,新しいアテンションベースデコーダを用いて,ポイント位置の復元を無視し,マスキングポイントの高次特徴を復元することを提案する。
我々は,3次元学習のための異なるエンコーダ構造を用いて,プリテキストタスクとデコーダ設計を検証し,様々なポイントクラウド解析タスクにおける事前学習ネットワークの利点を実証する。
論文 参考訳(メタデータ) (2023-04-14T03:25:24Z) - PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal
Distillation for 3D Shape Recognition [55.38462937452363]
本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。
複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文 参考訳(メタデータ) (2022-07-07T07:23:20Z) - SNAKE: Shape-aware Neural 3D Keypoint Field [62.91169625183118]
形状復元には点雲から3Dキーポイントを検出することが重要である。
形状再構成は3次元キーポイント検出に有効か?
本稿では,形状認識型ニューラル3Dキーポイントフィールドに短いSNAKEという,教師なしの新たなパラダイムを提案する。
論文 参考訳(メタデータ) (2022-06-03T17:58:43Z) - Self-Supervised Point Cloud Representation Learning with Occlusion
Auto-Encoder [63.77257588569852]
本稿では,3D Occlusion Auto-Encoder(3D-OAE)を提案する。
私たちのキーとなるアイデアは、入力ポイントクラウドのローカルパッチをランダムに排除し、隠されたパッチを復元することで監督を確立することです。
従来の手法とは対照的に、我々の3D-OAEは大量のパッチを除去し、少数の可視パッチでしか予測できない。
論文 参考訳(メタデータ) (2022-03-26T14:06:29Z) - Learning 3D Dense Correspondence via Canonical Point Autoencoder [108.20735652143787]
同一カテゴリの3次元形状間の密接な対応を予測できる標準点オートエンコーダ(CPAE)を提案する。
オートエンコーダは、2つの重要な機能を実行する: (a) 任意に順序付けられた点雲を標準プリミティブに符号化し、 (b) プリミティブを元の入力インスタンス形状に復号する。
論文 参考訳(メタデータ) (2021-07-10T15:54:48Z) - PvDeConv: Point-Voxel Deconvolution for Autoencoding CAD Construction in
3D [23.87757211847093]
コンピュータ支援設計(cad)モデルの基盤となる形状を密に記述した10k点の高分解能点雲を合成することを学ぶ。
50k以上のCADモデルとその対応する3Dメッシュを含む新しい専用データセット、CC3Dを紹介します。
このデータセットは、3Dスキャン(CADモデル)のペアからサンプリングされた点雲の畳み込みオートエンコーダを学ぶために使用される。
論文 参考訳(メタデータ) (2021-01-12T14:14:13Z) - Exploring Deep 3D Spatial Encodings for Large-Scale 3D Scene
Understanding [19.134536179555102]
生の3次元点雲の空間的特徴を非方向性グラフモデルに符号化することで,CNNに基づくアプローチの限界を克服する代替手法を提案する。
提案手法は、訓練時間とモデル安定性を改善して、最先端の精度で達成し、さらなる研究の可能性を示す。
論文 参考訳(メタデータ) (2020-11-29T12:56:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。