論文の概要: Distillation with Contrast is All You Need for Self-Supervised Point
Cloud Representation Learning
- arxiv url: http://arxiv.org/abs/2202.04241v1
- Date: Wed, 9 Feb 2022 02:51:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 15:11:32.398097
- Title: Distillation with Contrast is All You Need for Self-Supervised Point
Cloud Representation Learning
- Title(参考訳): 自己監督型ポイントクラウド表現学習に必要なコントラストによる蒸留
- Authors: Kexue Fu and Peng Gao and Renrui Zhang and Hongsheng Li and Yu Qiao
and Manning Wang
- Abstract要約: 本稿では,自己教師付きポイントクラウド表現学習のためのシンプルで汎用的なフレームワークを提案する。
人類が世界を理解する方法に触発されて、我々は知識蒸留を利用して、グローバルな形状情報と、グローバルな形状と局所的な構造の関係の両方を学ぶ。
本手法は,線形分類および複数の下流タスクにおける最先端性能を実現する。
- 参考スコア(独自算出の注目度): 53.90317574898643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a simple and general framework for self-supervised
point cloud representation learning. Human beings understand the 3D world by
extracting two levels of information and establishing the relationship between
them. One is the global shape of an object, and the other is the local
structures of it. However, few existing studies in point cloud representation
learning explored how to learn both global shapes and local-to-global
relationships without a specified network architecture. Inspired by how human
beings understand the world, we utilize knowledge distillation to learn both
global shape information and the relationship between global shape and local
structures. At the same time, we combine contrastive learning with knowledge
distillation to make the teacher network be better updated. Our method achieves
the state-of-the-art performance on linear classification and multiple other
downstream tasks. Especially, we develop a variant of ViT for 3D point cloud
feature extraction, which also achieves comparable results with existing
backbones when combined with our framework, and visualization of the attention
maps show that our model does understand the point cloud by combining the
global shape information and multiple local structural information, which is
consistent with the inspiration of our representation learning method. Our code
will be released soon.
- Abstract(参考訳): 本稿では,自己教師付きポイントクラウド表現学習のための単純で汎用的なフレームワークを提案する。
人間は2つのレベルの情報を抽出し、それらの関係を確立することで3D世界を理解する。
1つは対象の大域的形状であり、もう1つはその局所構造である。
しかし、ポイントクラウド表現学習における既存の研究は、特定のネットワークアーキテクチャを使わずに、グローバル形状とローカル-グローバル関係の両方を学ぶ方法を検討した。
人間がどのように世界を理解するかに触発されて、知識蒸留を利用して地球形状情報と地球形状と局所構造の関係を学習する。
同時に,コントラスト学習と知識蒸留を組み合わせることで,教師ネットワークをより良く更新する。
本手法は,線形分類および複数の下流タスクにおける最先端性能を実現する。
特に,我々のフレームワークと組み合わせた場合,既存のバックボーンに匹敵する結果が得られる3Dポイントクラウド特徴抽出用ViTの変種を開発し,アテンションマップの可視化により,グローバルな形状情報と複数の局所構造情報を組み合わせることで,我々のモデルがポイントクラウドを理解していることを示す。
私たちのコードはまもなくリリースされます。
関連論文リスト
- Multi-network Contrastive Learning Based on Global and Local
Representations [4.190134425277768]
本稿では,グローバルおよびローカル表現に基づくマルチネットワークコントラスト学習フレームワークを提案する。
複数のネットワークを通じて自己指導型コントラスト学習のためのグローバル・ローカル特徴情報を導入する。
また、コントラストに使用されるサンプルの数を増やし、モデルのトレーニング効率を向上させる。
論文 参考訳(メタデータ) (2023-06-28T05:30:57Z) - CrossPoint: Self-Supervised Cross-Modal Contrastive Learning for 3D
Point Cloud Understanding [2.8661021832561757]
CrossPointは、転送可能な3Dポイントクラウド表現を学習するための、単純なクロスモーダルコントラスト学習アプローチである。
提案手法は,従来の教師なし学習手法よりも,3次元オブジェクト分類やセグメンテーションなど,さまざまな下流タスクにおいて優れていた。
論文 参考訳(メタデータ) (2022-03-01T18:59:01Z) - Self-Supervised Feature Learning from Partial Point Clouds via Pose
Disentanglement [35.404285596482175]
部分点雲から情報表現を学習するための,新たな自己教師型フレームワークを提案する。
コンテンツとポーズ属性の両方を含むLiDARでスキャンされた部分点雲を利用する。
提案手法は,既存の自己教師付き手法に勝るだけでなく,合成および実世界のデータセット間でのより優れた一般化性を示す。
論文 参考訳(メタデータ) (2022-01-09T14:12:50Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Concentric Spherical GNN for 3D Representation Learning [53.45704095146161]
同心球面特徴写像を学習するための新しい多解畳み込みアーキテクチャを提案する。
当社の階層的アーキテクチャは、球内情報と球間情報の両方を組み込むための代替学習に基づいています。
回転データを用いた3次元分類作業における最先端性能向上へのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-03-18T19:05:04Z) - Shape-Oriented Convolution Neural Network for Point Cloud Analysis [59.405388577930616]
ポイントクラウドは3次元幾何学情報符号化に採用されている主要なデータ構造である。
形状指向型メッセージパッシング方式であるShapeConvを提案する。
論文 参考訳(メタデータ) (2020-04-20T16:11:51Z) - Cascaded Refinement Network for Point Cloud Completion [74.80746431691938]
本稿では,細かな物体形状を合成するための粗大な戦略とともに,カスケード型精細化ネットワークを提案する。
部分入力の局所的な詳細と大域的な形状情報を合わせて考えると、既存の詳細を不完全点集合に保存することができる。
また、各局所領域が同じパターンと基底的真理を持つことを保証し、複雑な点分布を学習するパッチ判別器を設計する。
論文 参考訳(メタデータ) (2020-04-07T13:03:29Z) - Global-Local Bidirectional Reasoning for Unsupervised Representation
Learning of 3D Point Clouds [109.0016923028653]
局所構造とグローバル形状の双方向推論による点雲表現を人間の監督なしに学習する。
本研究では, 実世界の3次元オブジェクト分類データセットにおいて, 教師なしモデルが最先端の教師付き手法を超越していることを示す。
論文 参考訳(メタデータ) (2020-03-29T08:26:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。