論文の概要: Learning Latent Part-Whole Hierarchies for Point Clouds
- arxiv url: http://arxiv.org/abs/2211.07082v1
- Date: Mon, 14 Nov 2022 03:17:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 18:23:48.949537
- Title: Learning Latent Part-Whole Hierarchies for Point Clouds
- Title(参考訳): ポイントクラウドのための潜在部分ホール階層の学習
- Authors: Xiang Gao, Wei Hu, Renjie Liao
- Abstract要約: 本稿では,ポイントクラウドセグメンテーションのための部分階層を明示的に学習するエンコーダ-デコーダスタイルの潜在変数モデルを提案する。
提案手法は,トップレベル部分分割だけでなく,ミドルレベル潜在部分分割においても,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 41.288934432615676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Strong evidence suggests that humans perceive the 3D world by parsing visual
scenes and objects into part-whole hierarchies. Although deep neural networks
have the capability of learning powerful multi-level representations, they can
not explicitly model part-whole hierarchies, which limits their expressiveness
and interpretability in processing 3D vision data such as point clouds. To this
end, we propose an encoder-decoder style latent variable model that explicitly
learns the part-whole hierarchies for the multi-level point cloud segmentation.
Specifically, the encoder takes a point cloud as input and predicts the
per-point latent subpart distribution at the middle level. The decoder takes
the latent variable and the feature from the encoder as an input and predicts
the per-point part distribution at the top level. During training, only
annotated part labels at the top level are provided, thus making the whole
framework weakly supervised. We explore two kinds of approximated inference
algorithms, i.e., most-probable-latent and Monte Carlo methods, and three
stochastic gradient estimations for learning discrete latent variables, i.e.,
straight-through, REINFORCE, and pathwise estimators. Experimental results on
the PartNet dataset show that the proposed method achieves state-of-the-art
performance in not only top-level part segmentation but also middle-level
latent subpart segmentation.
- Abstract(参考訳): 強力な証拠は、視覚シーンとオブジェクトを部分階層に解析することで、人間が3d世界を知覚することを示唆している。
ディープニューラルネットワークは強力なマルチレベル表現を学習する能力を持っているが、ポイントクラウドのような3Dビジョンデータを処理する際の表現性と解釈性を制限する部分全体階層を明示的にモデル化することはできない。
そこで本研究では,マルチレベルクラウドセグメンテーションのための部分階層を明示的に学習するエンコーダ-デコーダスタイルの潜在変数モデルを提案する。
具体的には、エンコーダはポイントクラウドを入力として、中間レベルでのポイント毎の潜在部分分布を予測する。
デコーダは、エンコーダから潜在変数と特徴を入力として、トップレベルでポイント毎の部品分布を予測する。
トレーニング中、トップレベルのアノテートされた部分ラベルのみが提供され、フレームワーク全体が弱く監督される。
我々は、最も確率の大きいモンテカルロ法と、離散潜在変数(ストレートスルー、REINFORCE、パスワイズ推定器)を学習するための3つの確率勾配推定法という2種類の近似推論アルゴリズムを探索する。
実験の結果,本手法はトップレベル部分のセグメンテーションだけでなく,中レベル潜在部分のセグメンテーションにおいても最先端の性能を実現することがわかった。
関連論文リスト
- GrowSP: Unsupervised Semantic Segmentation of 3D Point Clouds [12.597717463575478]
そこで本研究では,3次元シーンの各点における複雑なセマンティッククラスを識別するために,GrowSPと呼ばれる教師なしの最初の手法を提案する。
提案手法は,(1)入力点雲から点ごとの特徴を学習する特徴抽出器,(2)スーパーポイントのサイズを徐々に拡大するスーパーポイントコンストラクタ,(3)スーパーポイントを意味的要素にグループ化するセマンティックプリミティブクラスタリングモジュールからなる。
提案手法を複数のデータセット上で広範囲に評価し,教師なしベースラインに対して優れた性能を示し,従来の完全教師付きポイントネットにアプローチした。
論文 参考訳(メタデータ) (2023-05-25T18:11:21Z) - Unsupervised Representation Learning for 3D Point Cloud Data [66.92077180228634]
我々は、教師なしのポイントクラウド学習に対して、シンプルで効果的なアプローチを提案する。
特に、原点雲の優れたコントラストバージョンを生成する非常に有用な変換を同定する。
本研究では,3次元オブジェクト分類,形状部分分割,シーン分割の3つの下流タスクについて実験を行った。
論文 参考訳(メタデータ) (2021-10-13T10:52:45Z) - UPDesc: Unsupervised Point Descriptor Learning for Robust Registration [54.95201961399334]
UPDescは、ロバストポイントクラウド登録のためのポイント記述子を学習するための教師なしの方法である。
学習した記述子は既存の教師なし手法よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-08-05T17:11:08Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Omni-supervised Point Cloud Segmentation via Gradual Receptive Field
Component Reasoning [41.83979510282989]
提案した RFCR (Receptive Field Component Reasoning) を通したクラウドセグメンテーションに,最初のオムニスケール監視手法を導入する。
提案手法は,S3DIS と Semantic3D に対して新たな最先端性能を実現し,ScanNet ベンチマークの1位にランクインする。
論文 参考訳(メタデータ) (2021-05-21T08:32:02Z) - Unsupervised Feedforward Feature (UFF) Learning for Point Cloud
Classification and Segmentation [57.62713515497585]
3次元点雲の連成分類とセグメンテーションのために,教師なしフィードフォワード特徴学習を提案する。
UFF法は、点雲セット内の点の統計的相関を利用して、1パスのフィードフォワード方式で形状と点の特徴を学習する。
エンコーダとローカルポイントでグローバルな形状の特徴を、エンコーダ-デコーダアーキテクチャを通して学習する。
論文 参考訳(メタデータ) (2020-09-02T18:25:25Z) - Campus3D: A Photogrammetry Point Cloud Benchmark for Hierarchical
Understanding of Outdoor Scene [76.4183572058063]
複数の屋外シーン理解タスクに対して,リッチな注釈付き3Dポイントクラウドデータセットを提案する。
データセットは階層型ラベルとインスタンスベースのラベルの両方でポイントワイズアノテートされている。
本稿では,3次元点雲分割のための階層的学習問題を定式化し,様々な階層間の整合性を評価することを提案する。
論文 参考訳(メタデータ) (2020-08-11T19:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。