論文の概要: FPConv: Learning Local Flattening for Point Convolution
- arxiv url: http://arxiv.org/abs/2002.10701v3
- Date: Sat, 14 Mar 2020 04:13:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:46:16.963178
- Title: FPConv: Learning Local Flattening for Point Convolution
- Title(参考訳): FPConv: ポイントコンボリューションのための局所フレッテニング学習
- Authors: Yiqun Lin, Zizheng Yan, Haibin Huang, Dong Du, Ligang Liu, Shuguang
Cui and Xiaoguang Han
- Abstract要約: FPConvは3次元点雲解析のために設計された新しい表面形状の畳み込み演算子である。
従来の方法とは異なり、FPConvは3Dグリッドやグラフのような中間表現への変換を必要としない。
FPConvは3Dオブジェクト分類や3Dシーンセグメンテーションといったタスクのために、様々なネットワークアーキテクチャに簡単に統合できる。
- 参考スコア(独自算出の注目度): 64.01196188303483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce FPConv, a novel surface-style convolution operator designed for
3D point cloud analysis. Unlike previous methods, FPConv doesn't require
transforming to intermediate representation like 3D grid or graph and directly
works on surface geometry of point cloud. To be more specific, for each point,
FPConv performs a local flattening by automatically learning a weight map to
softly project surrounding points onto a 2D grid. Regular 2D convolution can
thus be applied for efficient feature learning. FPConv can be easily integrated
into various network architectures for tasks like 3D object classification and
3D scene segmentation, and achieve comparable performance with existing
volumetric-type convolutions. More importantly, our experiments also show that
FPConv can be a complementary of volumetric convolutions and jointly training
them can further boost overall performance into state-of-the-art results.
- Abstract(参考訳): FPConvは3次元点雲解析のために設計された新しい表面形状の畳み込み演算子である。
従来の方法とは異なり、fpconvは3dグリッドやグラフのような中間表現への変換を必要とせず、ポイントクラウドの表面形状に直接作用する。
さらに具体的に言うと、FPConvは2Dグリッド上に周囲の点をソフトに投影するウェイトマップを自動的に学習することで局所平坦化を行う。
したがって、通常の2次元畳み込みは効率的な特徴学習に応用できる。
FPConvは3Dオブジェクト分類や3Dシーンセグメンテーションといったタスクのために様々なネットワークアーキテクチャに容易に統合でき、既存のボリューム型畳み込みと同等のパフォーマンスを実現することができる。
より重要なことに、fpconvはボリュームコンボリューションを補完し、それらを共同でトレーニングすることで、全体的なパフォーマンスをさらに向上させ、最先端の成果を得ることができます。
関連論文リスト
- Dynamic 3D Point Cloud Sequences as 2D Videos [81.46246338686478]
3Dポイントクラウドシーケンスは、現実世界の環境における最も一般的で実用的な表現の1つとして機能する。
textitStructured Point Cloud Videos (SPCV) と呼ばれる新しい汎用表現を提案する。
SPCVは点雲列を空間的滑らかさと時間的一貫性を持つ2Dビデオとして再編成し、画素値は点の3D座標に対応する。
論文 参考訳(メタデータ) (2024-03-02T08:18:57Z) - MVTN: Learning Multi-View Transformations for 3D Understanding [60.15214023270087]
本稿では,3次元形状認識のための最適視点を決定するために,可変レンダリングを用いたマルチビュー変換ネットワーク(MVTN)を提案する。
MVTNは3次元形状認識のためのマルチビューネットワークでエンドツーエンドに訓練することができる。
提案手法は,複数のベンチマークによる3次元分類と形状検索における最先端性能を示す。
論文 参考訳(メタデータ) (2022-12-27T12:09:16Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Projection-based Point Convolution for Efficient Point Cloud
Segmentation [24.375383511061955]
投影ベースのポイント・コンボリューション(PPConv)は、2Dコンボリューションと多層パーセプトロン(MLP)をコンポーネントとして使用するポイント・コンボリューションモジュールである。
PPConvは、PointNet++をベースとしたシンプルなアーキテクチャであっても、最先端のメソッドよりも優れた効率を実現している。
論文 参考訳(メタデータ) (2022-02-04T06:22:33Z) - CpT: Convolutional Point Transformer for 3D Point Cloud Processing [10.389972581905]
CpT: Convolutional Point Transformer - 3Dポイントクラウドデータの非構造化の性質を扱うための新しいディープラーニングアーキテクチャ。
CpTは、既存の注目ベースのConvolutions Neural Networksと、以前の3Dポイントクラウド処理トランスフォーマーの改善である。
我々のモデルは、既存の最先端のアプローチと比較して、様々なポイントクラウド処理タスクの効果的なバックボーンとして機能する。
論文 参考訳(メタデータ) (2021-11-21T17:45:55Z) - Concentric Spherical GNN for 3D Representation Learning [53.45704095146161]
同心球面特徴写像を学習するための新しい多解畳み込みアーキテクチャを提案する。
当社の階層的アーキテクチャは、球内情報と球間情報の両方を組み込むための代替学習に基づいています。
回転データを用いた3次元分類作業における最先端性能向上へのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-03-18T19:05:04Z) - The Devils in the Point Clouds: Studying the Robustness of Point Cloud
Convolutions [15.997907568429177]
本稿では,点群上の畳み込みネットワークであるPointConvの異なる変種を調査し,入力スケールと回転変化に対する堅牢性を検討する。
3次元幾何学的性質をpointconvへの入力として利用し,新しい視点不変ディスクリプタを導出する。
2D MNIST & CIFAR-10データセットと3D Semantic KITTI & ScanNetデータセットで実験が行われた。
論文 参考訳(メタデータ) (2021-01-19T19:32:38Z) - KAPLAN: A 3D Point Descriptor for Shape Completion [80.15764700137383]
KAPLANは、一連の2D畳み込みを通じて局所的な形状情報を集約する3Dポイント記述子である。
各平面において、正規点や平面間距離のような点特性は2次元グリッドに集約され、効率的な2次元畳み込みエンコーダを持つ特徴表現に抽象化される。
公開データセットの実験では、KAPLANが3D形状の完成のために最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2020-07-31T21:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。