論文の概要: Fast Point Transformer
- arxiv url: http://arxiv.org/abs/2112.04702v1
- Date: Thu, 9 Dec 2021 05:04:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-12-10 15:00:50.867285
- Title: Fast Point Transformer
- Title(参考訳): 高速点変圧器
- Authors: Chunghyun Park, Yoonwoo Jeong, Minsu Cho, Jaesik Park
- Abstract要約: 本稿では,新しい軽量セルフアテンション層からなるFast Point Transformerを提案する。
提案手法は連続した3次元座標を符号化し,ボクセルハッシュに基づくアーキテクチャにより計算効率が向上する。
提案手法の精度は最良なボクセル法と競合し,提案手法は現状のPoint Transformerの136倍の高速化を実現している。
- 参考スコア(独自算出の注目度): 39.96609666253924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent success of neural networks enables a better interpretation of 3D
point clouds, but processing a large-scale 3D scene remains a challenging
problem. Most current approaches divide a large-scale scene into small regions
and combine the local predictions together. However, this scheme inevitably
involves additional stages for pre- and post-processing and may also degrade
the final output due to predictions in a local perspective. This paper
introduces Fast Point Transformer that consists of a new lightweight
self-attention layer. Our approach encodes continuous 3D coordinates, and the
voxel hashing-based architecture boosts computational efficiency. The proposed
method is demonstrated with 3D semantic segmentation and 3D detection. The
accuracy of our approach is competitive to the best voxel-based method, and our
network achieves 136 times faster inference time than the state-of-the-art,
Point Transformer, with a reasonable accuracy trade-off.
- Abstract(参考訳): 最近のニューラルネットワークの成功により、3Dポイントクラウドの解釈がより良くなったが、大規模な3Dシーンの処理は依然として難しい問題である。
現在のほとんどのアプローチでは、大規模なシーンを小さなリージョンに分割し、ローカルな予測を組み合わせる。
しかし、このスキームは必然的に前処理と後処理のための追加段階を伴い、また局所的な観点からの予測によって最終的な出力が低下する可能性がある。
本稿では,新しい軽量セルフアテンション層からなるFast Point Transformerを提案する。
提案手法は連続3次元座標を符号化し,voxelハッシュに基づくアーキテクチャにより計算効率が向上する。
提案手法は3次元セマンティックセグメンテーションと3次元検出で実証される。
我々のアプローチの精度は、最も優れたvoxelベースの手法に匹敵するものであり、ネットワークは、合理的な精度のトレードオフで、最先端のポイントトランスフォーマーよりも136倍高速に推論できる。
関連論文リスト
- ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Point-Voxel Transformer: An Efficient Approach To 3D Deep Learning [5.236787242129767]
本稿では,ポイント・ボクセル変換器 (PVT) と呼ばれる新しい3次元変換器を提案する。
提案手法はトランスフォーマーアーキテクチャの可能性を完全に活用し,効率よく正確な認識を行う。
論文 参考訳(メタデータ) (2021-08-13T06:07:57Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - DV-Det: Efficient 3D Point Cloud Object Detection with Dynamic
Voxelization [0.0]
本稿では,効率的な3Dポイント・クラウド・オブジェクト検出のための新しい2段階フレームワークを提案する。
生のクラウドデータを3D空間で直接解析するが、目覚ましい効率と精度を実現する。
我々は,75 FPSでKITTI 3Dオブジェクト検出データセットを,25 FPSの推論速度で良好な精度でOpenデータセット上で強調する。
論文 参考訳(メタデータ) (2021-07-27T10:07:39Z) - Exploring Deep 3D Spatial Encodings for Large-Scale 3D Scene
Understanding [19.134536179555102]
生の3次元点雲の空間的特徴を非方向性グラフモデルに符号化することで,CNNに基づくアプローチの限界を克服する代替手法を提案する。
提案手法は、訓練時間とモデル安定性を改善して、最先端の精度で達成し、さらなる研究の可能性を示す。
論文 参考訳(メタデータ) (2020-11-29T12:56:19Z) - 3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。
提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-02-24T12:01:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。