論文の概要: 3D Object Detection with Pointformer
- arxiv url: http://arxiv.org/abs/2012.11409v1
- Date: Mon, 21 Dec 2020 15:12:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 06:31:47.926324
- Title: 3D Object Detection with Pointformer
- Title(参考訳): pointformerを用いた3次元物体検出
- Authors: Xuran Pan, Zhuofan Xia, Shiji Song, Li Erran Li, Gao Huang
- Abstract要約: 本稿では,3dポイントクラウドのためのトランスフォーマーバックボーンであるpointformerを提案する。
ローカルトランスフォーマーモジュールは、オブジェクトレベルでコンテキスト依存の領域特徴を学習するローカル領域のポイント間の相互作用をモデル化するために使用される。
Global Transformerは、シーンレベルでコンテキスト対応の表現を学ぶように設計されている。
- 参考スコア(独自算出の注目度): 29.935891419574602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature learning for 3D object detection from point clouds is very
challenging due to the irregularity of 3D point cloud data. In this paper, we
propose Pointformer, a Transformer backbone designed for 3D point clouds to
learn features effectively. Specifically, a Local Transformer module is
employed to model interactions among points in a local region, which learns
context-dependent region features at an object level. A Global Transformer is
designed to learn context-aware representations at the scene level. To further
capture the dependencies among multi-scale representations, we propose
Local-Global Transformer to integrate local features with global features from
higher resolution. In addition, we introduce an efficient coordinate refinement
module to shift down-sampled points closer to object centroids, which improves
object proposal generation. We use Pointformer as the backbone for
state-of-the-art object detection models and demonstrate significant
improvements over original models on both indoor and outdoor datasets.
- Abstract(参考訳): 3dポイントクラウドデータの不規則性のため、ポイントクラウドから3dオブジェクト検出のための機能学習は非常に難しい。
本稿では,3DポイントクラウドのためのトランスフォーマーバックボーンであるPointformerを提案し,その特徴を効果的に学習する。
具体的には、ローカルトランスフォーマーモジュールを使用して、オブジェクトレベルでコンテキスト依存の領域特徴を学習するローカル領域のポイント間の相互作用をモデル化する。
Global Transformerは、シーンレベルでコンテキスト対応の表現を学ぶように設計されている。
マルチスケール表現間の依存関係をさらに把握するために,ローカル特徴とグローバル特徴を高解像度から統合するローカル・グローバル・トランスフォーマーを提案する。
さらに,オブジェクトの提案生成を改善するために,ダウンサンプリングされた点をオブジェクトのセントロイドに近づける効率的な座標修正モジュールを導入する。
我々は、pointformerを最先端オブジェクト検出モデルのバックボーンとして使用し、屋内および屋外のデータセットにおいて、オリジナルモデルよりも大幅に改善しています。
関連論文リスト
- TransPose: 6D Object Pose Estimation with Geometry-Aware Transformer [16.674933679692728]
TransPoseは、Transformerをジオメトリ対応モジュールで活用して、ポイントクラウドの特徴表現の学習を改善する、新しい6Dポーズフレームワークである。
TransPoseは3つのベンチマークデータセットで競合する結果を達成する。
論文 参考訳(メタデータ) (2023-10-25T01:24:12Z) - APPT : Asymmetric Parallel Point Transformer for 3D Point Cloud
Understanding [20.87092793669536]
トランスフォーマーベースのネットワークは、3Dポイントクラウド理解において素晴らしいパフォーマンスを達成した。
これらの問題に対処するために,非対称並列点変換器(APPT)を提案する。
APPTは、ローカル詳細機能に集中しながら、ネットワーク全体を通して機能を取り込むことができる。
論文 参考訳(メタデータ) (2023-03-31T06:11:02Z) - Local region-learning modules for point cloud classification [0.0]
本研究では,各中心点に対する適切なシフトを推定し,各局所領域の半径を変化させる2つの局所学習モジュールを提案する。
どちらのモジュールも独立して、PointNet++とPointCNNオブジェクト分類アーキテクチャに統合しました。
ShapeNetデータセットを用いた実験の結果,モジュールは3次元CADモデルにも有効であることがわかった。
論文 参考訳(メタデータ) (2023-03-30T12:45:46Z) - Model-Agnostic Hierarchical Attention for 3D Object Detection [81.33112745926113]
変圧器を用いた3次元検出器のためのモジュラー化階層設計として,2つの新しい注意機構を提案する。
異なるスケールで機能学習を可能にするために,単一スケールの入力機能から複数スケールのトークンを構築するシンプルなマルチスケールアテンションを提案する。
局所的特徴集約のために,各バウンディングボックスの提案に対して適応的なアテンション範囲を持つサイズ適応型局所アテンションを提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection [85.170578641966]
半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
論文 参考訳(メタデータ) (2022-12-19T06:56:14Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - CpT: Convolutional Point Transformer for 3D Point Cloud Processing [10.389972581905]
CpT: Convolutional Point Transformer - 3Dポイントクラウドデータの非構造化の性質を扱うための新しいディープラーニングアーキテクチャ。
CpTは、既存の注目ベースのConvolutions Neural Networksと、以前の3Dポイントクラウド処理トランスフォーマーの改善である。
我々のモデルは、既存の最先端のアプローチと比較して、様々なポイントクラウド処理タスクの効果的なバックボーンとして機能する。
論文 参考訳(メタデータ) (2021-11-21T17:45:55Z) - LATFormer: Locality-Aware Point-View Fusion Transformer for 3D Shape
Recognition [38.540048855119004]
そこで我々は,3次元形状検索と分類のためのLATFormer(Locality-Aware Point-View Fusion Transformer)を提案する。
LATFormerの中核となるコンポーネントはLocality-Aware Fusion (LAF) という名前のモジュールで、2つのモードにまたがる関連領域の局所的特徴を統合する。
LATFormerでは,LAFモジュールを用いて双方向および階層的に2つのモードのマルチスケール機能を融合し,より情報的な特徴を得る。
論文 参考訳(メタデータ) (2021-09-03T03:23:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。