論文の概要: 3D Object Tracking with Transformer
- arxiv url: http://arxiv.org/abs/2110.14921v1
- Date: Thu, 28 Oct 2021 07:03:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-30 05:38:52.987849
- Title: 3D Object Tracking with Transformer
- Title(参考訳): トランスを用いた3次元物体追跡
- Authors: Yubo Cui, Zheng Fang, Jiayao Shan, Zuoxu Gu, Sifan Zhou
- Abstract要約: 特徴融合は、対象のオブジェクト情報を含めることで、類似性コンピューティングをより効率的にする。
既存のLiDARベースのアプローチのほとんどは、抽出されたポイントクラウド機能を直接使用して類似性を計算している。
本稿では,トランスアーキテクチャに基づく機能融合ネットワークを提案する。
- 参考スコア(独自算出の注目度): 6.848996369226086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature fusion and similarity computation are two core problems in 3D object
tracking, especially for object tracking using sparse and disordered point
clouds. Feature fusion could make similarity computing more efficient by
including target object information. However, most existing LiDAR-based
approaches directly use the extracted point cloud feature to compute similarity
while ignoring the attention changes of object regions during tracking. In this
paper, we propose a feature fusion network based on transformer architecture.
Benefiting from the self-attention mechanism, the transformer encoder captures
the inter- and intra- relations among different regions of the point cloud. By
using cross-attention, the transformer decoder fuses features and includes more
target cues into the current point cloud feature to compute the region
attentions, which makes the similarity computing more efficient. Based on this
feature fusion network, we propose an end-to-end point cloud object tracking
framework, a simple yet effective method for 3D object tracking using point
clouds. Comprehensive experimental results on the KITTI dataset show that our
method achieves new state-of-the-art performance. Code is available at:
https://github.com/3bobo/lttr.
- Abstract(参考訳): 特徴融合と類似性計算は、特にスパースと乱れ点雲を用いた物体追跡における3次元物体追跡における2つの主要な問題である。
特徴融合は、対象のオブジェクト情報を含めることで、類似性コンピューティングをより効率的にする。
しかし、既存のLiDARベースのアプローチのほとんどは、抽出したポイントクラウド機能を直接使用して類似性を計算し、トラッキング中のオブジェクト領域の注意変化を無視している。
本稿では,変圧器アーキテクチャに基づく機能融合ネットワークを提案する。
自己着脱機構の利点により、トランスコーダは点雲の異なる領域間の相互関係と内部関係をキャプチャする。
クロスアテンションを使用することで、transformerデコーダは機能を融合し、現在のpoint cloud機能により多くのターゲットヒントを追加して、リージョンの注目度を計算し、類似性コンピューティングをより効率的にする。
この特徴融合ネットワークに基づいて,ポイントクラウドを用いた3次元オブジェクト追跡のための簡易かつ効果的な手法であるエンドツーエンドのクラウドオブジェクト追跡フレームワークを提案する。
KITTIデータセットの総合的な実験結果から,本手法が新たな最先端性能を実現することを示す。
コードはhttps://github.com/3bobo/lttr.com/。
関連論文リスト
- PTT: Point-Trajectory Transformer for Efficient Temporal 3D Object Detection [66.94819989912823]
時間的3次元物体検出を効率的に行うために,長期記憶が可能な点トラジェクトリ変換器を提案する。
私たちは、メモリバンクのストレージ要件を最小限に抑えるために、現在のフレームオブジェクトのポイントクラウドとその履歴トラジェクトリを入力として使用します。
大規模データセットに対する広範な実験を行い、我々のアプローチが最先端の手法に対してうまく機能することを実証した。
論文 参考訳(メタデータ) (2023-12-13T18:59:13Z) - STTracker: Spatio-Temporal Tracker for 3D Single Object Tracking [11.901758708579642]
ポイントクラウドによる3Dオブジェクトのトラッキングは、3Dコンピュータビジョンにおいて重要なタスクである。
以前の方法は、通常、最後の2つのフレームを入力し、前のフレームのテンプレートポイントクラウドと現在のフレームの検索エリアポイントクラウドを使用する。
論文 参考訳(メタデータ) (2023-06-30T07:25:11Z) - Point Cloud Classification Using Content-based Transformer via
Clustering in Feature Space [25.57569871876213]
本稿では,PointConTと呼ばれるポイントコンテントベースのトランスフォーマーアーキテクチャを提案する。
特徴空間内の点(コンテンツベース)の局所性を利用して、類似した特徴を持つサンプルポイントを同じクラスにクラスタし、各クラス内の自己アテンションを計算する。
また,各枝の高周波・低周波情報を並列構造を用いて個別に集約するインセプション機能アグリゲータも導入した。
論文 参考訳(メタデータ) (2023-03-08T14:11:05Z) - CXTrack: Improving 3D Point Cloud Tracking with Contextual Information [59.55870742072618]
3Dオブジェクトトラッキングは、自律運転など、多くのアプリケーションにおいて重要な役割を果たす。
CXTrackは3次元オブジェクト追跡のためのトランスフォーマーベースのネットワークである。
CXTrackは29FPSで動作しながら最先端のトラッキング性能を実現する。
論文 参考訳(メタデータ) (2022-11-12T11:29:01Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - Exploiting More Information in Sparse Point Cloud for 3D Single Object
Tracking [9.693724357115762]
3Dオブジェクトトラッキングは、3Dコンピュータビジョンにおける重要なタスクである。
点雲の空間性は、類似性を計算し、対象を見つけるのを難しくする。
本稿では3次元オブジェクト追跡のためのスパース・トゥ・デンス・トランスフォーマー・ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-02T13:38:30Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - TransPillars: Coarse-to-Fine Aggregation for Multi-Frame 3D Object
Detection [47.941714033657675]
ポイントクラウドを用いた3Dオブジェクト検出は、自律走行とロボット工学に広く応用されているため、注目を集めている。
連続点雲フレームの時間的特徴を生かしたトランスピラース(TransPillars)を設計する。
提案するTransPillarsは,既存のマルチフレーム検出手法と比較して最先端性能を実現する。
論文 参考訳(メタデータ) (2022-08-04T15:41:43Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - 3D-SiamRPN: An End-to-End Learning Method for Real-Time 3D Single Object
Tracking Using Raw Point Cloud [9.513194898261787]
3D-SiamRPN Network と呼ばれる3次元追跡手法を提案する。
KITTIデータセットによる実験結果から,本手法は成功と精度の両面で競合する性能を示した。
論文 参考訳(メタデータ) (2021-08-12T09:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。