論文の概要: 3D Siamese Transformer Network for Single Object Tracking on Point
Clouds
- arxiv url: http://arxiv.org/abs/2207.11995v2
- Date: Tue, 26 Jul 2022 08:43:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-27 10:35:37.285582
- Title: 3D Siamese Transformer Network for Single Object Tracking on Point
Clouds
- Title(参考訳): 3d siamese transformer network for single object tracking on point clouds (情報ネットワーク)
- Authors: Le Hui, Lingpeng Wang, Linghua Tang, Kaihao Lan, Jin Xie, Jian Yang
- Abstract要約: シームズネットワークに基づくトラッカーは、テンプレートの点特徴と検索領域との間の相互相関学習として、3Dオブジェクト追跡を定式化する。
テンプレートと検索領域間の堅牢な相互相関を学習するために,Transformer を用いて 3D Siamese Transformer ネットワークを構築した。
本手法は,3次元物体追跡タスクにおける最先端性能を実現する。
- 参考スコア(独自算出の注目度): 22.48888264770609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Siamese network based trackers formulate 3D single object tracking as
cross-correlation learning between point features of a template and a search
area. Due to the large appearance variation between the template and search
area during tracking, how to learn the robust cross correlation between them
for identifying the potential target in the search area is still a challenging
problem. In this paper, we explicitly use Transformer to form a 3D Siamese
Transformer network for learning robust cross correlation between the template
and the search area of point clouds. Specifically, we develop a Siamese point
Transformer network to learn shape context information of the target. Its
encoder uses self-attention to capture non-local information of point clouds to
characterize the shape information of the object, and the decoder utilizes
cross-attention to upsample discriminative point features. After that, we
develop an iterative coarse-to-fine correlation network to learn the robust
cross correlation between the template and the search area. It formulates the
cross-feature augmentation to associate the template with the potential target
in the search area via cross attention. To further enhance the potential
target, it employs the ego-feature augmentation that applies self-attention to
the local k-NN graph of the feature space to aggregate target features.
Experiments on the KITTI, nuScenes, and Waymo datasets show that our method
achieves state-of-the-art performance on the 3D single object tracking task.
- Abstract(参考訳): siamese networkベースのトラッカーは、3dシングルオブジェクトトラッキングをテンプレートのポイント特徴と検索領域の間の相互相関学習として定式化する。
追跡中のテンプレートと検索領域の外観変化が大きいため,検索領域の潜在的なターゲットを特定するために,それら間の堅牢な相互相関を学習する方法は依然として難しい問題である。
本稿では,テンプレートと点雲の探索領域間の堅牢な相互相関を学習するために,Transformer を用いて 3D Siamese Transformer ネットワークを構築した。
具体的には、ターゲットの形状コンテキスト情報を学習するシームズ点変換器ネットワークを開発する。
そのエンコーダは自己アテンションを使用して点雲の非局所情報をキャプチャし、対象の形状情報を特徴付けし、デコーダはクロスアテンションを使用して識別点の特徴をアップサンプルする。
その後,テンプレートと検索領域のロバストな相互相関を学習するために,反復的な粗粒間相関ネットワークを開発した。
クロスフィーチャー拡張を定式化し、クロスアテンションによって、テンプレートと検索領域の潜在的なターゲットを関連付ける。
潜在的なターゲットをさらに強化するために、特徴空間の局所的k-nnグラフに自己アテンションを適用してターゲット特徴を集約するego-feature拡張を用いる。
KITTI, nuScenes, Waymoデータセットを用いた実験により, 本手法が3次元物体追跡タスクにおける最先端性能を実現することを示す。
関連論文リスト
- Multi-Correlation Siamese Transformer Network with Dense Connection for
3D Single Object Tracking [14.47355191520578]
ポイントクラウドベースの3Dオブジェクトトラッキングは、自動運転において重要なタスクである。
スパースLIDARポイントクラウドデータでテンプレートと検索ブランチの相関を効果的に学習することは依然として困難である。
本稿では,複数のステージを持つマルチ相関シームス変圧器ネットワークを提案し,各ステージの最後に特徴相関を行う。
論文 参考訳(メタデータ) (2023-12-18T09:33:49Z) - Correlation Pyramid Network for 3D Single Object Tracking [16.694809791177263]
本稿では,統合エンコーダとモーションファクターデコーダを備えた新しい相関ピラミッドネットワーク(CorpNet)を提案する。
CorpNetは、リアルタイムに実行しながら最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-05-16T06:07:20Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - CXTrack: Improving 3D Point Cloud Tracking with Contextual Information [59.55870742072618]
3Dオブジェクトトラッキングは、自律運転など、多くのアプリケーションにおいて重要な役割を果たす。
CXTrackは3次元オブジェクト追跡のためのトランスフォーマーベースのネットワークである。
CXTrackは29FPSで動作しながら最先端のトラッキング性能を実現する。
論文 参考訳(メタデータ) (2022-11-12T11:29:01Z) - Point Cloud Registration-Driven Robust Feature Matching for 3D Siamese
Object Tracking [24.97192595209272]
テンプレートと検索領域間のロバストな特徴マッチングを学習することは、3Dシームズトラッキングにとって不可欠である。
そこで我々は,空間的に対応する点が一貫した特徴表現を実現する傾向にあるという直感をもって,新しいクラウド登録駆動のシームズ追跡フレームワークを提案する。
本手法は,追跡専用非局所登録モジュールと登録支援Sinkhornテンプレート機能集約モジュールの2つのモジュールから構成される。
論文 参考訳(メタデータ) (2022-09-14T03:25:04Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Point Transformer [122.2917213154675]
セルフアテンションネットワークを3Dポイントクラウド処理に適用することを検討する。
ポイントクラウドのセルフアテンションレイヤを設計し、セマンティックシーンセグメンテーションなどのタスクのためのセルフアテンションネットワークの構築に使用します。
ポイントトランスフォーマーの設計は、ドメインやタスク間の事前作業を改善する。
論文 参考訳(メタデータ) (2020-12-16T18:58:56Z) - Graph Attention Tracking [76.19829750144564]
汎用オブジェクト追跡のための簡易な目標認識型シームズグラフアテンションネットワークを提案する。
GOT-10k、UAV123、TB-100、LaSOTといった挑戦的なベンチマークの実験は、提案されたSiamGATが最先端のトラッカーよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-23T04:26:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。