論文の概要: OST: Efficient One-stream Network for 3D Single Object Tracking in Point
Clouds
- arxiv url: http://arxiv.org/abs/2210.08518v1
- Date: Sun, 16 Oct 2022 12:31:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 19:19:14.938216
- Title: OST: Efficient One-stream Network for 3D Single Object Tracking in Point
Clouds
- Title(参考訳): OST:ポイントクラウドにおける3次元単一物体追跡のための効率的なワンストリームネットワーク
- Authors: Xiantong Zhao, Yinan Han, Shengjing Tian, Jian Liu, Xiuping Liu
- Abstract要約: 本稿では,前回のシームズネットワークで発生する相関操作を回避するため,トランスフォーマーエンコーディングの強みを生かした新しい一ストリームネットワークを提案する。
提案手法は,クラス固有のトラッキングだけでなく,より少ない計算と高い効率でクラスに依存しないトラッキングを実現する。
- 参考スコア(独自算出の注目度): 7.669030912326021
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although recent Siamese network-based trackers have achieved impressive
perceptual accuracy for single object tracking in LiDAR point clouds, they
advance with some heavy correlation operations on relation modeling and
overlook the inherent merit of arbitrariness compared to multiple object
tracking. In this work, we propose a radically novel one-stream network with
the strength of the Transformer encoding, which avoids the correlation
operations occurring in previous Siamese network, thus considerably reducing
the computational effort. In particular, the proposed method mainly consists of
a Template-aware Transformer Module (TTM) and a Multi-scale Feature Aggregation
(MFA) module capable of fusing spatial and semantic information. The TTM
stitches the specified template and the search region together and leverages an
attention mechanism to establish the information flow, breaking the previous
pattern of independent \textit{extraction-and-correlation}. As a result, this
module makes it possible to directly generate template-aware features that are
suitable for the arbitrary and continuously changing nature of the target,
enabling the model to deal with unseen categories. In addition, the MFA is
proposed to make spatial and semantic information complementary to each other,
which is characterized by reverse directional feature propagation that
aggregates information from shallow to deep layers. Extensive experiments on
KITTI and nuScenes demonstrate that our method has achieved considerable
performance not only for class-specific tracking but also for class-agnostic
tracking with less computation and higher efficiency.
- Abstract(参考訳): 近年のシームズネットワークベースのトラッカーは、LiDAR点群における単一物体追跡の知覚的精度を著しく向上しているが、関係モデリングにおける重相関操作を推進し、複数の物体追跡と比較して、任意性の本質的な利点を見落としている。
本研究では,従来のシャムネットワークで発生した相関処理を回避し,計算量を大幅に削減するトランスフォーマエンコーディングの強みを持つ,急進的な1ストリームネットワークを提案する。
特に,提案手法は主にテンプレート対応トランスフォーマーモジュール (TTM) と,空間情報と意味情報を融合可能なマルチスケール特徴集約モジュール (MFA) から構成される。
TTMは、指定されたテンプレートと検索領域を縫合し、アテンション機構を利用して情報フローを確立し、独立な \textit{extraction-and-correlation} の以前のパターンを破る。
結果として、このモジュールは、ターゲットの任意かつ連続的に変化する性質に適したテンプレートアウェア機能を直接生成することができ、モデルが見えないカテゴリを扱うことができる。
さらに,MFAは,浅層から深層までの情報を集約する逆方向の特徴伝搬を特徴とする空間的・意味的情報を相互に補完する手法を提案する。
kittiとnusceneに関する広範囲な実験により,本手法はクラス特異的なトラッキングだけでなく,計算量が少なく,効率も向上した。
関連論文リスト
- Multi-Correlation Siamese Transformer Network with Dense Connection for
3D Single Object Tracking [14.47355191520578]
ポイントクラウドベースの3Dオブジェクトトラッキングは、自動運転において重要なタスクである。
スパースLIDARポイントクラウドデータでテンプレートと検索ブランチの相関を効果的に学習することは依然として困難である。
本稿では,複数のステージを持つマルチ相関シームス変圧器ネットワークを提案し,各ステージの最後に特徴相関を行う。
論文 参考訳(メタデータ) (2023-12-18T09:33:49Z) - Staged Depthwise Correlation and Feature Fusion for Siamese Object
Tracking [0.6827423171182154]
視覚的トラッキングのための特徴抽出をさらに最適化するために,DCFFNet という新たな段階的深度相関と特徴融合ネットワークを提案する。
シアムネットワークアーキテクチャに基づいてディープトラッカーを構築しており、複数の大規模データセットでゼロからトレーニングされたオフラインです。
OTB100,VOT2018,LaSOTなど,一般的なベンチマークにトラッカーを実装した。
論文 参考訳(メタデータ) (2023-10-15T06:04:42Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in
Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。
Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。
無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-18T03:48:58Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - High-Performance Transformer Tracking [74.07751002861802]
本稿では,シームズ様特徴抽出バックボーンをベースとしたTransformer Tracking(TransT)手法,設計した注意に基づく融合機構,分類と回帰ヘッドを提案する。
実験の結果,TransT法とTransT-M法は7つの一般的なデータセットに対して有望な結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-03-25T09:33:29Z) - TrTr: Visual Tracking with Transformer [29.415900191169587]
トランスフォーマーエンコーダデコーダアーキテクチャと呼ばれる強力な注意メカニズムに基づく新しいトラッカーネットワークを提案する。
形状非依存アンカーに基づくターゲットのローカライズを行うトランスの出力を用いて,分類と回帰ヘッドを設計する。
本手法は最先端のアルゴリズムに好適に作用する。
論文 参考訳(メタデータ) (2021-05-09T02:32:28Z) - Learning data association without data association: An EM approach to
neural assignment prediction [12.970250708769708]
本稿では,データアソシエーションのためのニューラルモデルをトレーニングするための予測最大化手法を提案する。
オブジェクト認識のモデルをトレーニングするためにラベル情報を必要としない。
重要なことに、提案手法を用いてトレーニングされたネットワークは、下流追跡アプリケーションで再利用することができる。
論文 参考訳(メタデータ) (2021-05-02T01:11:09Z) - Transformer Tracking [76.96796612225295]
相関は追跡分野において、特に人気のあるシャム系トラッカーにおいて重要な役割を果たす。
本研究は,注意のみを用いてテンプレートと検索領域を効果的に結合した,新しい注意型特徴融合ネットワークを提案する。
実験により、TransTは6つの挑戦的なデータセットで非常に有望な結果が得られます。
論文 参考訳(メタデータ) (2021-03-29T09:06:55Z) - A Unified Object Motion and Affinity Model for Online Multi-Object
Tracking [127.5229859255719]
オブジェクトの動きと親和性モデルを単一のネットワークに統一する新しいMOTフレームワークUMAを提案する。
UMAは、単一物体追跡とメートル法学習をマルチタスク学習により統合された三重項ネットワークに統合する。
我々は,タスク認識機能学習を促進するために,タスク固有のアテンションモジュールを装備する。
論文 参考訳(メタデータ) (2020-03-25T09:36:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。