論文の概要: S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2406.02147v2
- Date: Thu, 15 May 2025 16:26:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:05.982222
- Title: S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking
- Title(参考訳): S2-Track: エンド・ツー・エンドのマルチオブジェクト追跡のためのシンプルかつ強力なアプローチ
- Authors: Tao Tang, Lijun Zhou, Pengkun Hao, Zihang He, Kalok Ho, Shuo Gu, Zhihui Hao, Haiyang Sun, Kun Zhan, Peng Jia, XianPeng Lang, Xiaodan Liang,
- Abstract要約: 3D多重物体追跡(MOT)は自律運転知覚において重要な役割を担っている。
最近のエンドツーエンドのクエリベースのトラッカーは、オブジェクトを同時に検出および追跡し、3D MOTタスクの有望な可能性を示している。
既存の手法はまだ開発の初期段階にあり、体系的な改善が欠けている。
- 参考スコア(独自算出の注目度): 38.63155724204429
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: 3D multiple object tracking (MOT) plays a crucial role in autonomous driving perception. Recent end-to-end query-based trackers simultaneously detect and track objects, which have shown promising potential for the 3D MOT task. However, existing methods are still in the early stages of development and lack systematic improvements, failing to track objects in certain complex scenarios, like occlusions and the small size of target object's situations. In this paper, we first summarize the current end-to-end 3D MOT framework by decomposing it into three constituent parts: query initialization, query propagation, and query matching. Then we propose corresponding improvements, which lead to a strong yet simple tracker: S2-Track. Specifically, for query initialization, we present 2D-Prompted Query Initialization, which leverages predicted 2D object and depth information to prompt an initial estimate of the object's 3D location. For query propagation, we introduce an Uncertainty-aware Probabilistic Decoder to capture the uncertainty of complex environment in object prediction with probabilistic attention. For query matching, we propose a Hierarchical Query Denoising strategy to enhance training robustness and convergence. As a result, our S2-Track achieves state-of-the-art performance on nuScenes benchmark, i.e., 66.3% AMOTA on test split, surpassing the previous best end-to-end solution by a significant margin of 8.9% AMOTA. We achieve 1st place on the nuScenes tracking task leaderboard.
- Abstract(参考訳): 3D多重物体追跡(MOT)は自律運転知覚において重要な役割を担っている。
最近のエンドツーエンドのクエリベースのトラッカーは、オブジェクトを同時に検出および追跡し、3D MOTタスクの有望な可能性を示している。
しかし、既存のメソッドはまだ開発の初期段階にあり、体系的な改善が欠けており、オクルージョンやターゲットオブジェクトの状況の小さなサイズなど、特定の複雑なシナリオにおけるオブジェクトの追跡に失敗している。
本稿では、まず、クエリ初期化、クエリの伝搬、クエリマッチングの3つの構成要素に分解することで、現在のエンドツーエンドの3D MOTフレームワークを要約する。
そこで我々は,S2-Trackという強力なトラッカーに繋がる改良点を提案する。
具体的には、クエリ初期化のために、予測された2Dオブジェクトと深さ情報を利用してオブジェクトの3D位置を推定する2Dプロンプトクエリ初期化を提案する。
本稿では,不確かさを意識した確率デコーダを導入し,確率的注意を伴うオブジェクト予測における複雑な環境の不確かさを捉える。
クエリマッチングのために,トレーニングの堅牢性と収束性を高める階層型クエリデノゲーション戦略を提案する。
その結果、我々のS2-Track は nuScenes ベンチマークの最先端性能、すなわち 66.3% AMOTA をテスト分割で達成し、以前の最高のエンドツーエンドソリューションを8.9% AMOTA で上回った。
我々はnuScenes Track Task Leaderboardで1位を獲得しました。
関連論文リスト
- UncTrack: Reliable Visual Object Tracking with Uncertainty-Aware Prototype Memory Network [75.9933952886197]
UncTrackは、標的位置の不確実性を予測する新しい不確実性対応トランスフォーマーである。
本手法は実験における他の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2025-03-17T07:33:16Z) - Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - UTrack: Multi-Object Tracking with Uncertain Detections [37.826006378381955]
我々は,物体検出中に経験的予測分布を得るための高速な手法を初めて紹介する。
我々の機構は最先端のトラッカーに容易に統合でき、検出の不確実性を完全に活用できる。
我々は,MOT17,MOT20,DanceTrack,KITTIなど,さまざまなベンチマークに対するコントリビューションの有効性を実証する。
論文 参考訳(メタデータ) (2024-08-30T08:34:51Z) - UncertaintyTrack: Exploiting Detection and Localization Uncertainty in Multi-Object Tracking [8.645078288584305]
マルチオブジェクトトラッキング(MOT)手法は近年,性能が大幅に向上している。
複数のTBDトラッカーに適用可能なエクステンションのコレクションであるUncertaintyTrackを紹介します。
バークレーディープドライブMOTデータセットの実験では、我々の手法と情報的不確実性推定の組み合わせにより、IDスイッチの数を約19%削減している。
論文 参考訳(メタデータ) (2024-02-19T17:27:04Z) - Uncertainty-Aware AB3DMOT by Variational 3D Object Detection [74.8441634948334]
不確実性推定は統計的に正確な予測を提供する効果的なツールである。
本稿では,変分ニューラルネットワークを用いたTANet 3Dオブジェクト検出器を提案し,不確実性のある3Dオブジェクト検出を行う。
論文 参考訳(メタデータ) (2023-02-12T14:30:03Z) - 3D Object Detection for Autonomous Driving: A Comprehensive Survey [48.30753402458884]
自動運転車の近くで重要な3Dオブジェクトの位置、サイズ、カテゴリをインテリジェントに予測する3Dオブジェクト検出は、認識システムの重要な部分である。
本稿では,自律運転における3次元物体検出技術の進歩を概観する。
論文 参考訳(メタデータ) (2022-06-19T19:43:11Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Detecting Invisible People [58.49425715635312]
我々は,追跡ベンチマークを再利用し,目立たない物体を検出するための新しい指標を提案する。
私たちは、現在の検出および追跡システムがこのタスクで劇的に悪化することを実証します。
第2に,最先端の単眼深度推定ネットワークによる観測結果を用いて,3次元で明示的に推論する動的モデルを構築した。
論文 参考訳(メタデータ) (2020-12-15T16:54:45Z) - Uncertainty-Aware Voxel based 3D Object Detection and Tracking with
von-Mises Loss [13.346392746224117]
不確実性は、認識システムのエラーに対処し、堅牢性を改善するのに役立ちます。
本稿では,SECOND検出器に不確実性レグレッションを追加することにより,目標追尾性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2020-11-04T21:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。