論文の概要: UA-Track: Uncertainty-Aware End-to-End 3D Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2406.02147v1
- Date: Tue, 4 Jun 2024 09:34:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-05 17:01:41.466109
- Title: UA-Track: Uncertainty-Aware End-to-End 3D Multi-Object Tracking
- Title(参考訳): UAトラック:不確実なエンド・ツー・エンドの3Dマルチオブジェクト追跡
- Authors: Lijun Zhou, Tao Tang, Pengkun Hao, Zihang He, Kalok Ho, Shuo Gu, Wenbo Hou, Zhihui Hao, Haiyang Sun, Kun Zhan, Peng Jia, Xianpeng Lang, Xiaodan Liang,
- Abstract要約: 3D多重物体追跡(MOT)は自律運転知覚において重要な役割を担っている。
最近のエンドツーエンドのクエリベースのトラッカーは、オブジェクトを同時に検出および追跡し、3D MOTタスクの有望な可能性を示している。
既存の方法では、追跡対象の状態や位置に関する正確な信頼が欠如しているため、不確実性の問題を見落としている。
本稿では,不確実性を考慮した3D MOTフレームワークUA-Trackを提案する。
- 参考スコア(独自算出の注目度): 37.857915442467316
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: 3D multiple object tracking (MOT) plays a crucial role in autonomous driving perception. Recent end-to-end query-based trackers simultaneously detect and track objects, which have shown promising potential for the 3D MOT task. However, existing methods overlook the uncertainty issue, which refers to the lack of precise confidence about the state and location of tracked objects. Uncertainty arises owing to various factors during motion observation by cameras, especially occlusions and the small size of target objects, resulting in an inaccurate estimation of the object's position, label, and identity. To this end, we propose an Uncertainty-Aware 3D MOT framework, UA-Track, which tackles the uncertainty problem from multiple aspects. Specifically, we first introduce an Uncertainty-aware Probabilistic Decoder to capture the uncertainty in object prediction with probabilistic attention. Secondly, we propose an Uncertainty-guided Query Denoising strategy to further enhance the training process. We also utilize Uncertainty-reduced Query Initialization, which leverages predicted 2D object location and depth information to reduce query uncertainty. As a result, our UA-Track achieves state-of-the-art performance on the nuScenes benchmark, i.e., 66.3% AMOTA on the test split, surpassing the previous best end-to-end solution by a significant margin of 8.9% AMOTA.
- Abstract(参考訳): 3D多重物体追跡(MOT)は自律運転知覚において重要な役割を担っている。
最近のエンドツーエンドのクエリベースのトラッカーは、オブジェクトを同時に検出および追跡し、3D MOTタスクの有望な可能性を示している。
しかし、既存の手法では、追跡対象の状態や位置に関する正確な信頼が欠如しているため、不確実性の問題を見落としている。
不確実性は、カメラによる動作観察中の様々な要因、特にオクルージョンとターゲットオブジェクトの小さなサイズによって生じ、オブジェクトの位置、ラベル、アイデンティティを不正確な推定に繋がる。
そこで本研究では,不確実性を考慮した3D MOTフレームワークであるUA-Trackを提案する。
具体的には、まず不確かさを意識した確率デコーダを導入し、確率的注意を伴う物体予測の不確かさを捉える。
次に、トレーニングプロセスをさらに強化するために、不確実性誘導型クエリデノゲーション戦略を提案する。
また、予測された2次元オブジェクトの位置と深度情報を利用してクエリの不確実性を低減する不確実性推論初期化を利用する。
その結果,UA-Track は nuScenes ベンチマークの最先端性能,すなわち 66.3% AMOTA をテストスプリットで達成し,従来の最高のエンドツーエンドソリューションを8.9% AMOTA で上回った。
関連論文リスト
- UncertaintyTrack: Exploiting Detection and Localization Uncertainty in Multi-Object Tracking [8.645078288584305]
マルチオブジェクトトラッキング(MOT)手法は近年,性能が大幅に向上している。
複数のTBDトラッカーに適用可能なエクステンションのコレクションであるUncertaintyTrackを紹介します。
バークレーディープドライブMOTデータセットの実験では、我々の手法と情報的不確実性推定の組み合わせにより、IDスイッチの数を約19%削減している。
論文 参考訳(メタデータ) (2024-02-19T17:27:04Z) - Collaborative Multi-Object Tracking with Conformal Uncertainty
Propagation [30.47064353266713]
コラボレーティブオブジェクト検出(COD)は,検出精度の向上と不確かさの低減を目的として提案されている。
我々はMOT性能を向上させるためにMOT-CUPと呼ばれる不確実性伝播フレームワークを設計する。
本フレームワークは, 直接モデリングと共形予測によりCODの不確かさを定量化し, この不確かさを運動予測および関連ステップに伝達する。
論文 参考訳(メタデータ) (2023-03-25T03:32:01Z) - Uncertainty-Aware AB3DMOT by Variational 3D Object Detection [74.8441634948334]
不確実性推定は統計的に正確な予測を提供する効果的なツールである。
本稿では,変分ニューラルネットワークを用いたTANet 3Dオブジェクト検出器を提案し,不確実性のある3Dオブジェクト検出を行う。
論文 参考訳(メタデータ) (2023-02-12T14:30:03Z) - 3D Object Detection for Autonomous Driving: A Comprehensive Survey [48.30753402458884]
自動運転車の近くで重要な3Dオブジェクトの位置、サイズ、カテゴリをインテリジェントに予測する3Dオブジェクト検出は、認識システムの重要な部分である。
本稿では,自律運転における3次元物体検出技術の進歩を概観する。
論文 参考訳(メタデータ) (2022-06-19T19:43:11Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - Detecting Invisible People [58.49425715635312]
我々は,追跡ベンチマークを再利用し,目立たない物体を検出するための新しい指標を提案する。
私たちは、現在の検出および追跡システムがこのタスクで劇的に悪化することを実証します。
第2に,最先端の単眼深度推定ネットワークによる観測結果を用いて,3次元で明示的に推論する動的モデルを構築した。
論文 参考訳(メタデータ) (2020-12-15T16:54:45Z) - Uncertainty-Aware Voxel based 3D Object Detection and Tracking with
von-Mises Loss [13.346392746224117]
不確実性は、認識システムのエラーに対処し、堅牢性を改善するのに役立ちます。
本稿では,SECOND検出器に不確実性レグレッションを追加することにより,目標追尾性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2020-11-04T21:53:31Z) - A Real-Time Predictive Pedestrian Collision Warning Service for
Cooperative Intelligent Transportation Systems Using 3D Pose Estimation [10.652350454373531]
歩行者方向認識(100.53 FPS)と意図予測(35.76 FPS)の2つのタスクに対して,リアルタイムな歩行者衝突警報サービス(P2CWS)を提案する。
提案手法は,提案したサイトに依存しない特徴により,複数のサイトに対する一般化を満足する。
提案したビジョンフレームワークは、トレーニングプロセスなしでTUDデータセットの行動認識タスクの89.3%の精度を実現する。
論文 参考訳(メタデータ) (2020-09-23T00:55:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。