論文の概要: CAMO-MOT: Combined Appearance-Motion Optimization for 3D Multi-Object
Tracking with Camera-LiDAR Fusion
- arxiv url: http://arxiv.org/abs/2209.02540v2
- Date: Wed, 7 Sep 2022 02:43:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-08 11:49:19.722512
- Title: CAMO-MOT: Combined Appearance-Motion Optimization for 3D Multi-Object
Tracking with Camera-LiDAR Fusion
- Title(参考訳): CAMO-MOT:カメラ-LiDAR融合による3次元多物体追跡のための外観運動最適化
- Authors: Li Wang, Xinyu Zhang, Wenyuan Qin, Xiaoyu Li, Lei Yang, Zhiwei Li, Lei
Zhu, Hong Wang, Jun Li, and Huaping Liu
- Abstract要約: 3D Multi-object Track (MOT) は、連続的な動的検出時の一貫性を保証する。
LiDAR法で物体の不規則な動きを正確に追跡することは困難である。
複合外観運動最適化(CAMO-MOT)に基づく新しいカメラ-LiDAR融合3DMOTフレームワークを提案する。
- 参考スコア(独自算出の注目度): 34.42289908350286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Multi-object tracking (MOT) ensures consistency during continuous dynamic
detection, conducive to subsequent motion planning and navigation tasks in
autonomous driving. However, camera-based methods suffer in the case of
occlusions and it can be challenging to accurately track the irregular motion
of objects for LiDAR-based methods. Some fusion methods work well but do not
consider the untrustworthy issue of appearance features under occlusion. At the
same time, the false detection problem also significantly affects tracking. As
such, we propose a novel camera-LiDAR fusion 3D MOT framework based on the
Combined Appearance-Motion Optimization (CAMO-MOT), which uses both camera and
LiDAR data and significantly reduces tracking failures caused by occlusion and
false detection. For occlusion problems, we are the first to propose an
occlusion head to select the best object appearance features multiple times
effectively, reducing the influence of occlusions. To decrease the impact of
false detection in tracking, we design a motion cost matrix based on confidence
scores which improve the positioning and object prediction accuracy in 3D
space. As existing multi-object tracking methods only consider a single
category, we also propose to build a multi-category loss to implement
multi-object tracking in multi-category scenes. A series of validation
experiments are conducted on the KITTI and nuScenes tracking benchmarks. Our
proposed method achieves state-of-the-art performance and the lowest identity
switches (IDS) value (23 for Car and 137 for Pedestrian) among all multi-modal
MOT methods on the KITTI test dataset. And our proposed method achieves
state-of-the-art performance among all algorithms on the nuScenes test dataset
with 75.3% AMOTA.
- Abstract(参考訳): 3d multi-object tracking (mot) は、連続的な動的検出における一貫性を保証する。
しかし、カメラベースの手法は閉塞性に悩まされており、LiDAR方式では物体の不規則な動きを正確に追跡することは困難である。
いくつかの融合法はうまく機能するが、排他的外見上の不確実な問題を考慮していない。
同時に、誤検出問題は追跡にも大きな影響を与えている。
そこで本稿では,カメラとライダーのデータを併用し,オクルージョンや誤検出によるトラッキング障害を著しく軽減する,外観・モーション最適化(camo-mot)を組み合わせた新しいカメラ・ライダー融合3d motフレームワークを提案する。
本報告では, 閉塞問題に対して, 最適物体の外観特徴を複数回効果的に選択するオクルージョンヘッドを初めて提案し, 閉塞の影響を低減した。
トラッキングにおける偽検出の影響を低減するため,3次元空間における位置推定と物体予測精度を向上させる信頼度スコアに基づく移動コスト行列を設計する。
既存のマルチオブジェクト追跡手法は単一のカテゴリのみを考慮しているため、マルチカテゴリのシーンでマルチオブジェクト追跡を実装するために、マルチカテゴリの損失を構築することも提案する。
KITTIとnuScenesの追跡ベンチマークで一連の検証実験が行われた。
提案手法は,KITTIテストデータセット上のすべてのマルチモーダルMOT手法の中で,最先端性能と最小IDS値(自動車では23,歩行者では137)を実現する。
提案手法は,75.3%のAMOTAを持つnuScenesテストデータセット上の全アルゴリズムの最先端性能を実現する。
関連論文リスト
- ConsistencyTrack: A Robust Multi-Object Tracker with a Generation Strategy of Consistency Model [20.259334882471574]
マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおいて重要な技術であり、ビデオシーケンス内の複数のターゲットを検出し、各ターゲットにフレーム毎にユニークなIDを割り当てるように設計されている。
既存のMOTメソッドは、様々なシナリオでリアルタイムで複数のオブジェクトを正確に追跡する。
本稿では,境界ボックス上の拡散過程として検出と関連を定式化するための新しいConsistencyTrack, Joint Detection and Tracking (JDT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-28T05:53:30Z) - You Only Need Two Detectors to Achieve Multi-Modal 3D Multi-Object Tracking [9.20064374262956]
提案手法は,2次元検出器と3次元検出器のみを用いて,ロバストなトラッキングを実現する。
多くの最先端のTBDベースのマルチモーダルトラッキング手法よりも正確であることが証明されている。
論文 参考訳(メタデータ) (2023-04-18T02:45:18Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - An Effective Motion-Centric Paradigm for 3D Single Object Tracking in
Point Clouds [50.19288542498838]
LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。
現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
論文 参考訳(メタデータ) (2023-03-21T17:28:44Z) - DetFlowTrack: 3D Multi-object Tracking based on Simultaneous
Optimization of Object Detection and Scene Flow Estimation [23.305159598648924]
オブジェクト検出とシーンフロー推定の同時最適化に基づく3次元MOTフレームワークを提案する。
特に回転を伴う動きの場合のより正確なシーンフローラベルについて,ボックス変換に基づくシーンフローグラウンド真理計算法を提案する。
KITTI MOTデータセットの実験結果は、回転を伴う極運動下での最先端とロバスト性に対して競合する結果を示した。
論文 参考訳(メタデータ) (2022-03-04T07:06:47Z) - DeepFusionMOT: A 3D Multi-Object Tracking Framework Based on
Camera-LiDAR Fusion with Deep Association [8.34219107351442]
本稿では,精度と速度の良好なトレードオフを実現するために,カメラ-LiDAR融合型MOT法を提案する。
提案手法は、追跡精度と処理速度の両方の観点から、最先端MOT法に対して明らかな利点を示す。
論文 参考訳(メタデータ) (2022-02-24T13:36:29Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Relation3DMOT: Exploiting Deep Affinity for 3D Multi-Object Tracking
from View Aggregation [8.854112907350624]
3Dマルチオブジェクトトラッキングは、自律ナビゲーションにおいて重要な役割を果たす。
多くのアプローチでは、トラッキングのための2次元RGBシーケンス内のオブジェクトを検出するが、これは3次元空間内のオブジェクトをローカライズする際の信頼性の欠如である。
本稿では,隣接フレーム内の各オブジェクト間の相関をよりよく活用するために,RelationConvという新しい畳み込み演算を提案する。
論文 参考訳(メタデータ) (2020-11-25T16:14:40Z) - Tracking Road Users using Constraint Programming [79.32806233778511]
本稿では,マルチオブジェクトトラッキング(MOT)問題のトラッキング・バイ・検出パラダイムに見られるデータアソシエーションフェーズに対する制約プログラミング(CP)アプローチを提案する。
提案手法は車両追跡データを用いてテストし,UA-DETRACベンチマークの上位手法よりも優れた結果を得た。
論文 参考訳(メタデータ) (2020-03-10T00:04:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。