論文の概要: PD-SORT: Occlusion-Robust Multi-Object Tracking Using Pseudo-Depth Cues
- arxiv url: http://arxiv.org/abs/2501.11288v1
- Date: Mon, 20 Jan 2025 05:50:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:22:36.466086
- Title: PD-SORT: Occlusion-Robust Multi-Object Tracking Using Pseudo-Depth Cues
- Title(参考訳): Pseudo-Depth Cuesを用いたPD-SORT-Occlusion-Robust Multi-Object Tracking
- Authors: Yanchao Wang, Dawei Zhang, Run Li, Zhonglong Zheng, Minglu Li,
- Abstract要約: マルチオブジェクトトラッキング (MOT) は、ビデオ処理技術において注目される話題であり、消費者電子製品において重要な応用価値を持つ。
現在、トラッキング・バイ・ディテクト(TBD)がMOTの主要なパラダイムであり、フレーム単位でターゲット検出とアソシエーション・フレームを実行する。
本研究では,Pseudo-Depth SORT (PD-SORT) を提案する。
- 参考スコア(独自算出の注目度): 8.642829333393442
- License:
- Abstract: Multi-object tracking (MOT) is a rising topic in video processing technologies and has important application value in consumer electronics. Currently, tracking-by-detection (TBD) is the dominant paradigm for MOT, which performs target detection and association frame by frame. However, the association performance of TBD methods degrades in complex scenes with heavy occlusions, which hinders the application of such methods in real-world scenarios.To this end, we incorporate pseudo-depth cues to enhance the association performance and propose Pseudo-Depth SORT (PD-SORT). First, we extend the Kalman filter state vector with pseudo-depth states. Second, we introduce a novel depth volume IoU (DVIoU) by combining the conventional 2D IoU with pseudo-depth. Furthermore, we develop a quantized pseudo-depth measurement (QPDM) strategy for more robust data association. Besides, we also integrate camera motion compensation (CMC) to handle dynamic camera situations. With the above designs, PD-SORT significantly alleviates the occlusion-induced ambiguous associations and achieves leading performances on DanceTrack, MOT17, and MOT20. Note that the improvement is especially obvious on DanceTrack, where objects show complex motions, similar appearances, and frequent occlusions. The code is available at https://github.com/Wangyc2000/PD_SORT.
- Abstract(参考訳): マルチオブジェクトトラッキング (MOT) は、ビデオ処理技術において注目される話題であり、消費者電子製品において重要な応用価値を持つ。
現在、トラッキング・バイ・ディテクト(TBD)がMOTの主要なパラダイムであり、フレーム単位でターゲット検出とアソシエーション・フレームを実行する。
しかし,TBD手法の関連性能は複雑なシーンで劣化し,現実のシナリオではそのような手法の適用が妨げられるため,擬似深度キューを組み込んで関連性能を高め,擬似深度SORT(PD-SORT)を提案する。
まず、カルマンフィルタ状態ベクトルを擬似深さ状態で拡張する。
次に,従来の2次元IoUと擬似深度を組み合わせた新しい深度体積IoU(DVIoU)を提案する。
さらに、より堅牢なデータアソシエーションのための量子擬似深度測定(QPDM)戦略を開発する。
また、動的なカメラ状況に対応するために、カメラモーション補償(CMC)も統合する。
以上の設計により、PD-SORTはオクルージョンによって引き起こされる曖昧な関連を著しく緩和し、DanceTrack、MOT17、MOT20で主要なパフォーマンスを達成する。
DanceTrackでは、オブジェクトが複雑な動き、類似した外観、頻繁な閉塞を示す。
コードはhttps://github.com/Wangyc2000/PD_SORTで公開されている。
関連論文リスト
- DATAP-SfM: Dynamic-Aware Tracking Any Point for Robust Structure from Motion in the Wild [85.03973683867797]
本稿では,スムーズなカメラ軌跡を推定し,野生のカジュアルビデオのための高密度点雲を得るための,簡潔でエレガントでロバストなパイプラインを提案する。
提案手法は,複雑な動的課題シーンにおいても,カメラポーズ推定による最先端性能を実現する。
論文 参考訳(メタデータ) (2024-11-20T13:01:16Z) - Ego-Motion Aware Target Prediction Module for Robust Multi-Object Tracking [2.7898966850590625]
我々は、Ego-motion Aware Target Prediction (EMAP)と呼ばれる新しいKFベースの予測モジュールを導入する。
提案手法は、カルマンフィルタを再構成することにより、物体軌道からのカメラ回転速度と翻訳速度の影響を分離する。
EMAPはOC-SORTとDeep OC-SORTのIDSWをそれぞれ73%と21%減少させる。
論文 参考訳(メタデータ) (2024-04-03T23:24:25Z) - SpikeMOT: Event-based Multi-Object Tracking with Sparse Motion Features [52.213656737672935]
SpikeMOTはイベントベースのマルチオブジェクトトラッカーである。
SpikeMOTはスパイクニューラルネットワークを使用して、オブジェクトに関連するイベントストリームからスパーステンポラルな特徴を抽出する。
論文 参考訳(メタデータ) (2023-09-29T05:13:43Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - SparseTrack: Multi-Object Tracking by Performing Scene Decomposition
based on Pseudo-Depth [84.64121608109087]
2次元画像から目標の相対的な深さを求めるための擬似深度推定法を提案する。
次に,得られた深度情報を用いて,高密度なターゲットセットを複数のスパースなターゲットサブセットに変換するディープカスケードマッチング(DCM)アルゴリズムを設計する。
擬似深度法とDCM戦略をデータアソシエーションプロセスに統合することにより、SparseTrackと呼ばれる新しいトラッカーを提案する。
論文 参考訳(メタデータ) (2023-06-08T14:36:10Z) - Depth Perspective-aware Multiple Object Tracking [24.06104433665443]
DP-MOTは、リアルタイムの深度パースペクティブを意識したマルチオブジェクト追跡手法である。
提案手法は最近のMOT法と比較して常に最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-07-10T22:12:00Z) - Implicit Motion Handling for Video Camouflaged Object Detection [60.98467179649398]
本稿では,新しいビデオカモフラージュオブジェクト検出(VCOD)フレームワークを提案する。
短期的および長期的整合性を利用して、ビデオフレームからカモフラージュされたオブジェクトを検出する。
論文 参考訳(メタデータ) (2022-03-14T17:55:41Z) - Relation3DMOT: Exploiting Deep Affinity for 3D Multi-Object Tracking
from View Aggregation [8.854112907350624]
3Dマルチオブジェクトトラッキングは、自律ナビゲーションにおいて重要な役割を果たす。
多くのアプローチでは、トラッキングのための2次元RGBシーケンス内のオブジェクトを検出するが、これは3次元空間内のオブジェクトをローカライズする際の信頼性の欠如である。
本稿では,隣接フレーム内の各オブジェクト間の相関をよりよく活用するために,RelationConvという新しい畳み込み演算を提案する。
論文 参考訳(メタデータ) (2020-11-25T16:14:40Z) - MAT: Motion-Aware Multi-Object Tracking [9.098793914779161]
本稿では,様々な物体の動作パターンに着目した動き認識トラッキング(MAT)を提案する。
MOT16とMOT17の挑戦的なベンチマークの実験は、我々のMATアプローチが大きなマージンで優れたパフォーマンスを達成することを実証している。
論文 参考訳(メタデータ) (2020-09-10T11:51:33Z) - Dense Scene Multiple Object Tracking with Box-Plane Matching [73.54369833671772]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要なタスクである。
密集したシーンにおけるMOT性能を改善するために,Box-Plane Matching (BPM)法を提案する。
3つのモジュールの有効性により、ACM MM Grand Challenge HiEve 2020において、私たちのチームはトラック1のリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-30T16:39:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。