論文の概要: Rethinking the competition between detection and ReID in Multi-Object
Tracking
- arxiv url: http://arxiv.org/abs/2010.12138v3
- Date: Tue, 24 May 2022 11:48:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 23:00:09.028687
- Title: Rethinking the competition between detection and ReID in Multi-Object
Tracking
- Title(参考訳): 複数物体追跡における検出とReIDの競合再考
- Authors: Chao Liang, Zhipeng Zhang, Xue Zhou, Bing Li, Shuyuan Zhu, Weiming Hu
- Abstract要約: 検出と識別の埋め込みを共同で学習するワンショットモデルは、マルチオブジェクトトラッキング(MOT)において大きな注目を集めている。
本稿では,タスク依存表現をよりよく学習するために,自己関係と相互関係を持つ新しい相互ネットワーク(REN)を提案する。
また,ID埋め込みの関連性を改善するために,意味レベルのミスアライメントを防止するスケールアウェア・アテンション・ネットワーク(SAAN)を導入する。
- 参考スコア(独自算出の注目度): 44.59367033562385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to balanced accuracy and speed, one-shot models which jointly learn
detection and identification embeddings, have drawn great attention in
multi-object tracking (MOT). However, the inherent differences and relations
between detection and re-identification (ReID) are unconsciously overlooked
because of treating them as two isolated tasks in the one-shot tracking
paradigm. This leads to inferior performance compared with existing two-stage
methods. In this paper, we first dissect the reasoning process for these two
tasks, which reveals that the competition between them inevitably would destroy
task-dependent representations learning. To tackle this problem, we propose a
novel reciprocal network (REN) with a self-relation and cross-relation design
so that to impel each branch to better learn task-dependent representations.
The proposed model aims to alleviate the deleterious tasks competition,
meanwhile improve the cooperation between detection and ReID. Furthermore, we
introduce a scale-aware attention network (SAAN) that prevents semantic level
misalignment to improve the association capability of ID embeddings. By
integrating the two delicately designed networks into a one-shot online MOT
system, we construct a strong MOT tracker, namely CSTrack. Our tracker achieves
the state-of-the-art performance on MOT16, MOT17 and MOT20 datasets, without
other bells and whistles. Moreover, CSTrack is efficient and runs at 16.4 FPS
on a single modern GPU, and its lightweight version even runs at 34.6 FPS. The
complete code has been released at https://github.com/JudasDie/SOTS.
- Abstract(参考訳): 精度と速度のバランスがとれたため、検出と識別の埋め込みを共同で学習するワンショットモデルは、マルチオブジェクトトラッキング(MOT)において大きな注目を集めている。
しかし、検出と再識別(ReID)の固有の違いと関係性は、一発追跡パラダイムにおいて2つの独立したタスクとして扱われるため、意識的に見過ごされる。
これは既存の2段階の手法に比べて性能が劣る。
本稿では,これらの2つのタスクの推論過程をまず解明し,それらの競合が必然的にタスク依存表現学習を破壊することを示した。
そこで本研究では, タスク依存表現の学習を各分岐に促すために, 自己相関と相互相関設計を備えた新しい相互ネットワーク (ren) を提案する。
提案手法は, 有害なタスク競合を軽減し, 検出とReIDの協調性を向上することを目的としている。
さらに,ID埋め込みの関連性を改善するために,意味レベルのミスアライメントを防止するスケールアウェア・アテンション・ネットワーク(SAAN)を導入する。
2つの繊細に設計されたネットワークをワンショットオンラインMOTシステムに統合することにより、強力なMOTトラッカー、すなわちCSTrackを構築する。
トラッカーは,MOT16,MOT17,MOT20データセット上で,他のベルやホイッスルを使わずに,最先端のパフォーマンスを実現する。
さらに、CSTrackは効率的で、単一のモダンGPU上で16.4 FPSで動作し、軽量バージョンは34.6 FPSでも動作する。
完全なコードはhttps://github.com/JudasDie/SOTSで公開されている。
関連論文リスト
- ConsistencyTrack: A Robust Multi-Object Tracker with a Generation Strategy of Consistency Model [20.259334882471574]
マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおいて重要な技術であり、ビデオシーケンス内の複数のターゲットを検出し、各ターゲットにフレーム毎にユニークなIDを割り当てるように設計されている。
既存のMOTメソッドは、様々なシナリオでリアルタイムで複数のオブジェクトを正確に追跡する。
本稿では,境界ボックス上の拡散過程として検出と関連を定式化するための新しいConsistencyTrack, Joint Detection and Tracking (JDT) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-28T05:53:30Z) - Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - SMILEtrack: SiMIlarity LEarning for Occlusion-Aware Multiple Object
Tracking [20.286114226299237]
本稿では,SLM(Siamese Network-based similarity Learning Module)を用いたオブジェクトトラッカーSMILEtrackを紹介する。
SLMは2つのオブジェクト間の外観類似性を計算し、分離検出および埋め込みモデルにおける特徴記述子の制限を克服する。
第2に、連続するビデオフレーム間の堅牢なオブジェクトマッチングのための新しいGATE関数を備えた類似マッチングカスケード(SMC)モジュールを開発する。
論文 参考訳(メタデータ) (2022-11-16T10:49:48Z) - RelationTrack: Relation-aware Multiple Object Tracking with Decoupled
Representation [3.356734463419838]
既存のオンラインマルチオブジェクトトラッキング(MOT)アルゴリズムは、しばしば2つのサブタスク、検出および再識別(ReID)で構成されています。
推論速度を高め、複雑さを減らすために、現在のメソッドは一般的にこれらの二重サブタスクを統一されたフレームワークに統合します。
学習した表現を検出特異的およびReID固有の埋め込みに分離するGlobal Context Disentangling(GCD)というモジュールを考案した。
この制約を解決するために,トランスコーダの強力な推論能力と変形可能な注意を組み合わせることで,誘導トランス(gte)と呼ばれるモジュールを開発した。
論文 参考訳(メタデータ) (2021-05-10T13:00:40Z) - Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT
Philosophy [63.91005999481061]
実用的長期トラッカーは、典型的には3つの重要な特性を含む。
効率的なモデル設計、効果的なグローバル再検出戦略、堅牢な気晴らし認識メカニズム。
動的畳み込み (d-convs) と多重オブジェクト追跡 (MOT) の哲学を用いて, 注意をそらした高速トラッキングを実現するための2タスクトラッキングフレームワーク(DMTrack)を提案する。
我々のトラッカーはLaSOT, OxUvA, TLP, VOT2018LT, VOT 2019LTベンチマークの最先端性能を実現し, リアルタイム3倍高速に動作させる。
論文 参考訳(メタデータ) (2021-04-25T00:59:53Z) - Online Multiple Object Tracking with Cross-Task Synergy [120.70085565030628]
位置予測と埋め込み結合の相乗効果を考慮した新しい統一モデルを提案する。
この2つのタスクは、時間認識対象の注意と注意の注意、およびアイデンティティ認識メモリ集約モデルによってリンクされる。
論文 参考訳(メタデータ) (2021-04-01T10:19:40Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。