論文の概要: Deep Learning-Based Multi-Object Tracking: A Comprehensive Survey from Foundations to State-of-the-Art
- arxiv url: http://arxiv.org/abs/2506.13457v1
- Date: Mon, 16 Jun 2025 13:15:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:48.487126
- Title: Deep Learning-Based Multi-Object Tracking: A Comprehensive Survey from Foundations to State-of-the-Art
- Title(参考訳): 深層学習に基づく多対象追跡:基礎から現状への包括的調査
- Authors: Momir Adžemović,
- Abstract要約: マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおける中核的なタスクであり、フレーム内のオブジェクトを検出し、時間をかけて関連付ける。
ディープラーニングベースの手法の進歩は、2022年にByteTrackによるトラッキング・バイ・検出と、エンドツーエンドのトラッキングのためのMOTRの導入によって加速された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-object tracking (MOT) is a core task in computer vision that involves detecting objects in video frames and associating them across time. The rise of deep learning has significantly advanced MOT, particularly within the tracking-by-detection paradigm, which remains the dominant approach. Advancements in modern deep learning-based methods accelerated in 2022 with the introduction of ByteTrack for tracking-by-detection and MOTR for end-to-end tracking. Our survey provides an in-depth analysis of deep learning-based MOT methods, systematically categorizing tracking-by-detection approaches into five groups: joint detection and embedding, heuristic-based, motion-based, affinity learning, and offline methods. In addition, we examine end-to-end tracking methods and compare them with existing alternative approaches. We evaluate the performance of recent trackers across multiple benchmarks and specifically assess their generality by comparing results across different domains. Our findings indicate that heuristic-based methods achieve state-of-the-art results on densely populated datasets with linear object motion, while deep learning-based association methods, in both tracking-by-detection and end-to-end approaches, excel in scenarios with complex motion patterns.
- Abstract(参考訳): マルチオブジェクトトラッキング(MOT)は、コンピュータビジョンにおける中核的なタスクであり、ビデオフレーム内のオブジェクトを検出し、時間をかけて関連付ける。
ディープラーニングの台頭は、特にトラッキング・バイ・ディテクト・パラダイムにおいて、かなり進歩したMOTであり、依然として主流のアプローチである。
2022年には、トラッキング・バイ・検出のためのByteTrackと、エンドツーエンドのトラッキングのためのMOTRが導入され、最新のディープラーニングベースの手法の進歩が加速した。
本調査では, 深層学習に基づくMOT手法の詳細な分析を行い, トラッキング・バイ・検出手法を, 共同検出・埋め込み, ヒューリスティックベース, モーションベース, 親和性学習, オフライン手法の5つのグループに体系的に分類した。
さらに、エンド・ツー・エンドのトラッキング手法について検討し、既存の代替手法と比較する。
我々は、複数のベンチマークで最新のトラッカーの性能を評価し、異なる領域で結果を比較することで、それらの一般性を評価する。
以上の結果から,線形物体運動を持つ密集したデータセットに対して,ヒューリスティックな手法が最先端の結果を得る一方で,深層学習に基づくアソシエーション手法が,複雑な動きパターンを持つシナリオにおいて優れていることが示唆された。
関連論文リスト
- CAMELTrack: Context-Aware Multi-cue ExpLoitation for Online Multi-Object Tracking [68.24998698508344]
CAMELはコンテキスト対応型マルチキューExpLoitationのための新しいアソシエイトモジュールである。
エンド・ツー・エンドの検知・バイ・トラック方式とは異なり,本手法は軽量かつ高速にトレーニングが可能であり,外部のオフ・ザ・シェルフモデルを活用することができる。
提案するオンライントラッキングパイプラインであるCAMELTrackは,複数のトラッキングベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-05-02T13:26:23Z) - Multi-object Tracking by Detection and Query: an efficient end-to-end manner [23.926668750263488]
従来の検出によるトラッキングと、クエリによる新たなトラッキングだ。
本稿では,学習可能なアソシエータによって達成されるトラッキング・バイ・検出・クエリーのパラダイムを提案する。
トラッキング・バイ・クエリーモデルと比較すると、LAIDは特に訓練効率の高い競合追跡精度を達成している。
論文 参考訳(メタデータ) (2024-11-09T14:38:08Z) - VOVTrack: Exploring the Potentiality in Videos for Open-Vocabulary Object Tracking [61.56592503861093]
オープンボキャブラリオブジェクト検出(OVD)とマルチオブジェクトトラッキング(MOT)の複雑さを両立させる。
OVMOT の既存のアプローチは、OVD と MOT の方法論を別個のモジュールとして統合することが多く、主に画像中心のレンズによる問題に焦点を当てている。
VOVTrackは、MOTとビデオ中心トレーニングに関連するオブジェクト状態を統合する新しい手法であり、ビデオオブジェクト追跡の観点からこの問題に対処する。
論文 参考訳(メタデータ) (2024-10-11T05:01:49Z) - SeMoLi: What Moves Together Belongs Together [51.72754014130369]
動作手がかりに基づく半教師付き物体検出に挑戦する。
近年,移動物体の擬似ラベルインスタンスに対して,動きに基づくクラスタリング手法が適用可能であることが示唆された。
我々は、このアプローチを再考し、オブジェクト検出とモーションインスパイアされた擬似ラベルの両方が、データ駆動方式で取り組めることを示唆する。
論文 参考訳(メタデータ) (2024-02-29T18:54:53Z) - Recent Advances in Embedding Methods for Multi-Object Tracking: A Survey [71.10448142010422]
マルチオブジェクトトラッキング(MOT)は、動画フレーム全体で対象物を関連付け、移動軌道全体を取得することを目的としている。
埋め込み法はMOTにおける物体の位置推定と時間的同一性関連において重要な役割を担っている。
まず 7 つの異なる視点からMOT への埋め込み手法の奥行き解析による包括的概要を述べる。
論文 参考訳(メタデータ) (2022-05-22T06:54:33Z) - Deep Learning on Monocular Object Pose Detection and Tracking: A
Comprehensive Overview [8.442460766094674]
オブジェクトのポーズ検出と追跡は、自律運転、ロボット工学、拡張現実など、多くの分野で広く応用されているため、注目を集めている。
ディープラーニングは、他のものよりも優れたパフォーマンスを示した最も有望なものです。
本稿では,ディープラーニング技術経路に属するオブジェクトのポーズ検出と追跡の最近の進歩を概観する。
論文 参考訳(メタデータ) (2021-05-29T12:59:29Z) - Tracking-by-Counting: Using Network Flows on Crowd Density Maps for
Tracking Multiple Targets [96.98888948518815]
State-of-the-art multi-object tracking(MOT)法は、トラッキング・バイ・検出のパラダイムに従っている。
混み合ったシーンに適したMOTパラダイムであるトラッキング・バイ・カウントを提案する。
論文 参考訳(メタデータ) (2020-07-18T19:51:53Z) - Learning to associate detections for real-time multiple object tracking [0.0]
本研究では, ニューラルネットワークを用いて, 検出に使用可能な類似性関数を学習する。
提案したトラッカーは最先端の手法で得られた結果と一致し、ベースラインとして使用される最近の類似手法よりも58%高速に動作している。
論文 参考訳(メタデータ) (2020-07-12T17:08:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。