論文の概要: Samba: Synchronized Set-of-Sequences Modeling for Multiple Object Tracking
- arxiv url: http://arxiv.org/abs/2410.01806v1
- Date: Wed, 2 Oct 2024 17:59:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 15:04:32.148522
- Title: Samba: Synchronized Set-of-Sequences Modeling for Multiple Object Tracking
- Title(参考訳): Samba: 複数のオブジェクト追跡のための同期セット・オブ・シーケンスモデリング
- Authors: Mattia Segu, Luigi Piccinelli, Siyuan Li, Yung-Hsu Yang, Bernt Schiele, Luc Van Gool,
- Abstract要約: 協調ダンスパフォーマンスやチームスポーツ、動的動物グループといった複雑なシナリオにおける複数のオブジェクト追跡は、ユニークな課題を提示します。
複数トラックレットを共同処理するために設計された新しい線形時間集合列モデルであるSambaを紹介する。
Sambaは、同期した長期メモリ表現を維持しながら、各シーケンスの将来のトラッククエリを自動的に予測する。
本研究では、不確実な観測(MaskObs)を扱うための効果的な手法と、より長いシーケンスにSambaMOTRをスケールするための効率的なトレーニングレシピを提案する。
- 参考スコア(独自算出の注目度): 97.25156823720211
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Multiple object tracking in complex scenarios - such as coordinated dance performances, team sports, or dynamic animal groups - presents unique challenges. In these settings, objects frequently move in coordinated patterns, occlude each other, and exhibit long-term dependencies in their trajectories. However, it remains a key open research question on how to model long-range dependencies within tracklets, interdependencies among tracklets, and the associated temporal occlusions. To this end, we introduce Samba, a novel linear-time set-of-sequences model designed to jointly process multiple tracklets by synchronizing the multiple selective state-spaces used to model each tracklet. Samba autoregressively predicts the future track query for each sequence while maintaining synchronized long-term memory representations across tracklets. By integrating Samba into a tracking-by-propagation framework, we propose SambaMOTR, the first tracker effectively addressing the aforementioned issues, including long-range dependencies, tracklet interdependencies, and temporal occlusions. Additionally, we introduce an effective technique for dealing with uncertain observations (MaskObs) and an efficient training recipe to scale SambaMOTR to longer sequences. By modeling long-range dependencies and interactions among tracked objects, SambaMOTR implicitly learns to track objects accurately through occlusions without any hand-crafted heuristics. Our approach significantly surpasses prior state-of-the-art on the DanceTrack, BFT, and SportsMOT datasets.
- Abstract(参考訳): 調整されたダンスパフォーマンス、チームスポーツ、動的動物グループなど、複雑なシナリオにおける複数のオブジェクトトラッキングは、ユニークな課題を提示します。
これらの設定では、オブジェクトはコーディネートされたパターンで頻繁に動き、互いに干渉し合い、その軌道に長期的依存を示す。
しかし、トラックレット内での長距離依存関係のモデル化、トラックレット間の相互依存性、関連する時間的排除に関する重要な研究課題は依然として残っている。
この目的のために,各トラックレットをモデル化するために使用される複数の選択状態空間を同期させることにより,複数のトラックレットを共同処理する新しい線形時間セット・オブ・シーケンスモデルであるSambaを導入する。
Sambaは、トラックレット間の同期された長期メモリ表現を維持しながら、各シーケンスの将来のトラッククエリを自動的に予測する。
また,Sambaをトラッキング・バイ・プロパゲーション・フレームワークに統合することにより,SambaMOTRを提案する。
さらに、不確実な観測(MaskObs)を扱うための効果的な手法と、より長いシーケンスにSambaMOTRをスケールするための効率的なトレーニングレシピを導入する。
追跡対象間の長距離依存関係と相互作用をモデル化することにより、SambaMOTRは暗黙的に、手作りのヒューリスティクスを使わずにオクルージョンを通してオブジェクトを正確に追跡することを学ぶ。
われわれのアプローチは、DanceTrack、BFT、SportsMOTデータセットの最先端をはるかに上回っている。
関連論文リスト
- Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。
バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z) - MotionTrack: Learning Robust Short-term and Long-term Motions for
Multi-Object Tracking [56.92165669843006]
本研究では,短時間から長期間の軌跡を関連づける統合フレームワークで,堅牢な短期・長期動作を学習するMotionTrackを提案する。
密集した群集に対して,各ターゲットの複雑な動きを推定できる,短時間の軌跡から相互作用認識動作を学習するための新しい対話モジュールを設計する。
極端なオクルージョンのために、ターゲットの履歴軌跡から信頼できる長期動作を学習するための新しいRefind Moduleを構築し、中断された軌跡とそれに対応する検出とを関連付けることができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:33Z) - Standing Between Past and Future: Spatio-Temporal Modeling for
Multi-Camera 3D Multi-Object Tracking [30.357116118917368]
本稿では,エンドツーエンドのマルチカメラ3Dマルチオブジェクト追跡フレームワークを提案する。
我々はこれを"Past-and-Future reasoning for Tracking"(PFTrack)と呼ぶ。
論文 参考訳(メタデータ) (2023-02-07T23:46:34Z) - DanceTrack: Multi-Object Tracking in Uniform Appearance and Diverse
Motion [56.1428110894411]
マルチヒューマントラッキングのための大規模データセットを提案する。
データセットには、主にグループダンスビデオが含まれているので、私たちはそれを"DanceTrack"と名付けます。
当社のデータセット上でいくつかの最先端トラッカーをベンチマークし、既存のベンチマークと比較した場合、DanceTrackの大幅なパフォーマンス低下を観察します。
論文 参考訳(メタデータ) (2021-11-29T16:49:06Z) - Two is a crowd: tracking relations in videos [2.1485350418225244]
本稿では,現状トラッカーを拡張するプラグインリレーショナルモジュール (REM) を提案する。
REMは、追跡対象に対する対応するグラフ時間埋め込みを渡すメッセージを実行することによって、追跡対象間の関係を符号化する。
REMはリレーショナルキューを利用することで、厳しい、あるいは完全に隠蔽されたオブジェクトのトラッキングを可能にする。
論文 参考訳(メタデータ) (2021-08-11T17:19:34Z) - MOTR: End-to-End Multiple-Object Tracking with TRansformer [31.78906135775541]
初の完全エンドツーエンドのマルチオブジェクトトラッキングフレームワークであるMOTRを紹介します。
オブジェクトの長距離時間変動をモデル化することを学ぶ。
結果はMOTRが最先端の性能を達成することを示します。
論文 参考訳(メタデータ) (2021-05-07T13:27:01Z) - Looking Beyond Two Frames: End-to-End Multi-Object Tracking Using
Spatial and Temporal Transformers [20.806348407522083]
MO3TRはエンドツーエンドのオンラインマルチオブジェクトトラッキングフレームワークです。
オブジェクトの相互作用を長期の時間的埋め込みにエンコードする。
明示的なデータアソシエーションモジュールを必要とせずに、開始と終了を追跡する。
論文 参考訳(メタデータ) (2021-03-27T07:23:38Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - Discriminative Appearance Modeling with Multi-track Pooling for
Real-time Multi-object Tracking [20.66906781151]
マルチオブジェクトトラッキングでは、トラッカーはそのメモリ内にシーンの各オブジェクトの外観と動き情報を保持する。
多くのアプローチは、それぞれのターゲットを分離してモデル化し、シーン内のすべてのターゲットを使用してメモリを共同で更新する能力がない。
オンライン上でハードトラッキングのエピソードを生成するマルチトラックプーリングに適応したトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-01-28T18:12:39Z) - SoDA: Multi-Object Tracking with Soft Data Association [75.39833486073597]
マルチオブジェクトトラッキング(MOT)は、自動運転車の安全な配備の前提条件である。
観測対象間の依存関係をエンコードするトラック埋め込みの計算に注目するMOTに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:40:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。