論文の概要: Two is a crowd: tracking relations in videos
- arxiv url: http://arxiv.org/abs/2108.05331v1
- Date: Wed, 11 Aug 2021 17:19:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 13:24:41.224084
- Title: Two is a crowd: tracking relations in videos
- Title(参考訳): 2つは群衆:ビデオ内の関係を追跡する
- Authors: Artem Moskalev, Ivan Sosnovik, Arnold Smeulders
- Abstract要約: 本稿では,現状トラッカーを拡張するプラグインリレーショナルモジュール (REM) を提案する。
REMは、追跡対象に対する対応するグラフ時間埋め込みを渡すメッセージを実行することによって、追跡対象間の関係を符号化する。
REMはリレーショナルキューを利用することで、厳しい、あるいは完全に隠蔽されたオブジェクトのトラッキングを可能にする。
- 参考スコア(独自算出の注目度): 2.1485350418225244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking multiple objects individually differs from tracking groups of
related objects. When an object is a part of the group, its trajectory depends
on the trajectories of the other group members. Most of the current
state-of-the-art trackers follow the approach of tracking each object
independently, with the mechanism to handle the overlapping trajectories where
necessary. Such an approach does not take inter-object relations into account,
which may cause unreliable tracking for the members of the groups, especially
in crowded scenarios, where individual cues become unreliable due to
occlusions. To overcome these limitations and to extend such trackers to
crowded scenes, we propose a plug-in Relation Encoding Module (REM). REM
encodes relations between tracked objects by running a message passing over a
corresponding spatio-temporal graph, computing relation embeddings for the
tracked objects. Our experiments on MOT17 and MOT20 demonstrate that the
baseline tracker improves its results after a simple extension with REM. The
proposed module allows for tracking severely or even fully occluded objects by
utilizing relational cues.
- Abstract(参考訳): 複数のオブジェクトを個別に追跡することは、関連するオブジェクトのトラッキンググループとは異なる。
対象がグループの一部である場合、その軌道は他のグループメンバーの軌道に依存する。
現在の最先端トラッカーのほとんどは、必要に応じて重なり合う軌跡を扱うメカニズムとともに、各オブジェクトを独立して追跡するアプローチに従っている。
このようなアプローチは対象間の関係を考慮に入れず、特に密集したシナリオにおいて、グループのメンバーの信頼できない追跡を引き起こす可能性がある。
これらの制限を克服し、そのようなトラッカーを混雑したシーンに拡張するために、プラグインリレーショナルエンコーディングモジュール(REM)を提案する。
REMは追跡対象間の関係を、対応する時空間グラフ上でメッセージパッシングを実行し、追跡対象に対する計算関係の埋め込みを符号化する。
MOT17 と MOT20 に関する実験により,REM による単純な拡張後,ベースライントラッカーの精度が向上することを示した。
提案するモジュールは,リレーショナルキューを利用することで,厳密あるいは完全に隠蔽されたオブジェクトの追跡を可能にする。
関連論文リスト
- OmniTracker: Unifying Object Tracking by Tracking-with-Detection [119.51012668709502]
OmniTrackerは、完全に共有されたネットワークアーキテクチャ、モデルウェイト、推論パイプラインですべてのトラッキングタスクを解決するために提供されている。
LaSOT、TrackingNet、DAVIS16-17、MOT17、MOTS20、YTVIS19を含む7つの追跡データセットの実験は、OmniTrackerがタスク固有の追跡モデルと統合された追跡モデルの両方よりも、オンパーまたはそれ以上の結果を達成することを示した。
論文 参考訳(メタデータ) (2023-03-21T17:59:57Z) - MotionTrack: Learning Robust Short-term and Long-term Motions for
Multi-Object Tracking [56.92165669843006]
本研究では,短時間から長期間の軌跡を関連づける統合フレームワークで,堅牢な短期・長期動作を学習するMotionTrackを提案する。
密集した群集に対して,各ターゲットの複雑な動きを推定できる,短時間の軌跡から相互作用認識動作を学習するための新しい対話モジュールを設計する。
極端なオクルージョンのために、ターゲットの履歴軌跡から信頼できる長期動作を学習するための新しいRefind Moduleを構築し、中断された軌跡とそれに対応する検出とを関連付けることができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:33Z) - Tracking by Associating Clips [110.08925274049409]
本稿では,オブジェクト関連をクリップワイドマッチングとして扱う方法を検討する。
我々の新しい視点では、1つの長いビデオシーケンスを複数のショートクリップとみなし、そのトラックはクリップ内とクリップ間の両方で実行される。
この新しい手法の利点は2つある。まず、ビデオチャンキングによって中断フレームをバイパスできるため、エラーの蓄積や伝播の追跡に頑健である。
次に、クリップワイドマッチング中に複数のフレーム情報を集約し、現在のフレームワイドマッチングよりも高精度な長距離トラックアソシエーションを実現する。
論文 参考訳(メタデータ) (2022-12-20T10:33:17Z) - Unified Transformer Tracker for Object Tracking [58.65901124158068]
異なるシナリオにおけるトラッキング問題に1つのパラダイムで対処するために,UTT(Unified Transformer Tracker)を提案する。
SOT(Single Object Tracking)とMOT(Multiple Object Tracking)の両方を対象とするトラックトランスフォーマーを開発した。
論文 参考訳(メタデータ) (2022-03-29T01:38:49Z) - Learning to Track with Object Permanence [61.36492084090744]
共同物体の検出と追跡のためのエンドツーエンドのトレーニング可能なアプローチを紹介します。
私たちのモデルは、合成データと実データで共同トレーニングされ、KITTIおよびMOT17データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2021-03-26T04:43:04Z) - Discriminative Appearance Modeling with Multi-track Pooling for
Real-time Multi-object Tracking [20.66906781151]
マルチオブジェクトトラッキングでは、トラッカーはそのメモリ内にシーンの各オブジェクトの外観と動き情報を保持する。
多くのアプローチは、それぞれのターゲットを分離してモデル化し、シーン内のすべてのターゲットを使用してメモリを共同で更新する能力がない。
オンライン上でハードトラッキングのエピソードを生成するマルチトラックプーリングに適応したトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-01-28T18:12:39Z) - TrackFormer: Multi-Object Tracking with Transformers [92.25832593088421]
TrackFormerはエンコーダデコーダトランスフォーマーアーキテクチャに基づくエンドツーエンドのマルチオブジェクトトラッキングおよびセグメンテーションモデルです。
新しいトラッククエリはDETRオブジェクト検出器によって生成され、時間とともに対応するオブジェクトの位置を埋め込む。
trackformerは新しいトラッキング・バイ・アテンションパラダイムでフレーム間のシームレスなデータ関連付けを実現する。
論文 参考訳(メタデータ) (2021-01-07T18:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。