論文の概要: Hard Occlusions in Visual Object Tracking
- arxiv url: http://arxiv.org/abs/2009.04787v1
- Date: Thu, 10 Sep 2020 11:42:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 04:05:18.940116
- Title: Hard Occlusions in Visual Object Tracking
- Title(参考訳): ビジュアルオブジェクト追跡におけるハードオクルージョン
- Authors: Thijs P. Kuipers, Devanshu Arya, Deepak K. Gupta
- Abstract要約: 航空機内回転などのハードシナリオ上での最近の最先端トラッカー(SOTA)の性能をベンチマークする。
その結果,SOTAトラッカーのハードオクルージョンは依然として非常に難しい問題であることがわかった。
特定のカテゴリーによるトラッカー性能の変動は,実世界のシナリオにおけるトラッカー性能を測るのに,平均的なシングルパフォーマンススコアを用いた共通トラッカーランキングが不十分であることを示している。
- 参考スコア(独自算出の注目度): 12.502821224144151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual object tracking is among the hardest problems in computer vision, as
trackers have to deal with many challenging circumstances such as illumination
changes, fast motion, occlusion, among others. A tracker is assessed to be good
or not based on its performance on the recent tracking datasets, e.g., VOT2019,
and LaSOT. We argue that while the recent datasets contain large sets of
annotated videos that to some extent provide a large bandwidth for training
data, the hard scenarios such as occlusion and in-plane rotation are still
underrepresented. For trackers to be brought closer to the real-world scenarios
and deployed in safety-critical devices, even the rarest hard scenarios must be
properly addressed. In this paper, we particularly focus on hard occlusion
cases and benchmark the performance of recent state-of-the-art trackers (SOTA)
on them. We created a small-scale dataset containing different categories
within hard occlusions, on which the selected trackers are evaluated. Results
show that hard occlusions remain a very challenging problem for SOTA trackers.
Furthermore, it is observed that tracker performance varies wildly between
different categories of hard occlusions, where a top-performing tracker on one
category performs significantly worse on a different category. The varying
nature of tracker performance based on specific categories suggests that the
common tracker rankings using averaged single performance scores are not
adequate to gauge tracker performance in real-world scenarios.
- Abstract(参考訳): 視覚物体追跡はコンピュータビジョンにおいて最も難しい問題の一つであり、照明の変化、速い動き、オクルージョンなど多くの困難な状況に対処する必要がある。
トラッカーは、最近の追跡データセット(例えば、VOT2019、LaSOT)のパフォーマンスに基づいて良いかどうかを評価する。
我々は、最近のデータセットには、ある程度の訓練データに対する大きな帯域幅を提供する大量の注釈付きビデオが含まれているが、閉塞や平面内回転といった難易度シナリオはいまだに不足していると論じる。
トラッカーが現実世界のシナリオに近づき、安全クリティカルなデバイスにデプロイされるためには、まれなハードシナリオにも適切に対処する必要がある。
本稿では,特にハード・オクルージョン・ケースに着目し,最新の最先端トラッカー(SOTA)の性能をベンチマークする。
ハードオクルージョン内の異なるカテゴリを含む小規模データセットを作成し、選択したトラッカーを評価した。
その結果,SOTAトラッカーのハードオクルージョンは依然として非常に難しい問題であることがわかった。
さらに,1つのカテゴリにおけるトップパフォーマンストラッカーが,異なるカテゴリにおいて著しく低下するハードオクルージョンのカテゴリ間で,トラッカー性能が著しく変化することが観察された。
特定のカテゴリによるトラッカー性能の変動は,実世界のシナリオにおけるトラッカー性能を評価するのに,平均的なシングルパフォーマンススコアを用いた共通トラッカーランキングが不十分であることを示している。
関連論文リスト
- Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - Tracking Reflected Objects: A Benchmark [12.770787846444406]
我々は、反射オブジェクトのトラッキングに特化したベンチマークであるTROを紹介します。
TROは、約70,000フレームの200のシーケンスを含み、それぞれにバウンディングボックスを慎重にアノテートする。
より強力なベースラインを提供するために,階層的特徴を用いて性能を向上させる新しいトラッカーであるHiP-HaTrackを提案する。
論文 参考訳(メタデータ) (2024-07-07T02:22:45Z) - Large Scale Real-World Multi-Person Tracking [68.27438015329807]
本稿では,新しい大規模多人数追跡データセットであるtexttPersonPath22を提案する。
MOT17、HiEve、MOT20などの高品質なマルチオブジェクト追跡データセットよりも桁違いに大きい。
論文 参考訳(メタデータ) (2022-11-03T23:03:13Z) - AVisT: A Benchmark for Visual Object Tracking in Adverse Visibility [125.77396380698639]
AVisTは、視認性の悪いさまざまなシナリオにおける視覚的トラッキングのためのベンチマークである。
AVisTは、80kの注釈付きフレームを持つ120の挑戦的なシーケンスで構成されており、18の多様なシナリオにまたがっている。
我々は、属性間でのトラッキング性能を詳細に分析し、AVisTで17の人気のトラッカーと最近のトラッカーをベンチマークした。
論文 参考訳(メタデータ) (2022-08-14T17:49:37Z) - Tracking Every Thing in the Wild [61.917043381836656]
我々は,新しい測定基準であるTrack Every Thing Accuracy(TETA)を導入し,測定結果を3つのサブファクター(ローカライゼーション,アソシエーション,分類)に分割する。
実験の結果、TETAはトラッカーをより包括的に評価し、TETerはBDD100KとTAOに挑戦する大規模データセットを大幅に改善することがわかった。
論文 参考訳(メタデータ) (2022-07-26T15:37:19Z) - DanceTrack: Multi-Object Tracking in Uniform Appearance and Diverse
Motion [56.1428110894411]
マルチヒューマントラッキングのための大規模データセットを提案する。
データセットには、主にグループダンスビデオが含まれているので、私たちはそれを"DanceTrack"と名付けます。
当社のデータセット上でいくつかの最先端トラッカーをベンチマークし、既存のベンチマークと比較した場合、DanceTrackの大幅なパフォーマンス低下を観察します。
論文 参考訳(メタデータ) (2021-11-29T16:49:06Z) - Track without Appearance: Learn Box and Tracklet Embedding with Local
and Global Motion Patterns for Vehicle Tracking [45.524183249765244]
車両追跡は多目的追跡(MOT)分野において重要な課題である。
本稿では,外見情報のない車両追跡における動作パターンの重要性について検討する。
本稿では, 長期追跡のための関連課題を, 排他的かつ完全な運動情報を用いて解決する手法を提案する。
論文 参考訳(メタデータ) (2021-08-13T02:27:09Z) - Benchmarking Deep Trackers on Aerial Videos [5.414308305392762]
本論文では,4つの空中データセットの深層学習手法に基づく10のトラッカーを比較した。
我々は,検出による追跡,識別相関フィルタ,シャムネットワーク,強化学習など,さまざまなアプローチを用いた上位パフォーマンストラッカを選択する。
本研究では, 地上映像と比べ, 航空データセットではトラッカーの性能が著しく悪くなることが示唆された。
論文 参考訳(メタデータ) (2021-03-24T01:45:19Z) - TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。
ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。
我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文 参考訳(メタデータ) (2020-05-20T21:07:28Z) - Rethinking Convolutional Features in Correlation Filter Based Tracking [0.0]
我々は階層的な機能ベースのビジュアルトラッカーを再検討し、ディープトラッカーの性能と効率の両方が、機能品質の低さによって制限されていることを発見した。
冗長な機能を取り除いた後、提案するトラッカーは性能と効率の両方で大幅に改善される。
論文 参考訳(メタデータ) (2019-12-30T04:39:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。