論文の概要: Tracking by Instance Detection: A Meta-Learning Approach
- arxiv url: http://arxiv.org/abs/2004.00830v1
- Date: Thu, 2 Apr 2020 05:55:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 12:47:45.525955
- Title: Tracking by Instance Detection: A Meta-Learning Approach
- Title(参考訳): インスタンス検出による追跡:メタラーニングアプローチ
- Authors: Guangting Wang, Chong Luo, Xiaoyan Sun, Zhiwei Xiong and Wenjun Zeng
- Abstract要約: 本稿では,高性能トラッカー構築のための3段階の原理的手法を提案する。
我々は2つの現代的な検出器であるRetinaNetとFCOSをベースに、Retina-MAMLとFCOS-MAMLという2つのトラッカーを構築した。
両方のトラッカーは40FPSでリアルタイムに動作します。
- 参考スコア(独自算出の注目度): 99.66119903655711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the tracking problem as a special type of object detection
problem, which we call instance detection. With proper initialization, a
detector can be quickly converted into a tracker by learning the new instance
from a single image. We find that model-agnostic meta-learning (MAML) offers a
strategy to initialize the detector that satisfies our needs. We propose a
principled three-step approach to build a high-performance tracker. First, pick
any modern object detector trained with gradient descent. Second, conduct
offline training (or initialization) with MAML. Third, perform domain
adaptation using the initial frame. We follow this procedure to build two
trackers, named Retina-MAML and FCOS-MAML, based on two modern detectors
RetinaNet and FCOS. Evaluations on four benchmarks show that both trackers are
competitive against state-of-the-art trackers. On OTB-100, Retina-MAML achieves
the highest ever AUC of 0.712. On TrackingNet, FCOS-MAML ranks the first on the
leader board with an AUC of 0.757 and the normalized precision of 0.822. Both
trackers run in real-time at 40 FPS.
- Abstract(参考訳): 我々は,このトラッキング問題を,インスタンス検出と呼ばれる特別な種類のオブジェクト検出問題とみなす。
適切な初期化により、検出器は1つの画像から新しいインスタンスを学習することによって、すぐにトラッカーに変換できる。
モデルに依存しないメタラーニング(MAML)は、我々のニーズを満たす検出器を初期化する戦略を提供する。
高性能トラッカ構築のための原則3段階アプローチを提案する。
まず、勾配降下訓練された現代の物体検出器を選択する。
第2に、MAMLでオフライントレーニング(あるいは初期化)を行う。
第3に、初期フレームを使用してドメイン適応を実行する。
そこで我々は,2つの現代的な検出器であるRetinaNetとFCOSをベースとした,Retina-MAMLとFCOS-MAMLという2つのトラッカーを構築した。
4つのベンチマークによる評価は、両方のトラッカーが最先端トラッカーと競合していることを示している。
OTB-100では、Retina-MAMLが0.712のAUCを達成している。
TrackingNetでは、FCOS-MAMLがAUC 0.757、正規化精度0.822でトップボードにランクインしている。
両方のトラッカーは40FPSでリアルタイムに走る。
関連論文リスト
- HSTrack: Bootstrap End-to-End Multi-Camera 3D Multi-object Tracking with Hybrid Supervision [34.7347336548199]
カメラベースの3Dマルチオブジェクトトラッキング(MOT)では、一般的な手法はトラッキング・バイ・クエリー・プロパゲーションのパラダイムに従っている。
本稿では,HSTrackを提案する。HSTrackは,マルチタスク学習を協調して検出・追跡する新しいプラグイン・アンド・プレイ方式である。
論文 参考訳(メタデータ) (2024-11-11T08:18:49Z) - Bridging the Gap Between End-to-end and Non-End-to-end Multi-Object
Tracking [27.74953961900086]
既存のエンドツーエンドのマルチオブジェクト追跡(e2e-MOT)手法は、非エンドツーエンドのトラッキング・バイ・検出手法を超えていない。
本稿では,e2e-MOT をシャドウ概念を用いた新しいラベル割り当てにより,簡便かつ効果的な方法である Co-MOT を提案する。
論文 参考訳(メタデータ) (2023-05-22T05:18:34Z) - MixFormer: End-to-End Tracking with Iterative Mixed Attention [47.78513247048846]
変換器上に構築されたMixFormerと呼ばれる,コンパクトなトラッキングフレームワークを提案する。
特徴抽出と目標情報統合を同時に行うための混合注意モジュール(MAM)を提案する。
私たちのMixFormerトラッカーは、7つのトラッキングベンチマークで最先端のパフォーマンスを設定しました。
論文 参考訳(メタデータ) (2023-02-06T14:38:09Z) - StrongSORT: Make DeepSORT Great Again [19.099510933467148]
我々は、古典的なトラッカーであるDeepSORTを再検討し、検出、埋め込み、関連付けといった様々な側面からアップグレードする。
結果、StrongSORTと呼ばれるトラッカーは、MOT17とMOT20に新しいHOTAとIDF1レコードをセットする。
追跡結果をさらに改善するために,軽量かつプラグアンドプレイのアルゴリズムを2つ提案する。
論文 参考訳(メタデータ) (2022-02-28T02:37:19Z) - ByteTrack: Multi-Object Tracking by Associating Every Detection Box [51.93588012109943]
マルチオブジェクトトラッキング(MOT)は、ビデオ内のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
ほとんどの方法は、スコアがしきい値よりも高い検出ボックスを連想させることでアイデンティティを得る。
本稿では,BYTEと呼ばれるシンプルで効果的で汎用的なアソシエーション手法を提案する。
論文 参考訳(メタデータ) (2021-10-13T17:01:26Z) - Learning to Track Objects from Unlabeled Videos [63.149201681380305]
本稿では,Unsupervised Single Object Tracker (USOT) をスクラッチから学習することを提案する。
教師なしトラッカーと教師なしトラッカーのギャップを狭めるために,3段階からなる効果的な教師なし学習手法を提案する。
実験の結果、未ラベルのビデオから得られたUSOTは、最先端の教師なしトラッカーよりも大きなマージンでうまく機能していることがわかった。
論文 参考訳(メタデータ) (2021-08-28T22:10:06Z) - Distractor-Aware Fast Tracking via Dynamic Convolutions and MOT
Philosophy [63.91005999481061]
実用的長期トラッカーは、典型的には3つの重要な特性を含む。
効率的なモデル設計、効果的なグローバル再検出戦略、堅牢な気晴らし認識メカニズム。
動的畳み込み (d-convs) と多重オブジェクト追跡 (MOT) の哲学を用いて, 注意をそらした高速トラッキングを実現するための2タスクトラッキングフレームワーク(DMTrack)を提案する。
我々のトラッカーはLaSOT, OxUvA, TLP, VOT2018LT, VOT 2019LTベンチマークの最先端性能を実現し, リアルタイム3倍高速に動作させる。
論文 参考訳(メタデータ) (2021-04-25T00:59:53Z) - Chained-Tracker: Chaining Paired Attentive Regression Results for
End-to-End Joint Multiple-Object Detection and Tracking [102.31092931373232]
そこで我々は,3つのサブタスク全てをエンド・ツー・エンドのソリューションに統合する簡単なオンラインモデルである Chained-Tracker (CTracker) を提案する。
鎖状構造と対の注意的回帰という2つの大きな特徴は、CTrackerをシンプルに、速く、効果的にする。
論文 参考訳(メタデータ) (2020-07-29T02:38:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。