論文の概要: Improving Siamese Based Trackers with Light or No Training through Multiple Templates and Temporal Network
- arxiv url: http://arxiv.org/abs/2211.13812v2
- Date: Tue, 15 Oct 2024 07:42:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-16 13:58:19.185100
- Title: Improving Siamese Based Trackers with Light or No Training through Multiple Templates and Temporal Network
- Title(参考訳): 複数テンプレートとテンポラルネットワークによる光・非トレーニングによるシームズベースのトラッカーの改善
- Authors: Ali Sekhavati, Won-Sook Lee,
- Abstract要約: 我々は,シームズをベースとしたトラッカーに2つのアイデアを持つフレームワークを提案する。
i) ネットワークの再トレーニングの必要性を取り除く方法で、テンプレートの数を拡張すること。
(II) 地域情報とグローバル情報の両方に焦点をあてた新しいアーキテクチャを持つ軽量時間ネットワーク。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: High computational power and significant time are usually needed to train a deep learning based tracker on large datasets. Depending on many factors, training might not always be an option. In this paper, we propose a framework with two ideas on Siamese-based trackers. (i) Extending number of templates in a way that removes the need to retrain the network and (ii) a lightweight temporal network with a novel architecture focusing on both local and global information that can be used independently from trackers. Most Siamese-based trackers only rely on the first frame as the ground truth for objects and struggle when the target's appearance changes significantly in subsequent frames in presence of similar distractors. Some trackers use multiple templates which mostly rely on constant thresholds to update, or they replace those templates that have low similarity scores only with more similar ones. Unlike previous works, we use adaptive thresholds that update the bag with similar templates as well as those templates which are slightly diverse. Adaptive thresholds also cause an overall improvement over constant ones. In addition, mixing feature maps obtained by each template in the last stage of networks removes the need to retrain trackers. Our proposed lightweight temporal network, CombiNet, learns the path history of different objects using only object coordinates and predicts target's potential location in the next frame. It is tracker independent and applying it on new trackers does not need further training. By implementing these ideas, trackers' performance improved on all datasets tested on, including LaSOT, LaSOT extension, TrackingNet, OTB100, OTB50, UAV123 and UAV20L. Experiments indicate the proposed framework works well with both convolutional and transformer-based trackers. The official python code for this paper will be publicly available upon publication.
- Abstract(参考訳): 大規模データセット上でのディープラーニングベースのトラッカーのトレーニングには,高計算能力と大幅な時間が必要である。
多くの要因によっては、トレーニングが必ずしも選択肢であるとは限らない。
本稿では,シームズをベースとしたトラッカーに2つのアイデアを取り入れたフレームワークを提案する。
(i)ネットワークを再トレーニングする必要をなくし、テンプレートの数を拡張すること。
(II) トラッカーから独立して使用できるローカル情報とグローバル情報の両方に着目した,新しいアーキテクチャを持つ軽量時間ネットワーク。
シームズをベースとしたほとんどのトラッカーは第1フレームのみをオブジェクトの真理と闘いの基礎として頼りにしている。
一部のトラッカーは、更新のしきい値に大きく依存する複数のテンプレートを使用するか、類似度が低いテンプレートを、より類似したテンプレートに置き換える。
以前の作業とは異なり、我々は適応しきい値を使用して、バッグを似たようなテンプレートで更新します。
適応しきい値はまた、一定値よりも全体的な改善をもたらす。
さらに、各テンプレートが取得した特徴マップをネットワークの最後の段階で混合することで、トラッカーを再トレーニングする必要がなくなる。
提案する軽量時間ネットワークCombiNetは,オブジェクト座標のみを用いて異なるオブジェクトの経路履歴を学習し,次のフレームにおけるターゲットの潜在的な位置を予測する。
トラッカーは独立しており、新たなトラッカーに適用しても追加のトレーニングは不要である。
これらのアイデアを実装することで、LaSOT、LaSOT拡張、TrackingNet、TB100、TB50、UAV123、UAV20Lなど、テスト対象の全データセットのパフォーマンスが改善された。
実験により、提案フレームワークは畳み込みとトランスフォーマーベースのトラッカーの両方でうまく動作することが示された。
本論文の公式パイソンコードは,公開時に公開される予定である。
関連論文リスト
- Tracking Meets LoRA: Faster Training, Larger Model, Stronger Performance [87.19164603145056]
実験室レベルの資源をトラッキングするための大規模ViTモデルのパワーを明らかにする手法であるLoRATを提案する。
私たちの作業の本質は、推論レイテンシを追加することなく、モデルパラメータの小さなサブセットを微調整するテクニックであるLoRAを適用することです。
我々はPETRの適応のみに基づくアンカーフリーヘッドを設計し、計算オーバーヘッドを少なくして性能を向上する。
論文 参考訳(メタデータ) (2024-03-08T11:41:48Z) - A new hope for network model generalization [66.5377859849467]
ネットワークトラフィックダイナミクスのための機械学習モデルを一般化することは、失われた原因とみなされる傾向がある。
_Transformer_と呼ばれるMLアーキテクチャは、これまで想像不可能だった他のドメインでの一般化を可能にした。
パケットトレースからネットワークダイナミクスを学習するためのNTT(Network Traffic Transformer)を提案する。
論文 参考訳(メタデータ) (2022-07-12T21:16:38Z) - Context-aware Visual Tracking with Joint Meta-updating [11.226947525556813]
本稿では,シーケンス全体に沿った情報を活用することで,両ブランチを共同でメタ更新する,表現空間上のトラッカーを最適化するコンテキスト認識追跡モデルを提案する。
提案手法は,VOT2018におけるEAOスコアの0.514を40FPSの速度で達成し,基礎となるトラッカーの精度とロバスト性を向上できることを示す。
論文 参考訳(メタデータ) (2022-04-04T14:16:00Z) - Unified Transformer Tracker for Object Tracking [58.65901124158068]
異なるシナリオにおけるトラッキング問題に1つのパラダイムで対処するために,UTT(Unified Transformer Tracker)を提案する。
SOT(Single Object Tracking)とMOT(Multiple Object Tracking)の両方を対象とするトラックトランスフォーマーを開発した。
論文 参考訳(メタデータ) (2022-03-29T01:38:49Z) - Updatable Siamese Tracker with Two-stage One-shot Learning [10.13621503834501]
オフラインSiameseネットワークは、特に精度と効率で、非常に有望な追跡性能を達成しました。
従来の更新器では、オブジェクトの不規則なバリエーションの処理やノイズのサンプリングが難しいため、siameseネットワークの更新にそれらを採用するのは極めて危険である。
本論文では, 対象試料を多段階から抽出し, 一次分類器の局所パラメータを予測できる2段階のワンショット学習者を提案する。
次に,オンライン更新を補完できる学習者(SiamTOL)に基づいて,更新可能なSiameseネットワークを提案する。
論文 参考訳(メタデータ) (2021-04-30T15:18:41Z) - STMTrack: Template-free Visual Tracking with Space-time Memory Networks [42.06375415765325]
テンプレート更新機構を持つ既存のトラッカーは、競争性能を達成するために、時間を要する数値最適化と複雑な手設計戦略に依存している。
本稿では,ターゲットに関する歴史的情報を十分に活用することのできる,時空メモリネットワーク上に構築した新しいトラッキングフレームワークを提案する。
具体的には、ターゲットの履歴情報を記憶して、トラッカーを現在のフレーム内の最も情報性の高い領域に集中させる新しい記憶機構を導入する。
論文 参考訳(メタデータ) (2021-04-01T08:10:56Z) - Multiple Convolutional Features in Siamese Networks for Object Tracking [13.850110645060116]
Multiple Features-Siamese Tracker (MFST) は、ロバストな追跡のために複数の階層的な特徴マップを利用する新しい追跡アルゴリズムである。
MFSTは、オブジェクト追跡ベンチマークにおいて標準のサイメムトラッカーよりも高いトラッキング精度を達成する。
論文 参考訳(メタデータ) (2021-03-01T08:02:27Z) - MFST: Multi-Features Siamese Tracker [13.850110645060116]
Multi-Features Siamese Tracker (MFST) は、複数の階層的特徴マップを利用して、頑健な類似性追跡を行う新しい追跡アルゴリズムである。
MFSTは、標準的なシームズトラッカーを含む最先端のトラッカーよりも高いトラッキング精度を実現している。
論文 参考訳(メタデータ) (2021-03-01T07:18:32Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z) - Tracking by Instance Detection: A Meta-Learning Approach [99.66119903655711]
本稿では,高性能トラッカー構築のための3段階の原理的手法を提案する。
我々は2つの現代的な検出器であるRetinaNetとFCOSをベースに、Retina-MAMLとFCOS-MAMLという2つのトラッカーを構築した。
両方のトラッカーは40FPSでリアルタイムに動作します。
論文 参考訳(メタデータ) (2020-04-02T05:55:06Z) - High-Performance Long-Term Tracking with Meta-Updater [75.80564183653274]
短期的追跡よりも実用的に近いため、長期的視覚追跡が注目されている。
ほとんどのトップランクの長期トラッカーはオフラインでトレーニングされたSiameseアーキテクチャを採用しているため、オンライン更新による短期トラッカーの大きな進歩の恩恵を受けることはできない。
我々は、重要な問題に対処するために、オフラインでトレーニングされた新しいメタ更新器を提案する: トラッカーは、現在のフレームで更新する準備ができているか?
論文 参考訳(メタデータ) (2020-04-01T09:29:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。