論文の概要: Learn to Match: Automatic Matching Network Design for Visual Tracking
- arxiv url: http://arxiv.org/abs/2108.00803v1
- Date: Mon, 2 Aug 2021 12:09:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:15:22.432758
- Title: Learn to Match: Automatic Matching Network Design for Visual Tracking
- Title(参考訳): マッチングを学ぶ:ビジュアルトラッキングのための自動マッチングネットワーク設計
- Authors: Zhipeng Zhang, Yihao Liu, Xiao Wang, Bing Li, Weiming Hu
- Abstract要約: 明示的な類似性学習の代わりに、6つの新しいマッチング演算子を導入する。
本稿では,これらの演算子の最適組み合わせを探索するバイナリチャネル操作を提案する。
我々のモデルは、OTB100、LaSOT、TrackingNetで67.2の右ロー71.4$、52.6の右ロー58.3$、70.3の右ロー76.0$の利益を得られる。
- 参考スコア(独自算出の注目度): 43.476030483114094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Siamese tracking has achieved groundbreaking performance in recent years,
where the essence is the efficient matching operator cross-correlation and its
variants. Besides the remarkable success, it is important to note that the
heuristic matching network design relies heavily on expert experience.
Moreover, we experimentally find that one sole matching operator is difficult
to guarantee stable tracking in all challenging environments. Thus, in this
work, we introduce six novel matching operators from the perspective of feature
fusion instead of explicit similarity learning, namely Concatenation,
Pointwise-Addition, Pairwise-Relation, FiLM, Simple-Transformer and
Transductive-Guidance, to explore more feasibility on matching operator
selection. The analyses reveal these operators' selective adaptability on
different environment degradation types, which inspires us to combine them to
explore complementary features. To this end, we propose binary channel
manipulation (BCM) to search for the optimal combination of these operators.
BCM determines to retrain or discard one operator by learning its contribution
to other tracking steps. By inserting the learned matching networks to a strong
baseline tracker Ocean, our model achieves favorable gains by $67.2 \rightarrow
71.4$, $52.6 \rightarrow 58.3$, $70.3 \rightarrow 76.0$ success on OTB100,
LaSOT, and TrackingNet, respectively. Notably, Our tracker, dubbed AutoMatch,
uses less than half of training data/time than the baseline tracker, and runs
at 50 FPS using PyTorch. Code and model will be released at
https://github.com/JudasDie/SOTS.
- Abstract(参考訳): シームズ追跡は近年、効率的な整合演算子相互相関とその変種を基本とする画期的な性能を達成している。
顕著な成功に加えて、ヒューリスティックなマッチングネットワーク設計は専門家の経験に大きく依存していることに注意する必要がある。
さらに,1つの単独マッチング演算子では,すべての困難な環境で安定したトラッキングを保証することが困難であることが実験的に判明した。
そこで,本研究では,特徴融合の観点から,類似性学習(Concatenation, Pointwise-Addition, Pairwise-Relation, FiLM, Simple-Transformer, Transductive-Guidance)の6つの新しいマッチング演算子を紹介し,マッチング演算子選択の実現可能性について検討する。
分析により, 異なる環境劣化型に対する操作者の選択的適応性を明らかにし, 相補的特徴を探求するきっかけとなった。
そこで本稿では,これらの演算子の最適組み合わせを探索するためのバイナリチャネル操作(BCM)を提案する。
bcmは、他の追跡ステップへの貢献を学習することによって、あるオペレータを再訓練または破棄することを決定する。
学習したマッチングネットワークを強力なベースライントラッカーであるOceanに挿入することで、当社のモデルは67.2 \rightarrow 71.4$, 5,2.6 \rightarrow 58.3$, 70.3 \rightarrow 76.0$, OTB100, LaSOT, TrackingNetでそれぞれ良好な利益を得ることができた。
特に、automattchと呼ばれる当社のトラッカーは、ベースライントラッカよりもトレーニングデータ/時間の半分未満で、pytorchを使用して50fpsで動作します。
コードとモデルはhttps://github.com/JudasDie/SOTS.comでリリースされる。
関連論文リスト
- Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - Multi-attention Associate Prediction Network for Visual Tracking [3.9628431811908533]
分類回帰予測ネットワークは、いくつかの現代のディープトラッカーにおいて驚くべき成功を収めている。
分類と回帰タスクには固有の違いがあるため、特徴マッチングの要求にも反対の要求がある。
上記の問題に対処するために,マルチアテンションアソシエイト予測ネットワーク(MAPNet)を提案する。
論文 参考訳(メタデータ) (2024-03-25T03:18:58Z) - UniNet: Unified Architecture Search with Convolution, Transformer, and
MLP [39.489331136395535]
本稿では,高性能ネットワークのための新しい統一アーキテクチャ探索手法を提案する。
まず、全く異なる探索可能作用素を統一形式でモデル化する。
次に、異なるタイプの演算子間のギャップを軽減するために、コンテキスト対応のダウンサンプリングモジュール(DSM)を提案する。
第3に,演算子とDSMを統合検索空間に統合し,強化学習に基づく探索アルゴリズムを用いて探索する。
論文 参考訳(メタデータ) (2022-07-12T09:30:58Z) - Learning Tracking Representations via Dual-Branch Fully Transformer
Networks [82.21771581817937]
追従のためのトランスフォーマーのみをベースとした,シームズ型デュアルブランチネットワークを提案する。
注目ウィンドウ内の他のパッチとのマッチング結果に基づいて,各パッチの特徴ベクトルを抽出する。
この手法は、最高の性能の方法として、より良い結果または同等の結果を得る。
論文 参考訳(メタデータ) (2021-12-05T13:44:33Z) - SwinTrack: A Simple and Strong Baseline for Transformer Tracking [81.65306568735335]
完全注意型トランスフォーマートラッキングアルゴリズムSwin-Transformer Tracker(SwinTrack)を提案する。
SwinTrackは、機能抽出と機能融合の両方にTransformerを使用し、ターゲットオブジェクトと検索領域の間の完全なインタラクションを可能にする。
我々の徹底的な実験で、SwinTrackはLaSOT上で0.717 SUCで新しい記録を樹立し、45FPSで走りながらSTARKを4.6%上回った。
論文 参考訳(メタデータ) (2021-12-02T05:56:03Z) - Identify Light-Curve Signals with Deep Learning Based Object Detection
Algorithm. I. Transit Detection [4.282591407862616]
そこで我々は,コンピュータビジョン分野におけるオブジェクト検出の枠組みに基づいた,新しい検出アルゴリズムを開発した。
このモデルでは,信号-雑音比が6より高いトランジットを同定するために,約90%の精度とリコールが得られる。
提案アルゴリズムの結果は人間の視覚知覚の直感と一致し,シングルトランジット候補を見つけるのに有用である。
論文 参考訳(メタデータ) (2021-08-02T07:15:13Z) - Vision Transformers are Robust Learners [65.91359312429147]
ビジョントランスフォーマー(ViT)の一般的な腐敗や摂動、分布シフト、自然逆転例に対する堅牢性について検討します。
ViTsが実際により堅牢な学習者である理由を説明するために、定量的および定性的な指標を提供する分析を提示します。
論文 参考訳(メタデータ) (2021-05-17T02:39:22Z) - Learning to Filter: Siamese Relation Network for Robust Tracking [30.997502234275206]
2つの効率的なモジュール、すなわち、Siamese関係ネットワークを提案する。
Relation Detector (RD) と Refinement Module (RM)
RDはメタラーニング方式で実行し、背景からイントラクタをフィルタリングする学習能力を得る。
RMは提案されたRDをSiameseフレームワークに効果的に統合し、正確な追跡結果を生成することを目的としている。
論文 参考訳(メタデータ) (2021-04-02T00:53:33Z) - Transformer Tracking [76.96796612225295]
相関は追跡分野において、特に人気のあるシャム系トラッカーにおいて重要な役割を果たす。
本研究は,注意のみを用いてテンプレートと検索領域を効果的に結合した,新しい注意型特徴融合ネットワークを提案する。
実験により、TransTは6つの挑戦的なデータセットで非常に有望な結果が得られます。
論文 参考訳(メタデータ) (2021-03-29T09:06:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。