論文の概要: Optimized Information Flow for Transformer Tracking
- arxiv url: http://arxiv.org/abs/2402.08195v1
- Date: Tue, 13 Feb 2024 03:39:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 16:43:35.595250
- Title: Optimized Information Flow for Transformer Tracking
- Title(参考訳): 変圧器追従のための最適情報流
- Authors: Janani Kugarajeevan, Thanikasalam Kokul, Amirthalingam Ramanan, Subha
Fernando
- Abstract要約: ワンストリームトランスフォーマートラッカーは、挑戦的なベンチマークデータセットで優れたパフォーマンスを示している。
トラッカーの識別能力を高めるための新しいOIFTrackフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.7199733380797579
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One-stream Transformer trackers have shown outstanding performance in
challenging benchmark datasets over the last three years, as they enable
interaction between the target template and search region tokens to extract
target-oriented features with mutual guidance. Previous approaches allow free
bidirectional information flow between template and search tokens without
investigating their influence on the tracker's discriminative capability. In
this study, we conducted a detailed study on the information flow of the tokens
and based on the findings, we propose a novel Optimized Information Flow
Tracking (OIFTrack) framework to enhance the discriminative capability of the
tracker. The proposed OIFTrack blocks the interaction from all search tokens to
target template tokens in early encoder layers, as the large number of
non-target tokens in the search region diminishes the importance of
target-specific features. In the deeper encoder layers of the proposed tracker,
search tokens are partitioned into target search tokens and non-target search
tokens, allowing bidirectional flow from target search tokens to template
tokens to capture the appearance changes of the target. In addition, since the
proposed tracker incorporates dynamic background cues, distractor objects are
successfully avoided by capturing the surrounding information of the target.
The OIFTrack demonstrated outstanding performance in challenging benchmarks,
particularly excelling in the one-shot tracking benchmark GOT-10k, achieving an
average overlap of 74.6\%. The code, models, and results of this work are
available at \url{https://github.com/JananiKugaa/OIFTrack}
- Abstract(参考訳): ワンストリームトランスフォーマートラッカーは、ターゲットテンプレートと検索領域トークン間のインタラクションにより、相互誘導でターゲット指向の機能を抽出できるため、過去3年間で、挑戦的なベンチマークデータセットにおいて優れたパフォーマンスを示している。
以前のアプローチでは、テンプレートと検索トークン間の自由双方向情報フローが、トラッカーの識別能力に影響を与えることなく可能であった。
本研究では,トークンの情報フローに関する詳細な研究を行い,その結果に基づいて,トラッカの識別能力を向上させるための新しい最適化情報フロートラッキング(oiftrack)フレームワークを提案する。
提案したOIFTrackは,検索領域内の多数の非ターゲットトークンがターゲット固有の特徴の重要性を低下させるため,初期エンコーダ層における全ての検索トークンからターゲットテンプレートトークンへのインタラクションをブロックする。
提案するトラッカーのより深いエンコーダ層では,探索トークンをターゲット探索トークンと非ターゲット探索トークンに分割し,ターゲット探索トークンからテンプレートトークンへの双方向フローにより,ターゲットの外観変化をキャプチャする。
また,提案トラッカーには動的背景手がかりが組み込まれているため,対象の周辺情報を捕捉することで,障害対象の回避に成功している。
OIFTrackは、特に一発追跡ベンチマークのGOT-10kで優れた性能を発揮し、平均74.6\%のオーバーラップを達成した。
この作業のコード、モデル、結果は \url{https://github.com/jananikugaa/oiftrack} で入手できる。
関連論文リスト
- Multi-object Tracking by Detection and Query: an efficient end-to-end manner [23.926668750263488]
従来の検出によるトラッキングと、クエリによる新たなトラッキングだ。
本稿では,学習可能なアソシエータによって達成されるトラッキング・バイ・検出・クエリーのパラダイムを提案する。
トラッキング・バイ・クエリーモデルと比較すると、LAIDは特に訓練効率の高い競合追跡精度を達成している。
論文 参考訳(メタデータ) (2024-11-09T14:38:08Z) - RTracker: Recoverable Tracking via PN Tree Structured Memory [71.05904715104411]
本稿では,木構造メモリを用いてトラッカーと検出器を動的に関連付け,自己回復を可能にするRTrackerを提案する。
具体的には,正負と負のターゲットサンプルを時系列に保存し,維持する正負のツリー構造メモリを提案する。
我々の中核となる考え方は、正と負の目標カテゴリーの支持サンプルを用いて、目標損失の信頼性評価のための相対的距離に基づく基準を確立することである。
論文 参考訳(メタデータ) (2024-03-28T08:54:40Z) - Single-Shot and Multi-Shot Feature Learning for Multi-Object Tracking [55.13878429987136]
そこで本研究では,異なる目標に対して,単発と複数発の特徴を共同で学習するための,シンプルで効果的な2段階特徴学習パラダイムを提案する。
提案手法は,DanceTrackデータセットの最先端性能を達成しつつ,MOT17およびMOT20データセットの大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-11-17T08:17:49Z) - Target-Aware Tracking with Long-term Context Attention [8.20858704675519]
長期的コンテキストアテンション(LCA)モジュールは、長期的フレームからターゲットとそのコンテキストについて広範な情報融合を行うことができる。
LCAは、類似したオブジェクトや複雑な背景の干渉を排除するために、以前のフレームからターゲット状態を使用する。
トラッカーは, 71.1%のAUC, 89.3%のNP, 73.0%のAOをLaSOT, TrackingNet, GOT-10kで実現した。
論文 参考訳(メタデータ) (2023-02-27T14:40:58Z) - Joint Feature Learning and Relation Modeling for Tracking: A One-Stream
Framework [76.70603443624012]
特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。
このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。
OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文 参考訳(メタデータ) (2022-03-22T18:37:11Z) - Learning Dynamic Compact Memory Embedding for Deformable Visual Object
Tracking [82.34356879078955]
本稿では,セグメント化に基づく変形可能な視覚追跡手法の識別を強化するために,コンパクトなメモリ埋め込みを提案する。
DAVIS 2017ベンチマークでは,D3SやSiamMaskなどのセグメンテーションベースのトラッカーよりも優れている。
論文 参考訳(メタデータ) (2021-11-23T03:07:12Z) - Coarse-to-Fine Object Tracking Using Deep Features and Correlation
Filters [2.3526458707956643]
本稿では,新しいディープラーニング追跡アルゴリズムを提案する。
対象の翻訳を大まかに推定するために,深層特徴の一般化能力を利用する。
そして,相関フィルタの識別力を利用して追跡対象を正確に局所化する。
論文 参考訳(メタデータ) (2020-12-23T16:43:21Z) - Graph Attention Tracking [76.19829750144564]
汎用オブジェクト追跡のための簡易な目標認識型シームズグラフアテンションネットワークを提案する。
GOT-10k、UAV123、TB-100、LaSOTといった挑戦的なベンチマークの実験は、提案されたSiamGATが最先端のトラッカーよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-23T04:26:45Z) - Tracking-by-Counting: Using Network Flows on Crowd Density Maps for
Tracking Multiple Targets [96.98888948518815]
State-of-the-art multi-object tracking(MOT)法は、トラッキング・バイ・検出のパラダイムに従っている。
混み合ったシーンに適したMOTパラダイムであるトラッキング・バイ・カウントを提案する。
論文 参考訳(メタデータ) (2020-07-18T19:51:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。