論文の概要: Deformable Siamese Attention Networks for Visual Object Tracking
- arxiv url: http://arxiv.org/abs/2004.06711v2
- Date: Wed, 24 Mar 2021 04:07:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-13 10:00:07.808911
- Title: Deformable Siamese Attention Networks for Visual Object Tracking
- Title(参考訳): 視覚物体追跡のための変形可能なシャムアテンションネットワーク
- Authors: Yuechen Yu, Yilei Xiong, Weilin Huang, Matthew R. Scott
- Abstract要約: 変形可能な自己アテンションと交差アテンションを計算できる新しいシームズアテンション機構を提案する。
VOT 2016と2018では、強いベースラインであるSiamRPN++ [24]を0.464->0.537、0.415->0.470 EAOで上回り、新しい最先端の結果が得られる。
- 参考スコア(独自算出の注目度): 38.33079226457768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Siamese-based trackers have achieved excellent performance on visual object
tracking. However, the target template is not updated online, and the features
of the target template and search image are computed independently in a Siamese
architecture. In this paper, we propose Deformable Siamese Attention Networks,
referred to as SiamAttn, by introducing a new Siamese attention mechanism that
computes deformable self-attention and cross-attention. The self attention
learns strong context information via spatial attention, and selectively
emphasizes interdependent channel-wise features with channel attention. The
cross-attention is capable of aggregating rich contextual inter-dependencies
between the target template and the search image, providing an implicit manner
to adaptively update the target template. In addition, we design a region
refinement module that computes depth-wise cross correlations between the
attentional features for more accurate tracking. We conduct experiments on six
benchmarks, where our method achieves new state of-the-art results,
outperforming the strong baseline, SiamRPN++ [24], by 0.464->0.537 and
0.415->0.470 EAO on VOT 2016 and 2018. Our code is available at:
https://github.com/msight-tech/research-siamattn.
- Abstract(参考訳): siameseベースのトラッカーは、ビジュアルオブジェクトトラッキングにおいて優れたパフォーマンスを達成している。
しかし、ターゲットテンプレートはオンラインでは更新されず、ターゲットテンプレートと検索画像の特徴は、シームズアーキテクチャで独立して計算される。
本稿では、変形可能な自己注意と交差注意を計算できる新しいシームズアテンション機構を導入することにより、変形可能なシームズアテンションネットワーク(SiamAttn)を提案する。
自己注意は、空間的注意を通して強い文脈情報を学習し、チャンネル注意を伴うチャンネル関係の特徴を選択的に強調する。
クロスアテンションは、ターゲットテンプレートと検索画像とのリッチなコンテキスト相互依存性を集約し、ターゲットテンプレートを適応的に更新する暗黙の方法を提供する。
さらに,より正確な追跡を行うために,注目特徴間の深度的相互相関を計算する領域改良モジュールを設計する。
我々は6つのベンチマークで実験を行い,本手法が新たな結果を得るとともに,強力なベースラインである siamrpn++ [24] を0.464->0.537 と 0.415->0.470 eao を vot 2016 と 2018 で上回った。
私たちのコードは、https://github.com/msight-tech/research-siamattn.comで利用可能です。
関連論文リスト
- Target-Aware Tracking with Long-term Context Attention [8.20858704675519]
長期的コンテキストアテンション(LCA)モジュールは、長期的フレームからターゲットとそのコンテキストについて広範な情報融合を行うことができる。
LCAは、類似したオブジェクトや複雑な背景の干渉を排除するために、以前のフレームからターゲット状態を使用する。
トラッカーは, 71.1%のAUC, 89.3%のNP, 73.0%のAOをLaSOT, TrackingNet, GOT-10kで実現した。
論文 参考訳(メタデータ) (2023-02-27T14:40:58Z) - 3D Siamese Transformer Network for Single Object Tracking on Point
Clouds [22.48888264770609]
シームズネットワークに基づくトラッカーは、テンプレートの点特徴と検索領域との間の相互相関学習として、3Dオブジェクト追跡を定式化する。
テンプレートと検索領域間の堅牢な相互相関を学習するために,Transformer を用いて 3D Siamese Transformer ネットワークを構築した。
本手法は,3次元物体追跡タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-25T09:08:30Z) - Correlation-Aware Deep Tracking [83.51092789908677]
本稿では,自己/横断的意図に着想を得た,新たなターゲット依存型特徴ネットワークを提案する。
我々のネットワークは機能ネットワークの複数の層にクロスイメージの特徴相関を深く埋め込んでいる。
我々のモデルは、豊富な未ペア画像に対して柔軟に事前訓練が可能であり、既存の手法よりも顕著に高速な収束をもたらす。
論文 参考訳(メタデータ) (2022-03-03T11:53:54Z) - Learning Target-aware Representation for Visual Tracking via Informative
Interactions [49.552877881662475]
トラッキングのための特徴表現のターゲット認識能力を改善するために,新しいバックボーンアーキテクチャを提案する。
提案したGIMモジュールとInBN機構は、CNNやTransformerなど、さまざまなバックボーンタイプに適用可能である。
論文 参考訳(メタデータ) (2022-01-07T16:22:27Z) - TrTr: Visual Tracking with Transformer [29.415900191169587]
トランスフォーマーエンコーダデコーダアーキテクチャと呼ばれる強力な注意メカニズムに基づく新しいトラッカーネットワークを提案する。
形状非依存アンカーに基づくターゲットのローカライズを行うトランスの出力を用いて,分類と回帰ヘッドを設計する。
本手法は最先端のアルゴリズムに好適に作用する。
論文 参考訳(メタデータ) (2021-05-09T02:32:28Z) - Online Multiple Object Tracking with Cross-Task Synergy [120.70085565030628]
位置予測と埋め込み結合の相乗効果を考慮した新しい統一モデルを提案する。
この2つのタスクは、時間認識対象の注意と注意の注意、およびアイデンティティ認識メモリ集約モデルによってリンクされる。
論文 参考訳(メタデータ) (2021-04-01T10:19:40Z) - Transformer Tracking [76.96796612225295]
相関は追跡分野において、特に人気のあるシャム系トラッカーにおいて重要な役割を果たす。
本研究は,注意のみを用いてテンプレートと検索領域を効果的に結合した,新しい注意型特徴融合ネットワークを提案する。
実験により、TransTは6つの挑戦的なデータセットで非常に有望な結果が得られます。
論文 参考訳(メタデータ) (2021-03-29T09:06:55Z) - Graph Attention Tracking [76.19829750144564]
汎用オブジェクト追跡のための簡易な目標認識型シームズグラフアテンションネットワークを提案する。
GOT-10k、UAV123、TB-100、LaSOTといった挑戦的なベンチマークの実験は、提案されたSiamGATが最先端のトラッカーよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-23T04:26:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。