論文の概要: Multi-attention Associate Prediction Network for Visual Tracking
- arxiv url: http://arxiv.org/abs/2403.16395v1
- Date: Mon, 25 Mar 2024 03:18:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:07:18.781646
- Title: Multi-attention Associate Prediction Network for Visual Tracking
- Title(参考訳): 視覚追跡のためのマルチアテンションアソシエイト予測ネットワーク
- Authors: Xinglong Sun, Haijiang Sun, Shan Jiang, Jiacheng Wang, Xilai Wei, Zhonghe Hu,
- Abstract要約: 分類回帰予測ネットワークは、いくつかの現代のディープトラッカーにおいて驚くべき成功を収めている。
分類と回帰タスクには固有の違いがあるため、特徴マッチングの要求にも反対の要求がある。
上記の問題に対処するために,マルチアテンションアソシエイト予測ネットワーク(MAPNet)を提案する。
- 参考スコア(独自算出の注目度): 3.9628431811908533
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classification-regression prediction networks have realized impressive success in several modern deep trackers. However, there is an inherent difference between classification and regression tasks, so they have diverse even opposite demands for feature matching. Existed models always ignore the key issue and only employ a unified matching block in two task branches, decaying the decision quality. Besides, these models also struggle with decision misalignment situation. In this paper, we propose a multi-attention associate prediction network (MAPNet) to tackle the above problems. Concretely, two novel matchers, i.e., category-aware matcher and spatial-aware matcher, are first designed for feature comparison by integrating self, cross, channel or spatial attentions organically. They are capable of fully capturing the category-related semantics for classification and the local spatial contexts for regression, respectively. Then, we present a dual alignment module to enhance the correspondences between two branches, which is useful to find the optimal tracking solution. Finally, we describe a Siamese tracker built upon the proposed prediction network, which achieves the leading performance on five tracking benchmarks, consisting of LaSOT, TrackingNet, GOT-10k, TNL2k and UAV123, and surpasses other state-of-the-art approaches.
- Abstract(参考訳): 分類回帰予測ネットワークは、いくつかの現代のディープトラッカーにおいて驚くべき成功を収めている。
しかし、分類タスクと回帰タスクには固有の違いがあり、特徴マッチングに対する要求さえも様々である。
既存のモデルは、常に重要な問題を無視し、2つのタスクブランチで統一されたマッチングブロックのみを使用し、決定品質を低下させます。
さらに、これらのモデルは意思決定のミスアライメント状況にも苦戦している。
本稿では,上記の問題に対処するマルチアテンションアソシエイト予測ネットワーク(MAPNet)を提案する。
具体的には, まず, 自己, 横断, チャネル, 空間的注意を有機的に統合して特徴比較を行う。
分類のためのカテゴリ関連セマンティクスと回帰のための局所空間コンテキストをそれぞれ完全に捉えることができる。
次に,2つの分岐間の対応性を高めるための2つのアライメントモジュールを提案する。
最後に,提案した予測ネットワーク上に構築されたSiameseトラッカーについて述べる。LaSOT, TrackingNet, GOT-10k, TNL2k, UAV123 の5つのトラッキングベンチマークにおいて,他の最先端のアプローチを上回るパフォーマンスを実現する。
関連論文リスト
- SiamTHN: Siamese Target Highlight Network for Visual Tracking [11.111738354621595]
シームズネットワークベースのトラッカーは、バックボーンネットワークによって生成された特徴マップ内の各チャネルを等しく扱う。
これらのトラッカーにおける分類と回帰分岐の間の構造的リンクはなく、2つの分岐はトレーニング中に個別に最適化される。
Target Highlight Moduleは、生成された類似性応答マップがターゲット領域にもっと焦点を合わせるのを助けるために提案されている。
論文 参考訳(メタデータ) (2023-03-22T04:33:02Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - Correlation-Aware Deep Tracking [83.51092789908677]
本稿では,自己/横断的意図に着想を得た,新たなターゲット依存型特徴ネットワークを提案する。
我々のネットワークは機能ネットワークの複数の層にクロスイメージの特徴相関を深く埋め込んでいる。
我々のモデルは、豊富な未ペア画像に対して柔軟に事前訓練が可能であり、既存の手法よりも顕著に高速な収束をもたらす。
論文 参考訳(メタデータ) (2022-03-03T11:53:54Z) - Online Multiple Object Tracking with Cross-Task Synergy [120.70085565030628]
位置予測と埋め込み結合の相乗効果を考慮した新しい統一モデルを提案する。
この2つのタスクは、時間認識対象の注意と注意の注意、およびアイデンティティ認識メモリ集約モデルによってリンクされる。
論文 参考訳(メタデータ) (2021-04-01T10:19:40Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - Multiple Convolutional Features in Siamese Networks for Object Tracking [13.850110645060116]
Multiple Features-Siamese Tracker (MFST) は、ロバストな追跡のために複数の階層的な特徴マップを利用する新しい追跡アルゴリズムである。
MFSTは、オブジェクト追跡ベンチマークにおいて標準のサイメムトラッカーよりも高いトラッキング精度を達成する。
論文 参考訳(メタデータ) (2021-03-01T08:02:27Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z) - Graph Attention Tracking [76.19829750144564]
汎用オブジェクト追跡のための簡易な目標認識型シームズグラフアテンションネットワークを提案する。
GOT-10k、UAV123、TB-100、LaSOTといった挑戦的なベンチマークの実験は、提案されたSiamGATが最先端のトラッカーよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-23T04:26:45Z) - Rethinking the competition between detection and ReID in Multi-Object
Tracking [44.59367033562385]
検出と識別の埋め込みを共同で学習するワンショットモデルは、マルチオブジェクトトラッキング(MOT)において大きな注目を集めている。
本稿では,タスク依存表現をよりよく学習するために,自己関係と相互関係を持つ新しい相互ネットワーク(REN)を提案する。
また,ID埋め込みの関連性を改善するために,意味レベルのミスアライメントを防止するスケールアウェア・アテンション・ネットワーク(SAAN)を導入する。
論文 参考訳(メタデータ) (2020-10-23T02:44:59Z) - MOTS: Multiple Object Tracking for General Categories Based On Few-Shot
Method [38.009864162410615]
MOTSと呼ばれる新しいマルチターゲットトラッキングシステムは、メトリクスに基づいているが、特定のカテゴリを追跡するには限られていない。
新たに構築されたTRACK-REIDデータセットにより、Fine-match Networkは31のカテゴリターゲットのマッチングを実行でき、さらには見当たらないカテゴリに一般化することもできる。
論文 参考訳(メタデータ) (2020-05-19T02:18:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。