論文の概要: MixFormer: End-to-End Tracking with Iterative Mixed Attention
- arxiv url: http://arxiv.org/abs/2203.11082v1
- Date: Mon, 21 Mar 2022 16:04:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 20:04:55.127854
- Title: MixFormer: End-to-End Tracking with Iterative Mixed Attention
- Title(参考訳): MixFormer: 反復的混合注意によるエンドツーエンドトラッキング
- Authors: Yutao Cui, Jiang Cheng, Limin Wang and Gangshan Wu
- Abstract要約: 変換器上に構築されたMixFormerと呼ばれる,コンパクトなトラッキングフレームワークを提案する。
我々の中核となる設計は、注意操作の柔軟性を活用し、特徴抽出と目標情報の統合を同時に行うための混合注意モジュール(MAM)を提案することである。
私たちのMixFormerは、LaSOT、TrackingNet、VOT2020、GOT-10k、UAV123を含む5つのトラッキングベンチマークで、最先端のパフォーマンスを新たに設定しています。
- 参考スコア(独自算出の注目度): 47.37548708021754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tracking often uses a multi-stage pipeline of feature extraction, target
information integration, and bounding box estimation. To simplify this pipeline
and unify the process of feature extraction and target information integration,
we present a compact tracking framework, termed as {\em MixFormer}, built upon
transformers. Our core design is to utilize the flexibility of attention
operations, and propose a Mixed Attention Module (MAM) for simultaneous feature
extraction and target information integration. This synchronous modeling scheme
allows to extract target-specific discriminative features and perform extensive
communication between target and search area. Based on MAM, we build our
MixFormer tracking framework simply by stacking multiple MAMs with progressive
patch embedding and placing a localization head on top. In addition, to handle
multiple target templates during online tracking, we devise an asymmetric
attention scheme in MAM to reduce computational cost, and propose an effective
score prediction module to select high-quality templates. Our MixFormer sets a
new state-of-the-art performance on five tracking benchmarks, including LaSOT,
TrackingNet, VOT2020, GOT-10k, and UAV123. In particular, our MixFormer-L
achieves NP score of 79.9 on LaSOT, 88.9 on TrackingNet and EAO of 0.555 on
VOT2020. We also perform in-depth ablation studies to demonstrate the
effectiveness of simultaneous feature extraction and information integration.
Code and trained models are publicly available at
\href{https://github.com/MCG-NJU/MixFormer}{https://github.com/MCG-NJU/MixFormer}.
- Abstract(参考訳): トラッキングはしばしば、機能抽出、ターゲット情報の統合、バウンディングボックス推定の多段階パイプラインを使用する。
このパイプラインを単純化し、特徴抽出とターゲット情報統合のプロセスを統一するために、トランスフォーマー上に構築されたコンパクトな追跡フレームワークである {\em MixFormer}を提案する。
我々の中核となる設計は、注意操作の柔軟性を活用し、特徴抽出と目標情報の統合を同時に行うための混合注意モジュール(MAM)を提案することである。
この同期モデリング手法により、ターゲット固有の識別特徴を抽出し、ターゲットと検索領域間の広範な通信を行うことができる。
MAMをベースとしたMixFormerトラッキングフレームワークの構築には、プログレッシブパッチの埋め込みによる複数のMAMの積み重ねと、その上にローカライゼーションヘッドを配置すればよい。
さらに,オンライントラッキング中に複数の対象テンプレートを処理するために,mamにおける非対称注意スキームを考案し計算コストを低減し,高品質テンプレートを選択するための効果的なスコア予測モジュールを提案する。
当社のmixformerは,lasot,trackingnet,vot2020,got-10k,uav123の5つのトラッキングベンチマークで,最先端のパフォーマンスを新たに設定しています。
特に、MixFormer-LはLaSOTで79.9、TrackingNetで88.9、VOT2020で0.555のEAOを達成しています。
また,特徴抽出と情報統合の同時効果を示すため,深部アブレーション実験を行った。
コードとトレーニングされたモデルは、 \href{https://github.com/MCG-NJU/MixFormer}{https://github.com/MCG-NJU/MixFormer} で公開されている。
関連論文リスト
- Staged Depthwise Correlation and Feature Fusion for Siamese Object
Tracking [0.6827423171182154]
視覚的トラッキングのための特徴抽出をさらに最適化するために,DCFFNet という新たな段階的深度相関と特徴融合ネットワークを提案する。
シアムネットワークアーキテクチャに基づいてディープトラッカーを構築しており、複数の大規模データセットでゼロからトレーニングされたオフラインです。
OTB100,VOT2018,LaSOTなど,一般的なベンチマークにトラッカーを実装した。
論文 参考訳(メタデータ) (2023-10-15T06:04:42Z) - MixFormerV2: Efficient Fully Transformer Tracking [49.07428299165031]
トランスフォーマーベースのトラッカーは標準ベンチマークで高い精度を実現している。
しかし、その効率性は、GPUとCPUプラットフォームの両方での実践的なデプロイの障害であり続けている。
本稿では,EmphMixFormerV2と呼ばれるフルトランスフォーマートラッキングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-25T09:50:54Z) - MixFormer: End-to-End Tracking with Iterative Mixed Attention [47.78513247048846]
変換器上に構築されたMixFormerと呼ばれる,コンパクトなトラッキングフレームワークを提案する。
特徴抽出と目標情報統合を同時に行うための混合注意モジュール(MAM)を提案する。
私たちのMixFormerトラッカーは、7つのトラッキングベンチマークで最先端のパフォーマンスを設定しました。
論文 参考訳(メタデータ) (2023-02-06T14:38:09Z) - OST: Efficient One-stream Network for 3D Single Object Tracking in Point Clouds [6.661881950861012]
本稿では,従来のシームズネットワークで発生した相関操作を回避するために,インスタンスレベルのエンコーディングの強みを活かした新しい一ストリームネットワークを提案する。
提案手法は,クラス固有のトラッキングだけでなく,より少ない計算と高い効率でクラスに依存しないトラッキングを実現する。
論文 参考訳(メタデータ) (2022-10-16T12:31:59Z) - Joint Feature Learning and Relation Modeling for Tracking: A One-Stream
Framework [76.70603443624012]
特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。
このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。
OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文 参考訳(メタデータ) (2022-03-22T18:37:11Z) - Harnessing Hard Mixed Samples with Decoupled Regularizer [69.98746081734441]
Mixupは、決定境界を混合データで滑らかにすることで、ニューラルネットワークの一般化を改善する効率的なデータ拡張アプローチである。
本稿では,非結合型正規化器(Decoupled Mixup, DM)を用いた効率的な混合目標関数を提案する。
DMは、ミキシングの本来の滑らかさを損なうことなく、硬質混合試料を適応的に利用して識別特性をマイニングすることができる。
論文 参考訳(メタデータ) (2022-03-21T07:12:18Z) - Multiple target tracking with interaction using an MCMC MRF Particle
Filter [0.0]
本稿では,マルチターゲット追跡手法の実装について述べる。
提案手法では,Markov Chain Monte Carlo (MCMC) サンプリングステップを用いてフィルタの評価を行い,新しいサンプルを生成するための効率的な提案密度を構築する。
MRFを用いた標的相互作用のモデル化手法は, 独立性, 相互作用を意識しない粒子フィルタによる追従誤差の多くを精度良く補正できることが示されている。
論文 参考訳(メタデータ) (2021-11-25T17:32:50Z) - Transformer Tracking [76.96796612225295]
相関は追跡分野において、特に人気のあるシャム系トラッカーにおいて重要な役割を果たす。
本研究は,注意のみを用いてテンプレートと検索領域を効果的に結合した,新しい注意型特徴融合ネットワークを提案する。
実験により、TransTは6つの挑戦的なデータセットで非常に有望な結果が得られます。
論文 参考訳(メタデータ) (2021-03-29T09:06:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。