論文の概要: Learning to Fuse Asymmetric Feature Maps in Siamese Trackers
- arxiv url: http://arxiv.org/abs/2012.02776v2
- Date: Wed, 31 Mar 2021 03:57:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 00:40:14.532970
- Title: Learning to Fuse Asymmetric Feature Maps in Siamese Trackers
- Title(参考訳): siamese trackersにおける非対称特徴マップの融合学習
- Authors: Wencheng Han, Xingping Dong, Fahad Shahbaz Khan, Ling Shao, Jianbing
Shen
- Abstract要約: 非対称畳み込み(ACM)は、大規模データのオフライントレーニングにおいて、意味的相関情報をよりよくキャプチャすることを学ぶ。
ACMは、バウンディングボックスサイズなどの有用な事前情報と、標準的な視覚的特徴を組み込むことができる。
提案手法は6つの追跡ベンチマークにおいて既存の手法よりも優れている。
- 参考スコア(独自算出の注目度): 169.00002561138737
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Siamese-based trackers have achieved promising performance in
visual tracking. Most recent Siamese-based trackers typically employ a
depth-wise cross-correlation (DW-XCorr) to obtain multi-channel correlation
information from the two feature maps (target and search region). However,
DW-XCorr has several limitations within Siamese-based tracking: it can easily
be fooled by distractors, has fewer activated channels, and provides weak
discrimination of object boundaries. Further, DW-XCorr is a handcrafted
parameter-free module and cannot fully benefit from offline learning on
large-scale data. We propose a learnable module, called the asymmetric
convolution (ACM), which learns to better capture the semantic correlation
information in offline training on large-scale data. Different from DW-XCorr
and its predecessor(XCorr), which regard a single feature map as the
convolution kernel, our ACM decomposes the convolution operation on a
concatenated feature map into two mathematically equivalent operations, thereby
avoiding the need for the feature maps to be of the same size (width and
height)during concatenation. Our ACM can incorporate useful prior information,
such as bounding-box size, with standard visual features. Furthermore, ACM can
easily be integrated into existing Siamese trackers based on DW-XCorror XCorr.
To demonstrate its generalization ability, we integrate ACM into three
representative trackers: SiamFC, SiamRPN++, and SiamBAN. Our experiments reveal
the benefits of the proposed ACM, which outperforms existing methods on six
tracking benchmarks. On the LaSOT test set, our ACM-based tracker obtains a
significant improvement of 5.8% in terms of success (AUC), over the baseline.
- Abstract(参考訳): siameseベースのトラッカーは最近、ビジュアルトラッキングで有望なパフォーマンスを達成している。
最近のシャム語ベースのトラッカーは、通常、深さ方向の相互相関(dw-xcorr)を使用して、2つの特徴地図(ターゲットと探索領域)からマルチチャネル相関情報を取得する。
しかし、DW-XCorrはシームズをベースとした追跡においていくつかの制限がある。
さらに、DW-XCorrは手作りのパラメータフリーモジュールであり、大規模なデータでのオフライン学習の恩恵を受けられない。
本研究では,非対称畳み込み (ACM) と呼ばれる学習可能なモジュールを提案する。
単一の特徴写像を畳み込みカーネルとみなすDW-XCorrとその前身(XCorr)とは異なり、我々のACMは連結化された特徴写像上の畳み込み操作を2つの数学的に等価な演算に分解する。
私たちのACMは、バウンディングボックスサイズなどの有用な事前情報を標準視覚機能に組み込むことができます。
さらに、ACMはDW-XCorror XCorrに基づいて既存のSiameseトラッカーに容易に統合できる。
一般化能力を示すために、ACMをSiamFC、SiamRPN++、SiamBANの3つの代表的なトラッカーに統合する。
提案手法は6つの追跡ベンチマークにおいて既存の手法よりも優れている。
lasotテストセットでは、acmベースのトラッカーはベースラインよりも成功率(auc)で5.8%の大幅な改善が得られます。
関連論文リスト
- Multi-object Tracking by Detection and Query: an efficient end-to-end manner [23.926668750263488]
従来の検出によるトラッキングと、クエリによる新たなトラッキングだ。
本稿では,学習可能なアソシエータによって達成されるトラッキング・バイ・検出・クエリーのパラダイムを提案する。
トラッキング・バイ・クエリーモデルと比較すると、LAIDは特に訓練効率の高い競合追跡精度を達成している。
論文 参考訳(メタデータ) (2024-11-09T14:38:08Z) - Cross-domain Learning Framework for Tracking Users in RIS-aided Multi-band ISAC Systems with Sparse Labeled Data [55.70071704247794]
統合センシング・通信(ISAC)は6G通信において重要であり、再構成可能なインテリジェントサーフェス(RIS)の急速な発展によって促進される
本稿では,複数の帯域にまたがるマルチモーダルCSIインジケータを協調的に活用し,クロスドメイン方式で追跡機能をモデル化するX2Trackフレームワークを提案する。
X2Trackの下では、トランスフォーマーニューラルネットワークと逆学習技術に基づいて、トラッキングエラーを最小限に抑える効率的なディープラーニングアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-05-10T08:04:27Z) - Backbone is All Your Need: A Simplified Architecture for Visual Object
Tracking [69.08903927311283]
既存のトラッキングアプローチはカスタマイズされたサブモジュールに依存しており、アーキテクチャの選択に事前知識が必要である。
本稿では,コンバータバックボーンを用いた簡易なトラッキングアーキテクチャ(SimTrack)を提案する。
我々のSimTrackは、LaSOT/TNL2Kで2.5%/2.6%のAUCゲインでベースラインを改善し、ベルやホイッスルのない他の特殊な追跡アルゴリズムと競合する結果を得る。
論文 参考訳(メタデータ) (2022-03-10T12:20:58Z) - TrTr: Visual Tracking with Transformer [29.415900191169587]
トランスフォーマーエンコーダデコーダアーキテクチャと呼ばれる強力な注意メカニズムに基づく新しいトラッカーネットワークを提案する。
形状非依存アンカーに基づくターゲットのローカライズを行うトランスの出力を用いて,分類と回帰ヘッドを設計する。
本手法は最先端のアルゴリズムに好適に作用する。
論文 参考訳(メタデータ) (2021-05-09T02:32:28Z) - Transformer Tracking [76.96796612225295]
相関は追跡分野において、特に人気のあるシャム系トラッカーにおいて重要な役割を果たす。
本研究は,注意のみを用いてテンプレートと検索領域を効果的に結合した,新しい注意型特徴融合ネットワークを提案する。
実験により、TransTは6つの挑戦的なデータセットで非常に有望な結果が得られます。
論文 参考訳(メタデータ) (2021-03-29T09:06:55Z) - Multiple Convolutional Features in Siamese Networks for Object Tracking [13.850110645060116]
Multiple Features-Siamese Tracker (MFST) は、ロバストな追跡のために複数の階層的な特徴マップを利用する新しい追跡アルゴリズムである。
MFSTは、オブジェクト追跡ベンチマークにおいて標準のサイメムトラッカーよりも高いトラッキング精度を達成する。
論文 参考訳(メタデータ) (2021-03-01T08:02:27Z) - MFST: Multi-Features Siamese Tracker [13.850110645060116]
Multi-Features Siamese Tracker (MFST) は、複数の階層的特徴マップを利用して、頑健な類似性追跡を行う新しい追跡アルゴリズムである。
MFSTは、標準的なシームズトラッカーを含む最先端のトラッカーよりも高いトラッキング精度を実現している。
論文 参考訳(メタデータ) (2021-03-01T07:18:32Z) - XCM: An Explainable Convolutional Neural Network for Multivariate Time
Series Classification [64.41621835517189]
MTS分類のためのeXplainable Convolutional Neural NetworkであるXCMを提案する。
XCMは、新しいコンパクト畳み込みニューラルネットワークであり、入力データから直接、観測された変数と時間に関する情報を抽出する。
最初に、XCMは、大小のパブリックUEAデータセットにおいて最先端のMSS分類器よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-10T11:55:53Z) - Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box
Estimation [87.53808756910452]
そこで我々は,Alpha-Refineと呼ばれる新しい,フレキシブルで高精度な改良モジュールを提案する。
正確なピクセルワイド相関層と空間認識の非局所層を利用して特徴を融合させ、バウンディングボックス、コーナー、マスクの3つの相補的な出力を予測する。
提案するAlpha-Refineモジュールは,DiMP,ATOM,SiamRPN++,RTMDNet,ECOの5つの有名かつ最先端のベーストラッカーに適用する。
論文 参考訳(メタデータ) (2020-07-04T07:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。