論文の概要: Updatable Siamese Tracker with Two-stage One-shot Learning
- arxiv url: http://arxiv.org/abs/2104.15049v1
- Date: Fri, 30 Apr 2021 15:18:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 15:25:52.177356
- Title: Updatable Siamese Tracker with Two-stage One-shot Learning
- Title(参考訳): 2段階ワンショット学習によるアップダブル・シームズ・トラッカー
- Authors: Xinglong Sun, Guangliang Han, Lihong Guo, Tingfa Xu, Jianan Li, Peixun
Liu
- Abstract要約: オフラインSiameseネットワークは、特に精度と効率で、非常に有望な追跡性能を達成しました。
従来の更新器では、オブジェクトの不規則なバリエーションの処理やノイズのサンプリングが難しいため、siameseネットワークの更新にそれらを採用するのは極めて危険である。
本論文では, 対象試料を多段階から抽出し, 一次分類器の局所パラメータを予測できる2段階のワンショット学習者を提案する。
次に,オンライン更新を補完できる学習者(SiamTOL)に基づいて,更新可能なSiameseネットワークを提案する。
- 参考スコア(独自算出の注目度): 10.13621503834501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Offline Siamese networks have achieved very promising tracking performance,
especially in accuracy and efficiency. However, they often fail to track an
object in complex scenes due to the incapacity in online update. Traditional
updaters are difficult to process the irregular variations and sampling noises
of objects, so it is quite risky to adopt them to update Siamese networks. In
this paper, we first present a two-stage one-shot learner, which can predict
the local parameters of primary classifier with object samples from diverse
stages. Then, an updatable Siamese network is proposed based on the learner
(SiamTOL), which is able to complement online update by itself. Concretely, we
introduce an extra inputting branch to sequentially capture the latest object
features, and design a residual module to update the initial exemplar using
these features. Besides, an effective multi-aspect training loss is designed
for our network to avoid overfit. Extensive experimental results on several
popular benchmarks including OTB100, VOT2018, VOT2019, LaSOT, UAV123 and GOT10k
manifest that the proposed tracker achieves the leading performance and
outperforms other state-of-the-art methods
- Abstract(参考訳): オフラインのシームズネットワークは、特に精度と効率において、非常に有望な追跡性能を達成した。
しかし、オンラインアップデートが不十分なため、複雑なシーンでオブジェクトを追跡できないことが多い。
従来の更新器では、オブジェクトの不規則なバリエーションの処理やノイズのサンプリングが難しいため、siameseネットワークの更新にそれらを採用するのは極めて危険である。
本稿では,まず,多種多様なステージから対象サンプルを抽出した一次分類器の局所パラメータを予測可能な,二段階一発学習器を提案する。
次に,オンライン更新を補完できる学習者(SiamTOL)に基づいて,更新可能なSiameseネットワークを提案する。
具体的には、最新のオブジェクト特徴を逐次キャプチャするための追加入力ブランチを導入し、これらの特徴を使って初期例を更新するための残余モジュールを設計する。
さらに,ネットワークの過度な適合を回避するために,効果的なマルチアスペクトトレーニング損失を設計する。
OTB100, VOT2018, VOT2019, LaSOT, UAV123, GOT10k などの人気ベンチマークの大規模な実験結果から,提案したトラッカーが先行性能を達成し, その他の最先端手法よりも優れた結果が得られた。
関連論文リスト
- Intra-task Mutual Attention based Vision Transformer for Few-Shot Learning [12.5354658533836]
人間は、ほんのわずかの例に晒された後に、新しい、目に見えない画像を正確に分類する能力を持っている。
人工ニューラルネットワークモデルでは、限られたサンプルを持つ2つのイメージを区別する最も関連性の高い特徴を決定することが課題である。
本稿では,サポートとクエリサンプルをパッチに分割するタスク内相互注意手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T02:02:57Z) - Correlation-Embedded Transformer Tracking: A Single-Branch Framework [69.0798277313574]
本稿では,トランスにインスパイアされた新しい単一ブランチ追跡フレームワークを提案する。
Siameseのような特徴抽出とは異なり、トラッカーは機能ネットワークの複数の層にクロスイメージ特徴相関を深く埋め込む。
出力機能は、追加の相関ステップなしでターゲット位置を予測するために直接使用できる。
論文 参考訳(メタデータ) (2024-01-23T13:20:57Z) - Improving Siamese Based Trackers with Light or No Training through Multiple Templates and Temporal Network [0.0]
我々は,シームズをベースとしたトラッカーに2つのアイデアを持つフレームワークを提案する。
i) ネットワークの再トレーニングの必要性を取り除く方法で、テンプレートの数を拡張すること。
(II) 地域情報とグローバル情報の両方に焦点をあてた新しいアーキテクチャを持つ軽量時間ネットワーク。
論文 参考訳(メタデータ) (2022-11-24T22:07:33Z) - Self-Promoted Supervision for Few-Shot Transformer [178.52948452353834]
SUN(Self-promoted sUpervisioN)は視覚変換器(ViT)のための数発の学習フレームワークである
SUNは、数ショットの学習データセットでViTを事前トレーニングし、各パッチトークンを導くために、個別のロケーション固有の監視を生成する。
実験によると、ViTを使ったSUNは、ViTを使った他の数発の学習フレームワークを大幅に上回っており、CNNの最先端技術よりも高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-03-14T12:53:27Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z) - Self-Supervised Learning for Binary Networks by Joint Classifier
Training [11.612308609123566]
本稿では,バイナリネットワークのための自己教師付き学習手法を提案する。
バイナリネットワークのより良いトレーニングのために,特徴類似性損失,損失項の動的バランススキーム,マルチステージトレーニングの修正を提案する。
実証実験により、BSSLは、下流タスクにおけるバイナリネットワークの自己教師付き学習ベースラインよりも優れ、特定のタスクにおける教師付き事前学習よりも優れています。
論文 参考訳(メタデータ) (2021-10-17T15:38:39Z) - Incremental Embedding Learning via Zero-Shot Translation [65.94349068508863]
現在の最先端のインクリメンタル学習手法は、従来の分類ネットワークにおける破滅的な忘れ方問題に取り組む。
ゼロショット変換クラス増分法(ZSTCI)と呼ばれる新しい組込みネットワークのクラス増分法を提案する。
さらに、ZSTCIを既存の正規化ベースのインクリメンタル学習手法と組み合わせることで、組み込みネットワークの性能をより向上させることができる。
論文 参考訳(メタデータ) (2020-12-31T08:21:37Z) - Cascaded Regression Tracking: Towards Online Hard Distractor
Discrimination [202.2562153608092]
本稿では,2段階の逐次回帰トラッカーを提案する。
第1段階では, 容易に同定可能な負の候補を抽出する。
第2段階では、残留するあいまいな硬質試料をダブルチェックするために、離散サンプリングに基づくリッジ回帰を設計する。
論文 参考訳(メタデータ) (2020-06-18T07:48:01Z) - AFAT: Adaptive Failure-Aware Tracker for Robust Visual Object Tracking [46.82222972389531]
Siameseのアプローチは近年、ビジュアルオブジェクト追跡において有望なパフォーマンスを実現している。
Siameseパラダイムは、オンライントラッキングタスクをモデル化するためにワンショット学習を使用し、トラッキングプロセスにおけるオンライン適応を妨げる。
本稿では,コンボリューショナルモジュールとLSTMモジュールをベースとしたフェールアウェアシステムを提案する。
論文 参考訳(メタデータ) (2020-05-27T23:21:12Z) - Robust Visual Object Tracking with Two-Stream Residual Convolutional
Networks [62.836429958476735]
視覚追跡のための2ストリーム残差畳み込みネットワーク(TS-RCN)を提案する。
私たちのTS-RCNは、既存のディープラーニングベースのビジュアルトラッカーと統合することができます。
トラッキング性能をさらに向上するため、我々はResNeXtを特徴抽出バックボーンとして採用する。
論文 参考訳(メタデータ) (2020-05-13T19:05:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。