論文の概要: Multi-Template Temporal Siamese Network for Long-Term Object Tracking
- arxiv url: http://arxiv.org/abs/2211.13812v1
- Date: Thu, 24 Nov 2022 22:07:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 16:55:46.592277
- Title: Multi-Template Temporal Siamese Network for Long-Term Object Tracking
- Title(参考訳): 長期物体追跡のためのマルチテンプレート時空間ネットワーク
- Authors: Ali Sekhavati and Won-Sook Lee
- Abstract要約: シームズネットワークベースのトラッカーは、第1フレームをオブジェクトの真理として使用し、次のフレームでターゲットの外観が著しく変化するとフェールする。
両問題を解くための2つの考えを提案する。
このトラッカーは、成功率を15%の大差で向上させることで、長期追跡データセットUAV20Lの最先端性能を達成する。
- 参考スコア(独自算出の注目度): 0.6853165736531939
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Siamese Networks are one of most popular visual object tracking methods for
their high speed and high accuracy tracking ability as long as the target is
well identified. However, most Siamese Network based trackers use the first
frame as the ground truth of an object and fail when target appearance changes
significantly in next frames. They also have dif iculty distinguishing the
target from similar other objects in the frame. We propose two ideas to solve
both problems. The first idea is using a bag of dynamic templates, containing
diverse, similar, and recent target features and continuously updating it with
diverse target appearances. The other idea is to let a network learn the path
history and project a potential future target location in a next frame. This
tracker achieves state-of-the-art performance on the long-term tracking dataset
UAV20L by improving the success rate by a large margin of 15% (65.4 vs 56.6)
compared to the state-of-the-art method, HiFT. The of icial python code of this
paper is publicly available.
- Abstract(参考訳): Siamese Networksは、ターゲットがよく特定される限り、その高速かつ高精度なトラッキング能力のために最も人気のあるビジュアルオブジェクト追跡手法の1つである。
しかし、ほとんどのシームズネットワークベースのトラッカーは、第1フレームをオブジェクトの真理として使用し、次のフレームでターゲットの外観が著しく変化すると失敗する。
それらはまた、フレーム内の他の類似のオブジェクトとターゲットを区別する希薄な欠陥を持っている。
両問題を解くための2つの考えを提案する。
最初のアイデアは動的テンプレートの袋を使い、多様な、類似した、そして最近のターゲット機能を含み、多様なターゲットの外観で継続的に更新する。
もう1つのアイデアは、ネットワークがパス履歴を学習し、次のフレームで将来のターゲットの位置を予測できるようにすることだ。
長期追跡データセットUAV20Lにおける最先端性能は、最先端手法HiFTと比較して、成功率を15%(65.4対56.6)大きく向上させることにより達成する。
この論文のicial pythonコードは、公開されている。
関連論文リスト
- BEVTrack: A Simple and Strong Baseline for 3D Single Object Tracking in
Bird's-Eye View [59.283604507093116]
3Dシングルオブジェクトトラッキング(SOT)はコンピュータビジョンの基本課題であり、自律運転のようなアプリケーションに不可欠なことを証明している。
我々は,Bird's-Eye View(BEV)におけるトラッキングを行う,シンプルだが効果的なベースラインであるBEVTrackを提案する。
3つの大規模データセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-09-05T12:42:26Z) - Motion-to-Matching: A Mixed Paradigm for 3D Single Object Tracking [27.805298263103495]
本稿では,モーションモデリングと特徴マッチングを組み合わせたMTM-Trackerを提案する。
第1段階では、連続した履歴ボックスを先行動作として利用し、ターゲットの粗い位置を特定するエンコーダ・デコーダ構造を提案する。
第2段階では、連続する点雲から動きを認識する特徴を抽出し、それらをマッチングして目標運動を洗練させる特徴相互作用モジュールを導入する。
論文 参考訳(メタデータ) (2023-08-23T02:40:51Z) - MBPTrack: Improving 3D Point Cloud Tracking with Memory Networks and Box
Priors [59.55870742072618]
3Dオブジェクトトラッキングは、自律運転など多くのアプリケーションにおいて、何十年にもわたって重要な問題となっている。
本稿では,過去の情報を活用するメモリ機構を採用したMBPTrackを提案する。
論文 参考訳(メタデータ) (2023-03-09T07:07:39Z) - Target-Aware Tracking with Long-term Context Attention [8.20858704675519]
長期的コンテキストアテンション(LCA)モジュールは、長期的フレームからターゲットとそのコンテキストについて広範な情報融合を行うことができる。
LCAは、類似したオブジェクトや複雑な背景の干渉を排除するために、以前のフレームからターゲット状態を使用する。
トラッカーは, 71.1%のAUC, 89.3%のNP, 73.0%のAOをLaSOT, TrackingNet, GOT-10kで実現した。
論文 参考訳(メタデータ) (2023-02-27T14:40:58Z) - Single Object Tracking through a Fast and Effective Single-Multiple
Model Convolutional Neural Network [0.0]
最近の最先端の(SOTA)アプローチは、エリア内の他のオブジェクトとターゲットを区別するために重い構造を持つマッチングネットワークを取ることに基づいて提案されています。
本稿では,これまでのアプローチとは対照的に,一つのショットで物体の位置を識別できる特殊なアーキテクチャを提案する。
提示されたトラッカーは、1080tiで最大120 fps$の超高速で、挑戦的な状況でsomaと比較してパフォーマンスする。
論文 参考訳(メタデータ) (2021-03-28T11:02:14Z) - Multiple Convolutional Features in Siamese Networks for Object Tracking [13.850110645060116]
Multiple Features-Siamese Tracker (MFST) は、ロバストな追跡のために複数の階層的な特徴マップを利用する新しい追跡アルゴリズムである。
MFSTは、オブジェクト追跡ベンチマークにおいて標準のサイメムトラッカーよりも高いトラッキング精度を達成する。
論文 参考訳(メタデータ) (2021-03-01T08:02:27Z) - MFST: Multi-Features Siamese Tracker [13.850110645060116]
Multi-Features Siamese Tracker (MFST) は、複数の階層的特徴マップを利用して、頑健な類似性追跡を行う新しい追跡アルゴリズムである。
MFSTは、標準的なシームズトラッカーを含む最先端のトラッカーよりも高いトラッキング精度を実現している。
論文 参考訳(メタデータ) (2021-03-01T07:18:32Z) - Graph Attention Tracking [76.19829750144564]
汎用オブジェクト追跡のための簡易な目標認識型シームズグラフアテンションネットワークを提案する。
GOT-10k、UAV123、TB-100、LaSOTといった挑戦的なベンチマークの実験は、提案されたSiamGATが最先端のトラッカーよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-23T04:26:45Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z) - Efficient Adversarial Attacks for Visual Object Tracking [73.43180372379594]
本稿では,新たなドリフト損失と組込み機能損失を併用して,シームズネットワークベースのトラッカーを攻撃するエンド・ツー・エンド・エンド・ネットワークFANを提案する。
単一のGPUの下では、FANはトレーニング速度が効率的で、強力な攻撃性能を持つ。
論文 参考訳(メタデータ) (2020-08-01T08:47:58Z) - TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。
ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。
我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文 参考訳(メタデータ) (2020-05-20T21:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。