論文の概要: Real-Time Visual Object Tracking via Few-Shot Learning
- arxiv url: http://arxiv.org/abs/2103.10130v1
- Date: Thu, 18 Mar 2021 10:02:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 01:37:56.239120
- Title: Real-Time Visual Object Tracking via Few-Shot Learning
- Title(参考訳): Few-Shot Learningによるリアルタイムビジュアルオブジェクト追跡
- Authors: Jinghao Zhou, Bo Li, Peng Wang, Peixia Li, Weihao Gan, Wei Wu, Junjie
Yan, Wanli Ouyang
- Abstract要約: ビジュアルオブジェクト追跡(VOT)はFew-Shot Learning(FSL)の拡張タスクと見なすことができる。
適応速度を高速化しながら,多種多様のFSLアルゴリズムを適用可能な2段階のフレームワークを提案する。
VOT2018,OTB2015, NFS, UAV123, TrackingNet, GOT-10kの主要ベンチマークに関する実験を実施し,望ましいパフォーマンス向上とリアルタイム速度を示した。
- 参考スコア(独自算出の注目度): 107.39695680340877
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual Object Tracking (VOT) can be seen as an extended task of Few-Shot
Learning (FSL). While the concept of FSL is not new in tracking and has been
previously applied by prior works, most of them are tailored to fit specific
types of FSL algorithms and may sacrifice running speed. In this work, we
propose a generalized two-stage framework that is capable of employing a large
variety of FSL algorithms while presenting faster adaptation speed. The first
stage uses a Siamese Regional Proposal Network to efficiently propose the
potential candidates and the second stage reformulates the task of classifying
these candidates to a few-shot classification problem. Following such a
coarse-to-fine pipeline, the first stage proposes informative sparse samples
for the second stage, where a large variety of FSL algorithms can be conducted
more conveniently and efficiently. As substantiation of the second stage, we
systematically investigate several forms of optimization-based few-shot
learners from previous works with different objective functions, optimization
methods, or solution space. Beyond that, our framework also entails a direct
application of the majority of other FSL algorithms to visual tracking,
enabling mutual communication between researchers on these two topics.
Extensive experiments on the major benchmarks, VOT2018, OTB2015, NFS, UAV123,
TrackingNet, and GOT-10k are conducted, demonstrating a desirable performance
gain and a real-time speed.
- Abstract(参考訳): ビジュアルオブジェクト追跡(VOT)はFew-Shot Learning(FSL)の拡張タスクと見なすことができる。
FSLの概念はトラッキングにおいて新しいものではなく、以前は以前の研究で採用されていたが、その多くは特定の種類のFSLアルゴリズムに適合するように調整されており、実行速度を犠牲にする可能性がある。
本研究では,FSLアルゴリズムを多種多様なアルゴリズムで適用し,適応速度を高速化する一般化された2段階フレームワークを提案する。
第1段階はシームズ地域提案ネットワークを用いて潜在的候補を効率的に提案し、第2段階はこれらの候補を数発の分類問題に分類するタスクを再構築する。
このような粗いパイプラインに続いて、第1段では、様々なFSLアルゴリズムをより便利かつ効率的に行うことができる第2段の情報スパースサンプルを提案する。
第2段階の補足として, 目的関数, 最適化法, 解空間の異なる先行研究から, 最適化に基づく数発学習者の数形態を体系的に検討した。
さらに、このフレームワークは、他のほとんどのFSLアルゴリズムの視覚的追跡を直接適用し、これらの2つのトピックに関する研究者間の相互通信を可能にする。
主要なベンチマークであるVOT2018, OTB2015, NFS, UAV123, TrackingNet, GOT-10kに関する大規模な実験が行われ、望ましいパフォーマンス向上とリアルタイム速度が示されている。
関連論文リスト
- Less is More: Parameter-Efficient Selection of Intermediate Tasks for Transfer Learning [5.119396962985841]
中間的タスク伝達学習はモデル性能を大幅に向上させることができる。
12kのソース・ターゲット対を用いたNLPタスク転送性とタスク選択に関する最大の研究を行う。
事前の手法でESMを適用すると、それぞれ10と278の因子による実行時間とディスクスペースの使用量が減少する。
論文 参考訳(メタデータ) (2024-10-19T16:22:04Z) - Cross-Domain Pre-training with Language Models for Transferable Time Series Representations [32.8353465232791]
CrossTimeNetは、さまざまなドメインから転送可能な知識を学ぶための、新しいクロスドメインSSL学習フレームワークである。
CrossTimeNetの重要な特徴の1つは、新しく設計された時系列トークン化モジュールである。
我々は、様々な時系列分類領域にわたる実世界のシナリオにおいて広範な実験を行う。
論文 参考訳(メタデータ) (2024-03-19T02:32:47Z) - Rethinking Few-Shot Object Detection on a Multi-Domain Benchmark [28.818423712485504]
Multi-dOmain Few-Shot Object Detection (MoFSOD)ベンチマークは、幅広いドメインから10のデータセットで構成されている。
我々は、FSOD性能に対する凍結層、異なるアーキテクチャ、異なる事前学習データセットの影響を分析する。
論文 参考訳(メタデータ) (2022-07-22T16:13:22Z) - Sylph: A Hypernetwork Framework for Incremental Few-shot Object
Detection [8.492340530784697]
大量のデータを含む多くの基本カテゴリがメタトレーニングに利用できる場合、ファネチューンフリーのiFSDは極めて有効であることを示す。
我々はCOCOとLVISの両方でモデルをベンチマークし、LVISの長テールレアクラスで最大17%のAPを報告した。
論文 参考訳(メタデータ) (2022-03-25T20:39:00Z) - DATA: Domain-Aware and Task-Aware Pre-training [94.62676913928831]
我々は、自己教師付き学習(SSL)に特化した、シンプルで効果的なNASアプローチであるDataを提示する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションなど,下流タスクにおける計算コストの広い範囲にわたる有望な結果を実現する。
論文 参考訳(メタデータ) (2022-03-17T02:38:49Z) - A Strong Baseline for Semi-Supervised Incremental Few-Shot Learning [54.617688468341704]
少ないショット学習は、限られたトレーニングサンプルを持つ新しいクラスに一般化するモデルを学ぶことを目的としている。
本研究では,(1)信頼できない擬似ラベルによる基本クラスと新クラスのあいまいさを緩和する高度に設計されたメタトレーニングアルゴリズム,(2)ラベルの少ないデータとラベルなしデータを用いて基礎知識を保ちながら,新クラスの識別的特徴を学習するモデル適応機構を提案する。
論文 参考訳(メタデータ) (2021-10-21T13:25:52Z) - Efficient Nearest Neighbor Language Models [114.40866461741795]
非パラメトリックニューラルネットワークモデル(NLM)は、外部データストアを用いてテキストの予測分布を学習する。
比較性能を維持しながら、推論速度の最大6倍の高速化を実現する方法を示す。
論文 参考訳(メタデータ) (2021-09-09T12:32:28Z) - On Second-order Optimization Methods for Federated Learning [59.787198516188425]
フェデレート学習環境における局所的なステップを持つ2階分散手法の性能評価を行った。
本稿では,更新のための2階ローカル情報とグローバルライン検索を用いて,結果の局所的特異性に対処する新たな変種を提案する。
論文 参考訳(メタデータ) (2021-09-06T12:04:08Z) - TAFSSL: Task-Adaptive Feature Sub-Space Learning for few-shot
classification [50.358839666165764]
本稿では,タスク適応機能サブスペース学習(TAFSSL)により,Few-Shot Learningシナリオの性能を大幅に向上させることができることを示す。
具体的には、挑戦的な miniImageNet と tieredImageNet ベンチマークにおいて、TAFSSL はトランスダクティブおよび半教師付き FSL 設定の両方で現在の状態を改善することができることを示しています。
論文 参考訳(メタデータ) (2020-03-14T16:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。