論文の概要: Higher Performance Visual Tracking with Dual-Modal Localization
- arxiv url: http://arxiv.org/abs/2103.10089v1
- Date: Thu, 18 Mar 2021 08:47:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 02:45:56.747178
- Title: Higher Performance Visual Tracking with Dual-Modal Localization
- Title(参考訳): Dual-Modal Localizationによる高性能ビジュアルトラッキング
- Authors: Jinghao Zhou, Bo Li, Lei Qiao, Peng Wang, Weihao Gan, Wei Wu, Junjie
Yan, Wanli Ouyang
- Abstract要約: Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
- 参考スコア(独自算出の注目度): 106.91097443275035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual Object Tracking (VOT) has synchronous needs for both robustness and
accuracy. While most existing works fail to operate simultaneously on both, we
investigate in this work the problem of conflicting performance between
accuracy and robustness. We first conduct a systematic comparison among
existing methods and analyze their restrictions in terms of accuracy and
robustness. Specifically, 4 formulations-offline classification (OFC), offline
regression (OFR), online classification (ONC), and online regression (ONR)-are
considered, categorized by the existence of online update and the types of
supervision signal. To account for the problem, we resort to the idea of
ensemble and propose a dual-modal framework for target localization, consisting
of robust localization suppressing distractors via ONR and the accurate
localization attending to the target center precisely via OFC. To yield a final
representation (i.e, bounding box), we propose a simple but effective score
voting strategy to involve adjacent predictions such that the final
representation does not commit to a single location. Operating beyond the
real-time demand, our proposed method is further validated on 8
datasets-VOT2018, VOT2019, OTB2015, NFS, UAV123, LaSOT, TrackingNet, and
GOT-10k, achieving state-of-the-art performance.
- Abstract(参考訳): Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
既存の作業の多くは同時に動作しないが,本研究では,精度と堅牢性の相反する性能の問題について検討する。
まず,既存の手法の系統的比較を行い,その制約を正確性と頑健性の観点から分析する。
具体的には、4つの定式化-オフライン分類(OFC)、オフライン回帰(OFR)、オンライン分類(ONC)、オンライン回帰(ONR)をオンライン更新と監視信号の種類によって分類する。
そこで,本研究では,onrによる発散を抑制するロバストな位置決めと,ofcを介するターゲットセンタへの正確な位置決めからなる,ターゲット位置決めのための2モードフレームワークを提案する。
最終的な表現(つまり境界ボックス)を得るために,最終的な表現が単一場所にコミットしないような隣接予測を含む,単純かつ効果的なスコア投票戦略を提案する。
VOT2018, VOT2019, OTB2015, NFS, UAV123, LaSOT, TrackingNet, GOT-10kの8つのデータセットに対して,提案手法をさらに検証し, 最先端性能を実現する。
関連論文リスト
- Locally Adaptive One-Class Classifier Fusion with Dynamic $\ell$p-Norm Constraints for Robust Anomaly Detection [17.93058599783703]
局所的なデータ特性に基づいて,融合重みを動的に調整するフレームワークを提案する。
本手法は,計算効率を大幅に向上させる内部点最適化手法を取り入れたものである。
計算効率を維持しながらローカルなデータパターンに適応できるフレームワークの能力は、リアルタイムアプリケーションに特に有用である。
論文 参考訳(メタデータ) (2024-11-10T09:57:13Z) - Logit Calibration and Feature Contrast for Robust Federated Learning on Non-IID Data [45.11652096723593]
Federated Learning(FL)は、エッジネットワークのデバイス上で協調的なモデルトレーニングを行うための、プライバシ保護のための分散フレームワークである。
本稿では,ローカルロジットアンダーラインキャリブレーションとグローバル機能アンダーラインコントラストを,ロジットと特徴の両方の観点から,バニラフェデレーション付き対人訓練プロセスに組み込んだFatCCを提案する。
論文 参考訳(メタデータ) (2024-04-10T06:35:25Z) - Robust Fully-Asynchronous Methods for Distributed Training over General Architecture [11.480605289411807]
分散機械学習問題における完全な同期は、レイテンシ、パッケージの損失、ストラグラーの存在のため、非効率であり、不可能である。
本稿では,R-FAST (Fully-Asynchronous Gradient Tracking Method) を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:36:40Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - Learning Localization-aware Target Confidence for Siamese Visual
Tracking [13.684278662495204]
我々はSiamLAと呼ばれる新しい追跡パラダイムを提案する。
このパラダイムの中では、単純だが効果的なローカライゼーション対応コンポーネントがいくつか導入されている。
当社のSiamLAは精度と効率の両面で最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2022-04-29T13:37:15Z) - Joint Feature Learning and Relation Modeling for Tracking: A One-Stream
Framework [76.70603443624012]
特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。
このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。
OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文 参考訳(メタデータ) (2022-03-22T18:37:11Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z) - Inter-class Discrepancy Alignment for Face Recognition [55.578063356210144]
IA(Inter-class DiscrepancyAlignment)という統合フレームワークを提案する。
IDA-DAOは、画像と隣人の相違を考慮した類似度スコアの整合に使用される。
IDA-SSEは、GANで生成された仮想候補画像を導入することで、説得力のあるクラス間隣人を提供できます。
論文 参考訳(メタデータ) (2021-03-02T08:20:08Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。