論文の概要: Learning Localization-aware Target Confidence for Siamese Visual
Tracking
- arxiv url: http://arxiv.org/abs/2204.14093v1
- Date: Fri, 29 Apr 2022 13:37:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-02 14:38:35.602172
- Title: Learning Localization-aware Target Confidence for Siamese Visual
Tracking
- Title(参考訳): siamese視覚追跡のための学習ローカライズ・アウェア・ターゲット信頼度
- Authors: Jiahao Nie, Han Wu, Zhiwei He, Yuxiang Yang, Mingyu Gao, Zhekang Dong
- Abstract要約: 我々はSiamLAと呼ばれる新しい追跡パラダイムを提案する。
このパラダイムの中では、単純だが効果的なローカライゼーション対応コンポーネントがいくつか導入されている。
当社のSiamLAは精度と効率の両面で最先端のパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 13.684278662495204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Siamese tracking paradigm has achieved great success, providing effective
appearance discrimination and size estimation by the classification and
regression. While such a paradigm typically optimizes the classification and
regression independently, leading to task misalignment (accurate prediction
boxes have no high target confidence scores). In this paper, to alleviate this
misalignment, we propose a novel tracking paradigm, called SiamLA. Within this
paradigm, a series of simple, yet effective localization-aware components are
introduced, to generate localization-aware target confidence scores.
Specifically, with the proposed localization-aware dynamic label (LADL) loss
and localization-aware label smoothing (LALS) strategy, collaborative
optimization between the classification and regression is achieved, enabling
classification scores to be aware of location state, not just appearance
similarity. Besides, we propose a separate localization branch, centered on a
localization-aware feature aggregation (LAFA) module, to produce location
quality scores to further modify the classification scores. Consequently, the
resulting target confidence scores, are more discriminative for the location
state, allowing accurate prediction boxes tend to be predicted as high scores.
Extensive experiments are conducted on six challenging benchmarks, including
GOT-10k, TrackingNet, LaSOT, TNL2K, OTB100 and VOT2018. Our SiamLA achieves
state-of-the-art performance in terms of both accuracy and efficiency.
Furthermore, a stability analysis reveals that our tracking paradigm is
relatively stable, implying the paradigm is potential to real-world
applications.
- Abstract(参考訳): シームズ追跡のパラダイムは大きな成功をおさめ、分類と回帰による効果的な外見の識別とサイズ推定を提供する。
このようなパラダイムは一般的に分類と回帰を独立に最適化するが、タスクのミスアライメントにつながる(正確な予測ボックスには高い目標の信頼性スコアがない)。
本稿では,このミスアライメントを軽減するために,SiamLAと呼ばれる新しいトラッキングパラダイムを提案する。
このパラダイムでは、ローカライズ・アウェアの信頼度スコアを生成するために、シンプルで効果的なローカライズ・アウェアコンポーネントが導入されている。
具体的には,LADL(Localization-Aware dynamic label)の損失とLALS(Localization-Aware label smoothing)の戦略により,分類と回帰の協調的な最適化を実現し,分類スコアが外観的類似性だけでなく位置状態を認識することを可能にする。
さらに,LAFA(Localization-Aware Feature aggregate)モジュールを中心に,位置品質スコアを生成して分類スコアを更に修正する,別のローカライゼーションブランチを提案する。
したがって、結果の目標信頼度スコアは、位置状態に対してより識別され、正確な予測ボックスを高いスコアとして予測する傾向にある。
GOT-10k、TrackingNet、LaSOT、TNL2K、TB100、VOT2018を含む6つの挑戦的なベンチマークで大規模な実験が行われた。
当社のSiamLAは精度と効率の両面で最先端のパフォーマンスを実現しています。
さらに,我々の追跡パラダイムは比較的安定しており,本パラダイムが現実の応用の可能性を示している。
関連論文リスト
- Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Adaptive Global-Local Representation Learning and Selection for
Cross-Domain Facial Expression Recognition [54.334773598942775]
ドメインシフトは、クロスドメイン顔表情認識(CD-FER)において重要な課題となる
適応的グローバルローカル表現学習・選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-20T02:21:41Z) - Density Matters: Improved Core-set for Active Domain Adaptive
Segmentation [35.58476357071544]
セマンティックセグメンテーションにおいて、高価なアノテーションコストとトレーニングされたモデルのパフォーマンスをバランスさせるソリューションとして、アクティブドメイン適応が登場した。
本研究では,古典的コアセット法の理論的境界を再検討し,その性能が選択したサンプルの局所分布と密接な関係があることを確かめる。
動的マスク付き畳み込みを用いた局所的プロキシ推定器を導入し,境界値の最適化のための密度認識グレディアルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-15T08:22:36Z) - Chaos to Order: A Label Propagation Perspective on Source-Free Domain
Adaptation [8.27771856472078]
我々は、ソースフリードメイン適応(SFDA)のための新しいアプローチであるChaos to Order(CtO)を提示する。
CtOは、セマンティックな信頼性を制約し、ターゲットのサブポピュレーション間でラベル情報を伝達する。
実証的な証拠は、CtOが3つの公開ベンチマークで芸術の状態を上回っていることを示している。
論文 参考訳(メタデータ) (2023-01-20T03:39:35Z) - Ranking-Based Siamese Visual Tracking [31.2428211299895]
シームズベースのトラッカーは、主に視覚追跡を2つの独立したサブタスクに定式化し、分類とローカライゼーションを含む。
本稿では,異なる提案間の関係を探索するランキングベース最適化アルゴリズムを提案する。
提案された2つのランキングの損失は、ほとんどのシームズトラッカーと互換性があり、推論のための追加計算は発生しない。
論文 参考訳(メタデータ) (2022-05-24T03:46:40Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z) - Generalized Focal Loss: Learning Qualified and Distributed Bounding
Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。
1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。
本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文 参考訳(メタデータ) (2020-06-08T07:24:33Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。