論文の概要: Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box
Estimation
- arxiv url: http://arxiv.org/abs/2012.06815v2
- Date: Mon, 29 Mar 2021 03:53:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 05:17:15.690773
- Title: Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box
Estimation
- Title(参考訳): Alpha-Refine:精密バウンディングボックス推定によるトラッキング性能の向上
- Authors: Bin Yan, Xinyu Zhang, Dong Wang, Huchuan Lu, Xiaoyun Yang
- Abstract要約: この研究はAlpha-Refineと呼ばれる新しい、柔軟で正確な改良モジュールを提案する。
これにより、ベーストラッカーのボックス推定品質が大幅に向上する。
TrackingNet, LaSOT, GOT-10K, VOT 2020 ベンチマークの実験では,我々のアプローチがベーストラッカのパフォーマンスを大幅に改善し,遅延がほとんどなかった。
- 参考スコア(独自算出の注目度): 85.22775182688798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual object tracking aims to precisely estimate the bounding box for the
given target, which is a challenging problem due to factors such as deformation
and occlusion. Many recent trackers adopt the multiple-stage tracking strategy
to improve the quality of bounding box estimation. These methods first coarsely
locate the target and then refine the initial prediction in the following
stages. However, existing approaches still suffer from limited precision, and
the coupling of different stages severely restricts the method's
transferability. This work proposes a novel, flexible, and accurate refinement
module called Alpha-Refine (AR), which can significantly improve the base
trackers' box estimation quality. By exploring a series of design options, we
conclude that the key to successful refinement is extracting and maintaining
detailed spatial information as much as possible. Following this principle,
Alpha-Refine adopts a pixel-wise correlation, a corner prediction head, and an
auxiliary mask head as the core components. Comprehensive experiments on
TrackingNet, LaSOT, GOT-10K, and VOT2020 benchmarks with multiple base trackers
show that our approach significantly improves the base trackers' performance
with little extra latency. The proposed Alpha-Refine method leads to a series
of strengthened trackers, among which the ARSiamRPN (AR strengthened SiamRPNpp)
and the ARDiMP50 (ARstrengthened DiMP50) achieve good efficiency-precision
trade-off, while the ARDiMPsuper (AR strengthened DiMP-super) achieves very
competitive performance at a real-time speed. Code and pretrained models are
available at https://github.com/MasterBin-IIAU/AlphaRefine.
- Abstract(参考訳): 視覚的物体追跡は, 対象物に対する境界ボックスを正確に推定することを目的としており, 変形や閉塞などの要因により難しい問題である。
最近の多くのトラッカーは、境界ボックス推定の質を改善するために多段階追跡戦略を採用している。
これらの手法はまずターゲットを粗く見つけ、次に次の段階で初期予測を洗練させる。
しかし、既存のアプローチは依然として精度が限られており、異なる段階のカップリングはメソッドの転送可能性を大幅に制限する。
本研究は,alpha-refine(ar)と呼ばれる新しい,フレキシブルで高精度な改良モジュールを提案し,ベーストラッカのボックス推定品質を大幅に向上させる。
一連の設計オプションを検討することで、改良を成功させる鍵は、詳細な空間情報を可能な限り抽出し、維持することにあると結論づける。
この原理に従い、Alpha-Refineは画素ワイド相関、コーナー予測ヘッド、補助マスクヘッドをコアコンポーネントとして採用する。
複数のベーストラッカーを用いたTrackingNet, LaSOT, GOT-10K, VOT2020ベンチマークの総合的な実験により, 提案手法は低レイテンシでベーストラッカーの性能を著しく向上させることが示された。
提案手法は、ARSiamRPN(AR強化SiamRPNpp)とARDiMP50(AR強化DiMP50)が良好な効率・精度のトレードオフを実現する一方、AR強化DiMPsuper(AR強化DiMP-super)はリアルタイムの速度で非常に競争力のある性能を発揮する。
コードと事前訓練されたモデルはhttps://github.com/MasterBin-IIAU/AlphaRefine.comで入手できる。
関連論文リスト
- PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object Detection [14.396629790635474]
単一点教師付きオブジェクト指向オブジェクト検出が注目され、コミュニティ内で最初の進歩を遂げた。
本稿では,よりシンプルで高速で,より強力な手法であるPointOBB-v2を提案する。
論文 参考訳(メタデータ) (2024-10-10T17:59:56Z) - Dense Optical Tracking: Connecting the Dots [82.79642869586587]
DOTは、ビデオにおけるポイントトラッキングの問題を解決するための、新しくてシンプルで効率的な方法である。
OmniMotionのような高度な"ユニバーサルトラッカー"を上回り、CoTrackerのような最良のポイントトラッキングアルゴリズムと同等か、あるいはそれ以上の精度で、DOTが現在の光フロー技術よりもはるかに正確であることを示す。
論文 参考訳(メタデータ) (2023-12-01T18:59:59Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Lite-FPN for Keypoint-based Monocular 3D Object Detection [18.03406686769539]
keypointベースのモノクロ3dオブジェクト検出は、非常に進歩し、高い速度精度のトレードオフを達成した。
マルチスケール機能融合を実現する軽量機能ピラミッドネットワークLite-FPNを提案します。
提案手法は,高い精度とフレームレートを同時に達成する。
論文 参考訳(メタデータ) (2021-05-01T14:44:31Z) - Robust Long-Term Object Tracking via Improved Discriminative Model
Prediction [77.72450371348016]
本稿では,事前学習した短期トラッカーをベースとした,堅牢な長期追跡のための識別モデル予測手法を提案する。
提案手法は,最先端の長期トラッカーに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2020-08-11T14:31:11Z) - Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box
Estimation [87.53808756910452]
そこで我々は,Alpha-Refineと呼ばれる新しい,フレキシブルで高精度な改良モジュールを提案する。
正確なピクセルワイド相関層と空間認識の非局所層を利用して特徴を融合させ、バウンディングボックス、コーナー、マスクの3つの相補的な出力を予測する。
提案するAlpha-Refineモジュールは,DiMP,ATOM,SiamRPN++,RTMDNet,ECOの5つの有名かつ最先端のベーストラッカーに適用する。
論文 参考訳(メタデータ) (2020-07-04T07:02:25Z) - Learning to Optimize Non-Rigid Tracking [54.94145312763044]
我々は、堅牢性を改善し、解法収束を高速化するために学習可能な最適化を採用する。
まず、CNNを通じてエンドツーエンドに学習された深い特徴にアライメントデータ項を統合することにより、追跡対象をアップグレードする。
次に,プレコンディショニング手法と学習手法のギャップを,プレコンディショナを生成するためにトレーニングされたConditionNetを導入することで埋める。
論文 参考訳(メタデータ) (2020-03-27T04:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。