論文の概要: Pyramid Correlation based Deep Hough Voting for Visual Object Tracking
- arxiv url: http://arxiv.org/abs/2110.07994v1
- Date: Fri, 15 Oct 2021 10:37:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 22:13:59.720114
- Title: Pyramid Correlation based Deep Hough Voting for Visual Object Tracking
- Title(参考訳): 視覚物体追跡のためのピラミッド相関に基づくディープハフ投票
- Authors: Ying Wang and Tingfa Xu and Jianan Li and Shenwang Jiang and Junjie
Chen
- Abstract要約: 我々は、ピラミド相関に基づくDeep Hough Voting(PCDHV用ショート)という、投票に基づく分類専用追跡アルゴリズムを提案する。
具体的には、埋め込み特徴に微細な局所構造と大域的空間的文脈を持たせるために、ピラミド相関モジュールを革新的に構築する。
精巧に設計されたDeep Hough Votingモジュールがさらに引き継ぎ、ピクセルの長距離依存を隅々まで知覚する。
- 参考スコア(独自算出の注目度): 16.080776515556686
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most of the existing Siamese-based trackers treat tracking problem as a
parallel task of classification and regression. However, some studies show that
the sibling head structure could lead to suboptimal solutions during the
network training. Through experiments we find that, without regression, the
performance could be equally promising as long as we delicately design the
network to suit the training objective. We introduce a novel voting-based
classification-only tracking algorithm named Pyramid Correlation based Deep
Hough Voting (short for PCDHV), to jointly locate the top-left and bottom-right
corners of the target. Specifically we innovatively construct a Pyramid
Correlation module to equip the embedded feature with fine-grained local
structures and global spatial contexts; The elaborately designed Deep Hough
Voting module further take over, integrating long-range dependencies of pixels
to perceive corners; In addition, the prevalent discretization gap is simply
yet effectively alleviated by increasing the spatial resolution of the feature
maps while exploiting channel-space relationships. The algorithm is general,
robust and simple. We demonstrate the effectiveness of the module through a
series of ablation experiments. Without bells and whistles, our tracker
achieves better or comparable performance to the SOTA algorithms on three
challenging benchmarks (TrackingNet, GOT-10k and LaSOT) while running at a
real-time speed of 80 FPS. Codes and models will be released.
- Abstract(参考訳): 既存のシームズベースのトラッカーのほとんどは、追跡問題を分類と回帰の並列タスクとして扱う。
しかし、いくつかの研究は、兄弟姉妹の頭部構造がネットワークトレーニング中に最適でない解につながる可能性を示唆している。
実験を通じて、回帰がなければ、トレーニング目的に合うようにネットワークを微妙に設計する限り、パフォーマンスは同等に期待できることがわかった。
対象の左上隅と右下隅を共同で特定する, ピラミッド相関型ディープハフ投票(pcdhvの略)という, 新たな投票ベース分類専用追跡アルゴリズムを提案する。
具体的には,細粒度の局所構造と大域的空間的文脈を組み込んだピラミッド相関モジュールを革新的に構築し,さらに精巧に設計されたディープハフ投票モジュールを継承し,画素の長距離依存性を知覚コーナーに統合する。
アルゴリズムは汎用的で堅牢でシンプルである。
本モジュールの有効性を一連のアブレーション実験により実証する。
我々のトラッカーは、80FPSのリアルタイム速度で実行しながら、TrackingNet、GOT-10k、LaSOTの3つの挑戦的なベンチマークでSOTAアルゴリズムよりも優れた、あるいは同等のパフォーマンスを達成する。
コードとモデルがリリースされます。
関連論文リスト
- Hierarchical IoU Tracking based on Interval [21.555469501789577]
マルチオブジェクト追跡(MOT)は、フレーム間で与えられたクラスのすべてのターゲットを検出し、関連付けることを目的としている。
HITと呼ばれる階層型IoU追跡フレームワークを提案し、トラックレット間隔を先行として利用して階層型追跡を実現する。
提案手法は,MOT17,KITTI,DanceTrack,VisDroneの4つのデータセットに対して有望な性能を実現する。
論文 参考訳(メタデータ) (2024-06-19T07:03:18Z) - CBAGAN-RRT: Convolutional Block Attention Generative Adversarial Network
for Sampling-Based Path Planning [0.0]
本稿では,畳み込みブロック注意生成ネットワークを用いた新しい画像ベース学習アルゴリズム(CBAGAN-RRT)を提案する。
GANモデルから生成された経路の確率分布を用いて,RRTアルゴリズムのサンプリングプロセスを導出する。
我々は、citezhang 2021によって生成されたデータセット上で、我々のネットワークをトレーニングし、テストし、我々のアルゴリズムが過去の最先端アルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2023-05-13T20:06:53Z) - A Bayesian Detect to Track System for Robust Visual Object Tracking and
Semi-Supervised Model Learning [1.7268829007643391]
ニューラルネットワークの出力によってパラメータ化されたベイズ追跡・検出フレームワークにおける副次的問題について述べる。
本稿では,粒子フィルタを用いた物体状態推定のための近似サンプリングアルゴリズムを提案する。
粒子フィルタ推論アルゴリズムを用いて,間欠的なラベル付きフレーム上でのトラッキングネットワークの学習に半教師付き学習アルゴリズムを用いる。
論文 参考訳(メタデータ) (2022-05-05T00:18:57Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Coarse-to-Fine Object Tracking Using Deep Features and Correlation
Filters [2.3526458707956643]
本稿では,新しいディープラーニング追跡アルゴリズムを提案する。
対象の翻訳を大まかに推定するために,深層特徴の一般化能力を利用する。
そして,相関フィルタの識別力を利用して追跡対象を正確に局所化する。
論文 参考訳(メタデータ) (2020-12-23T16:43:21Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z) - Learning to Optimize Non-Rigid Tracking [54.94145312763044]
我々は、堅牢性を改善し、解法収束を高速化するために学習可能な最適化を採用する。
まず、CNNを通じてエンドツーエンドに学習された深い特徴にアライメントデータ項を統合することにより、追跡対象をアップグレードする。
次に,プレコンディショニング手法と学習手法のギャップを,プレコンディショナを生成するためにトレーニングされたConditionNetを導入することで埋める。
論文 参考訳(メタデータ) (2020-03-27T04:40:57Z) - Learning to Hash with Graph Neural Networks for Recommender Systems [103.82479899868191]
グラフ表現学習は、大規模に高品質な候補探索をサポートすることに多くの注目を集めている。
ユーザ・イテム相互作用ネットワークにおけるオブジェクトの埋め込みベクトルの学習の有効性にもかかわらず、連続的な埋め込み空間におけるユーザの好みを推測する計算コストは膨大である。
連続的かつ離散的なコードとを協調的に学習するための,単純かつ効果的な離散表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-04T06:59:56Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。