論文の概要: Drift-Resilient Temporal Priors for Visual Tracking
- arxiv url: http://arxiv.org/abs/2604.02654v1
- Date: Fri, 03 Apr 2026 02:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.287625
- Title: Drift-Resilient Temporal Priors for Visual Tracking
- Title(参考訳): 視線追跡のためのドリフト弾性時間優先法
- Authors: Yuqing Huang, Liting Lin, Weijun Zhuang, Zhenyu He, Xin Li,
- Abstract要約: 本稿では,既存のトラッカーにシームレスに統合してドリフトを抑制する軽量で汎用的なモジュールDTPTrackを紹介する。
本フレームワークは,(1)フレーム単位の信頼性スコアを過去の状態に割り当てることを学ぶテンポラル信頼性校正機構と,(2)この校正履歴を動的時間的先行のコンパクトなセットに合成して予測ガイダンスを提供するテンポラルガイダンス合成器(TGS)モジュールの2つのコアコンポーネントから構成される。
- 参考スコア(独自算出の注目度): 10.88021885061812
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Temporal information is crucial for visual tracking, but existing multi-frame trackers are vulnerable to model drift caused by naively aggregating noisy historical predictions. In this paper, we introduce DTPTrack, a lightweight and generalizable module designed to be seamlessly integrated into existing trackers to suppress drift. Our framework consists of two core components: (1) a Temporal Reliability Calibrator (TRC) mechanism that learns to assign a per-frame reliability score to historical states, filtering out noise while anchoring on the ground-truth template; and (2) a Temporal Guidance Synthesizer (TGS) module that synthesizes this calibrated history into a compact set of dynamic temporal priors to provide predictive guidance. To demonstrate its versatility, we integrate DTPTrack into three diverse tracking architectures--OSTrack, ODTrack, and LoRAT-and show consistent, significant performance gains across all baselines. Our best-performing model, built upon an extended LoRATv2 backbone, sets a new state-of-the-art on several benchmarks, achieving a 77.5% Success rate on LaSOT and an 80.3% AO on GOT-10k.
- Abstract(参考訳): 時間的情報は視覚的追跡には不可欠であるが、既存のマルチフレームトラッカーは、ノイズの多い歴史的予測によって引き起こされるモデルドリフトに対して脆弱である。
本稿では,既存のトラッカーにシームレスに統合してドリフトを抑制する軽量で一般化可能なモジュールDTPTrackを紹介する。
本フレームワークは,(1)フレーム単位の信頼性スコアを過去の状態に割り当てることを学ぶためのTRC機構と,(2)この校正された履歴を動的時間的優先順位のコンパクトなセットに合成し,予測ガイダンスを提供するTGSモジュールの2つのコアコンポーネントから構成される。
その汎用性を示すために、DTPTrackをOSTrack、ODTrack、LoRATの3つの多様なトラッキングアーキテクチャに統合し、すべてのベースラインで一貫した、重要なパフォーマンス向上を示す。
我々の最高のパフォーマンスモデルは、拡張されたLoRATv2バックボーン上に構築され、いくつかのベンチマークで新しい最先端の設定を行い、LaSOTでは77.5%の成功率、GOT-10kでは80.3%のAOを達成した。
関連論文リスト
- Exploring Reliable Spatiotemporal Dependencies for Efficient Visual Tracking [9.64398631601942]
STDTrackは、信頼性のある時間的依存関係を軽量トラッカーに統合する先駆的なフレームワークである。
本稿では,時間的プロパゲートトークンを導入し,フレーム単位の特徴抽出をガイドする。
異なるサイズのオブジェクトに動的に適応するマルチスケール予測ヘッドを開発した。
論文 参考訳(メタデータ) (2026-01-14T02:22:05Z) - SwiTrack: Tri-State Switch for Cross-Modal Object Tracking [74.15663758681849]
クロスモーダルオブジェクトトラッキング(CMOT)は、ビデオストリームが異なるモード間で切り替える間、ターゲットの一貫性を維持する新しいタスクである。
SwiTrackは3つの特別なストリームを配置することでCMOTを再定義する新しいステートスイッチングフレームワークである。
論文 参考訳(メタデータ) (2025-11-20T10:52:54Z) - LiDAR MOT-DETR: A LiDAR-based Two-Stage Transformer for 3D Multiple Object Tracking [4.65812324892521]
ライダーをベースとした2段式DETRインバータ,スムーズかつトラッカーを提案する。
よりスムーズなステージは、移動中の時間窓を越えて、市販の検出器からライダー物体の検出を洗練させる。
トラッカーステージはDETRベースのアテンションブロックを使用して、トラックされたオブジェクトと、ポイントクラウドをコンテキストとして洗練された検出とを関連付けることで、トラックを時間にわたって維持する。
論文 参考訳(メタデータ) (2025-05-19T06:25:48Z) - Online Dense Point Tracking with Streaming Memory [54.22820729477756]
デンスポイントトラッキングは、ビデオのかなりの部分を通して、初期フレーム内のすべてのポイントの連続的な追跡を必要とする、困難なタスクである。
最近の点追跡アルゴリズムは、通常、最初のフレームから現在のフレームへの間接的な情報伝達のためにスライドウィンドウに依存する。
我々は、高密度のtextbfPOint textbfTracking とオンラインビデオ処理のための textbfStreaming メモリを備えた軽量で高速なモデルを提案する。
論文 参考訳(メタデータ) (2025-03-09T06:16:49Z) - Autoregressive Queries for Adaptive Tracking with Spatio-TemporalTransformers [55.46413719810273]
リッチ時間情報は、視覚追跡における複雑なターゲットの出現に不可欠である。
提案手法は,6つの一般的な追跡ベンチマークにおいてトラッカーの性能を向上させる。
論文 参考訳(メタデータ) (2024-03-15T02:39:26Z) - ACTrack: Adding Spatio-Temporal Condition for Visual Object Tracking [0.5371337604556311]
視覚的物体追跡(VOT)において,物体の時間的関係を効果的にモデル化することが重要な課題である
既存の手法は外観に基づく類似性や長期関係モデリングによって追跡され、連続するフレーム間の時間的コンテキストは容易に見過ごされてしまう。
本稿では,大規模な記憶条件を持つ付加的前時間追跡フレームワークであるACTrackについて述べる。このフレームワークは,そのパラメータを凍結することにより,トレーニング済みバックボーンの品質と性能を保ち,トラッキングにおける時間関係をモデル化するためのトレーニング可能な軽量付加性ネットを作成する。
我々は空間的特徴と時間的順序の整合性を確保するための付加的なシアム畳み込みネットワークを設計する。
論文 参考訳(メタデータ) (2024-02-27T07:34:08Z) - Joint Feature Learning and Relation Modeling for Tracking: A One-Stream
Framework [76.70603443624012]
特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。
このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。
OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文 参考訳(メタデータ) (2022-03-22T18:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。