論文の概要: Multi-State Tracker: Enhancing Efficient Object Tracking via Multi-State Specialization and Interaction
- arxiv url: http://arxiv.org/abs/2508.11531v1
- Date: Fri, 15 Aug 2025 15:19:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:24.062884
- Title: Multi-State Tracker: Enhancing Efficient Object Tracking via Multi-State Specialization and Interaction
- Title(参考訳): マルチステートトラッカー:マルチステートスペシャライゼーションとインタラクションによる効率的なオブジェクトトラッキングの実現
- Authors: Shilei Wang, Gong Cheng, Pujian Lai, Dong Gao, Junwei Han,
- Abstract要約: マルチステートトラッカー(MST)は、過去の効率的なトラッカーを複数のデータセットで上回っている。
MSTは特徴抽出中に複数の段階で複数の状態表現を生成する。
計算では0.1GFLOP、パラメータでは0.66Mしか発生しない。
- 参考スコア(独自算出の注目度): 49.36913716757758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient trackers achieve faster runtime by reducing computational complexity and model parameters. However, this efficiency often compromises the expense of weakened feature representation capacity, thus limiting their ability to accurately capture target states using single-layer features. To overcome this limitation, we propose Multi-State Tracker (MST), which utilizes highly lightweight state-specific enhancement (SSE) to perform specialized enhancement on multi-state features produced by multi-state generation (MSG) and aggregates them in an interactive and adaptive manner using cross-state interaction (CSI). This design greatly enhances feature representation while incurring minimal computational overhead, leading to improved tracking robustness in complex environments. Specifically, the MSG generates multiple state representations at multiple stages during feature extraction, while SSE refines them to highlight target-specific features. The CSI module facilitates information exchange between these states and ensures the integration of complementary features. Notably, the introduced SSE and CSI modules adopt a highly lightweight hidden state adaptation-based state space duality (HSA-SSD) design, incurring only 0.1 GFLOPs in computation and 0.66 M in parameters. Experimental results demonstrate that MST outperforms all previous efficient trackers across multiple datasets, significantly improving tracking accuracy and robustness. In particular, it shows excellent runtime performance, with an AO score improvement of 4.5\% over the previous SOTA efficient tracker HCAT on the GOT-10K dataset. The code is available at https://github.com/wsumel/MST.
- Abstract(参考訳): 効率的なトラッカーは、計算複雑性とモデルパラメータを減らし、より高速なランタイムを実現する。
しかし、この効率性は、しばしば機能表現能力の低下のコストを損なうため、単一層機能を使用してターゲット状態を正確にキャプチャする能力が制限される。
この制限を克服するため,マルチステート・トラッカー (MST) を提案する。これは,マルチステート・ジェネレーション (MSG) が生成する多状態特徴を高度に拡張し,相互状態間相互作用 (CSI) を用いて対話的かつ適応的に集約する。
この設計は、計算オーバーヘッドを最小限に抑えながら、特徴表現を大幅に強化し、複雑な環境でのトラッキングの堅牢性を向上させる。
具体的には、MSGは特徴抽出中に複数のステージで複数の状態表現を生成し、SSEはターゲット固有の特徴を強調するためにそれらを洗練する。
CSIモジュールはこれらの状態間の情報交換を容易にし、補完的な特徴の統合を保証する。
特に、SSEとCSIモジュールは高度に軽量な隠れ状態適応ベースの状態空間双対性(HSA-SSD)設計を採用しており、計算で0.1GFLOP、パラメータで0.66Mしか得られない。
実験により、MSTは複数のデータセットにまたがる全ての効率的なトラッカーより優れており、トラッキング精度とロバスト性を大幅に向上していることが示された。
特に、GOT-10Kデータセット上の前のSOTA効率的なトラッカーHCATよりもAOスコアが4.5\%向上し、優れたランタイムパフォーマンスを示している。
コードはhttps://github.com/wsumel/MST.comで公開されている。
関連論文リスト
- Efficient Semantic Segmentation via Lightweight Multiple-Information Interaction Network [37.84039482457571]
リアルタイムセマンティックセグメンテーションのための軽量多情報インタラクションネットワーク(LMIINet)を提案する。
0.72Mのパラメータと11.74GのFLOPしか持たず、LMIINetは精度と効率のバランスを保っている。
論文 参考訳(メタデータ) (2024-10-03T05:45:24Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - SDSTrack: Self-Distillation Symmetric Adapter Learning for Multi-Modal Visual Object Tracking [19.50096632818305]
VOT(Multimodal Visual Object Tracking)は、その堅牢性により、最近大きな注目を集めている。
近年の研究では、事前訓練されたRGBベースのトラッカーをマルチモーダルデータに転送するために、プロンプトチューニングを利用している。
我々はSDSTrackと呼ばれる新しい対称マルチモーダルトラッキングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-24T04:15:50Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - RGBT Tracking via Multi-Adapter Network with Hierarchical Divergence
Loss [37.99375824040946]
本稿では,モダリティ共有型,モダリティ特化型,インスタンス認識型ターゲット表現学習を共同で行うための,新しいマルチアダプタネットワークを提案する。
2つのRGBT追跡ベンチマークデータセットの実験は、提案したトラッカーの優れた性能を示す。
論文 参考訳(メタデータ) (2020-11-14T01:50:46Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。