論文の概要: T-SiamTPN: Temporal Siamese Transformer Pyramid Networks for Robust and Efficient UAV Tracking
- arxiv url: http://arxiv.org/abs/2509.12913v1
- Date: Tue, 16 Sep 2025 10:06:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.0232
- Title: T-SiamTPN: Temporal Siamese Transformer Pyramid Networks for Robust and Efficient UAV Tracking
- Title(参考訳): T-SiamTPN:ロバストかつ効率的なUAV追跡のためのテンポラルシーム変換器ピラミッドネットワーク
- Authors: Hojat Ardi, Amir Jahanshahi, Ali Diba,
- Abstract要約: T-SiamTPNは、時間的モデリングによってSiamTPNアーキテクチャを拡張した、時間的対応のSiameseトラッキングフレームワークである。
我々のアプローチは時間的特徴融合と注意に基づく相互作用を取り入れ、時間的一貫性を強化する。
ベースラインと比較して、T-SiamTPNは成功率を13.7%、精度を14.7%向上させる。
- 参考スコア(独自算出の注目度): 0.9412740745336458
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aerial object tracking remains a challenging task due to scale variations, dynamic backgrounds, clutter, and frequent occlusions. While most existing trackers emphasize spatial cues, they often overlook temporal dependencies, resulting in limited robustness in long-term tracking and under occlusion. Furthermore, correlation-based Siamese trackers are inherently constrained by the linear nature of correlation operations, making them ineffective against complex, non-linear appearance changes. To address these limitations, we introduce T-SiamTPN, a temporal-aware Siamese tracking framework that extends the SiamTPN architecture with explicit temporal modeling. Our approach incorporates temporal feature fusion and attention-based interactions, strengthening temporal consistency and enabling richer feature representations. These enhancements yield significant improvements over the baseline and achieve performance competitive with state-of-the-art trackers. Crucially, despite the added temporal modules, T-SiamTPN preserves computational efficiency. Deployed on the resource-constrained Jetson Nano, the tracker runs in real time at 7.1 FPS, demonstrating its suitability for real-world embedded applications without notable runtime overhead. Experimental results highlight substantial gains: compared to the baseline, T-SiamTPN improves success rate by 13.7% and precision by 14.7%. These findings underscore the importance of temporal modeling in Siamese tracking frameworks and establish T-SiamTPN as a strong and efficient solution for aerial object tracking. Code is available at: https://github.com/to/be/released
- Abstract(参考訳): 空中物体追跡は、スケールのバリエーション、動的背景、乱雑、頻繁な閉塞のため、依然として困難な課題である。
ほとんどの既存のトラッカーは空間的手がかりを強調するが、時間的依存関係を見落とし、長期追跡や閉塞下での頑健さが制限される。
さらに、相関に基づくシームズトラッカーは、本質的に相関演算の線形性によって制約され、複雑で非線形な外観変化に対して効果がない。
これらの制約に対処するため、時間的モデリングによりSiamTPNアーキテクチャを拡張した時空間対応のSiamese追跡フレームワークT-SiamTPNを導入する。
提案手法は時間的特徴融合と注意に基づく相互作用を取り入れ、時間的一貫性を強化し、よりリッチな特徴表現を可能にする。
これらの拡張はベースラインを大幅に改善し、最先端のトラッカーと競合するパフォーマンスを実現する。
重要なことに、T-SiamTPNは時間モジュールの追加にもかかわらず、計算効率を保っている。
リソース制約のあるJetson Nano上にデプロイされたこのトラッカーは、リアルタイムに7.1 FPSで動作する。
T-SiamTPNはベースラインに比べて13.7%、精度は14.7%向上した。
これらの知見は、シームズ追跡フレームワークにおける時間的モデリングの重要性を強調し、T-SiamTPNを航空物体追跡のための強力で効率的なソリューションとして確立する。
コードは、https://github.com/to/be/released.comで入手できる。
関連論文リスト
- PatchTraj: Unified Time-Frequency Representation Learning via Dynamic Patches for Trajectory Prediction [14.48846131633279]
軌道予測のための時間周波数ジョイントモデリングを統合した動的パッチベースのフレームワークを提案する。
具体的には、軌道を生の時間列と周波数成分に分解し、動的パッチ分割を用いてマルチスケールセグメンテーションを行う。
その結果、拡張された埋め込みは強力な表現力を示し、バニラアーキテクチャを使用した場合でも正確な予測を可能にする。
論文 参考訳(メタデータ) (2025-07-25T09:55:33Z) - What You Have is What You Track: Adaptive and Robust Multimodal Tracking [72.92244578461869]
本研究では,時間的に不完全なマルチモーダルデータを用いたトラッカー性能に関する総合的研究を行った。
我々のモデルは9つのベンチマークでSOTA性能を達成し、従来の完全性と欠落したモダリティ設定の両方で優れている。
論文 参考訳(メタデータ) (2025-07-08T11:40:21Z) - STAMImputer: Spatio-Temporal Attention MoE for Traffic Data Imputation [36.880711201508085]
既存のタイム・ツー・スペースのメソッドは、ブロック単位で欠落したデータシナリオの特徴を効果的に抽出することができないことが多い。
本稿では,トラフィックデータ計算のためのSTAMImputerという,専門家ネットワークの時空間注意混合方式を提案する。
その結果,STAMImputer は既存の SOTA 手法に比べて性能が大幅に向上した。
論文 参考訳(メタデータ) (2025-06-09T04:05:00Z) - Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.28335667655129]
複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文 参考訳(メタデータ) (2024-03-23T04:18:49Z) - Multi-step Temporal Modeling for UAV Tracking [14.687636301587045]
MT-Track(MT-Track)は,UAV追跡の効率化を目的とした,効率的な多段階時間モデリングフレームワークである。
我々はテンプレートと検索領域の特徴間の相互作用を動的に評価するユニークな時間相関モジュールを公表する。
トラッキングシーケンスにおける時間的知識をモデル化することにより,過去のフレームと現在のフレームの相関マップを洗練するための相互変換モジュールを提案する。
論文 参考訳(メタデータ) (2024-03-07T09:48:13Z) - ACTrack: Adding Spatio-Temporal Condition for Visual Object Tracking [0.5371337604556311]
視覚的物体追跡(VOT)において,物体の時間的関係を効果的にモデル化することが重要な課題である
既存の手法は外観に基づく類似性や長期関係モデリングによって追跡され、連続するフレーム間の時間的コンテキストは容易に見過ごされてしまう。
本稿では,大規模な記憶条件を持つ付加的前時間追跡フレームワークであるACTrackについて述べる。このフレームワークは,そのパラメータを凍結することにより,トレーニング済みバックボーンの品質と性能を保ち,トラッキングにおける時間関係をモデル化するためのトレーニング可能な軽量付加性ネットを作成する。
我々は空間的特徴と時間的順序の整合性を確保するための付加的なシアム畳み込みネットワークを設計する。
論文 参考訳(メタデータ) (2024-02-27T07:34:08Z) - Continuity-Discrimination Convolutional Neural Network for Visual Object
Tracking [150.51667609413312]
本稿では,視覚オブジェクト追跡のためのContinuity-Discrimination Convolutional Neural Network (CD-CNN) という新しいモデルを提案する。
この問題に対処するため、cd-cnnは時間的遅れの概念に基づいた時間的外観連続性をモデル化する。
不正確なターゲットの定位とドリフトを緩和するために,新しい概念 object-centroid を提案する。
論文 参考訳(メタデータ) (2021-04-18T06:35:03Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。