論文の概要: Multi-step Temporal Modeling for UAV Tracking
- arxiv url: http://arxiv.org/abs/2403.04363v1
- Date: Thu, 7 Mar 2024 09:48:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 14:21:18.005503
- Title: Multi-step Temporal Modeling for UAV Tracking
- Title(参考訳): UAV追跡のための多段階時間モデル
- Authors: Xiaoying Yuan, Tingfa Xu, Xincong Liu, Ying Wang, Haolin Qin, Yuqiang
Fang and Jianan Li
- Abstract要約: MT-Track(MT-Track)は,UAV追跡の効率化を目的とした,効率的な多段階時間モデリングフレームワークである。
我々はテンプレートと検索領域の特徴間の相互作用を動的に評価するユニークな時間相関モジュールを公表する。
トラッキングシーケンスにおける時間的知識をモデル化することにより,過去のフレームと現在のフレームの相関マップを洗練するための相互変換モジュールを提案する。
- 参考スコア(独自算出の注目度): 14.687636301587045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of unmanned aerial vehicle (UAV) tracking, Siamese-based
approaches have gained traction due to their optimal balance between efficiency
and precision. However, UAV scenarios often present challenges such as
insufficient sampling resolution, fast motion and small objects with limited
feature information. As a result, temporal context in UAV tracking tasks plays
a pivotal role in target location, overshadowing the target's precise features.
In this paper, we introduce MT-Track, a streamlined and efficient multi-step
temporal modeling framework designed to harness the temporal context from
historical frames for enhanced UAV tracking. This temporal integration occurs
in two steps: correlation map generation and correlation map refinement.
Specifically, we unveil a unique temporal correlation module that dynamically
assesses the interplay between the template and search region features. This
module leverages temporal information to refresh the template feature, yielding
a more precise correlation map. Subsequently, we propose a mutual transformer
module to refine the correlation maps of historical and current frames by
modeling the temporal knowledge in the tracking sequence. This method
significantly trims computational demands compared to the raw transformer. The
compact yet potent nature of our tracking framework ensures commendable
tracking outcomes, particularly in extended tracking scenarios.
- Abstract(参考訳): 無人航空機(UAV)の追跡の分野では、シームズをベースとしたアプローチは効率と精度の最適なバランスのために牽引力を高めている。
しかし、UAVシナリオはサンプリング解像度の不足、高速動作、限られた特徴情報を持つ小さな物体などの課題をしばしば提示する。
結果として、UAV追跡タスクの時間的コンテキストは、ターゲット位置において重要な役割を担い、ターゲットの正確な特徴を覆い隠す。
本稿では,歴史的フレームからの時間的コンテキストを利用してUAV追跡を向上する,効率的なマルチステップ時間モデリングフレームワークMT-Trackを紹介する。
この時間的統合は相関マップの生成と相関マップの洗練という2つのステップで起こる。
具体的には,テンプレートと検索領域間の相互作用を動的に評価するユニークな時間相関モジュールを提案する。
このモジュールは時間情報を利用してテンプレート機能をリフレッシュし、より正確な相関マップを生成する。
次に,追跡系列の時間的知識をモデル化し,歴史的フレームと現在のフレームの相関マップを洗練するための相互変換モジュールを提案する。
この手法は生の変圧器と比較して計算量を大幅に削減する。
トラッキングフレームワークのコンパクトで強力な性質は、特に拡張されたトラッキングシナリオにおいて、信頼性の高いトラッキング結果を保証する。
関連論文リスト
- STCMOT: Spatio-Temporal Cohesion Learning for UAV-Based Multiple Object Tracking [13.269416985959404]
無人航空機(UAV)ビデオにおける複数物体追跡(MOT)は、コンピュータビジョンにおける多様な用途において重要である。
時空間結合型多目的追跡フレームワーク(STCMOT)を提案する。
歴史的埋め込み機能を用いて,ReIDの表現と検出機能を逐次的にモデル化する。
我々のフレームワークはMOTAとIDF1メトリクスで新しい最先端のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2024-09-17T14:34:18Z) - DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - Autoregressive Queries for Adaptive Tracking with Spatio-TemporalTransformers [55.46413719810273]
リッチ時間情報は、視覚追跡における複雑なターゲットの出現に不可欠である。
提案手法は,6つの一般的な追跡ベンチマークにおいてトラッカーの性能を向上させる。
論文 参考訳(メタデータ) (2024-03-15T02:39:26Z) - ACTrack: Adding Spatio-Temporal Condition for Visual Object Tracking [0.5371337604556311]
視覚的物体追跡(VOT)において,物体の時間的関係を効果的にモデル化することが重要な課題である
既存の手法は外観に基づく類似性や長期関係モデリングによって追跡され、連続するフレーム間の時間的コンテキストは容易に見過ごされてしまう。
本稿では,大規模な記憶条件を持つ付加的前時間追跡フレームワークであるACTrackについて述べる。このフレームワークは,そのパラメータを凍結することにより,トレーニング済みバックボーンの品質と性能を保ち,トラッキングにおける時間関係をモデル化するためのトレーニング可能な軽量付加性ネットを作成する。
我々は空間的特徴と時間的順序の整合性を確保するための付加的なシアム畳み込みネットワークを設計する。
論文 参考訳(メタデータ) (2024-02-27T07:34:08Z) - ProContEXT: Exploring Progressive Context Transformer for Tracking [20.35886416084831]
既存のVisual Object Tracking (VOT)は、テンプレートとして第1フレームのターゲット領域のみを取る。
これにより、フレーム間のオブジェクトの外観の変化を考慮できないため、素早く変化し、混雑するシーンでトラッキングが必然的に失敗する。
私たちはプログレッシブコンテキストでフレームワークを改訂しました。
Transformer Tracker (ProContEXT) は空間的・時間的文脈を利用して物体の動きの軌跡を予測する。
論文 参考訳(メタデータ) (2022-10-27T14:47:19Z) - Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in
Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。
Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。
無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-18T03:48:58Z) - AiATrack: Attention in Attention for Transformer Visual Tracking [89.94386868729332]
トランスフォーマートラッカーは近年,注目機構が重要な役割を担っている,目覚ましい進歩を遂げている。
我々は,すべての相関ベクトル間のコンセンサスを求めることにより,適切な相関性を高め,誤相関を抑制する注意モジュール(AiA)を提案する。
我々のAiAモジュールは自己認識ブロックとクロスアテンションブロックの両方に容易に適用でき、視覚追跡のための特徴集約と情報伝達を容易にする。
論文 参考訳(メタデータ) (2022-07-20T00:44:03Z) - Joint Feature Learning and Relation Modeling for Tracking: A One-Stream
Framework [76.70603443624012]
特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。
このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。
OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文 参考訳(メタデータ) (2022-03-22T18:37:11Z) - DetectorNet: Transformer-enhanced Spatial Temporal Graph Neural Network
for Traffic Prediction [4.302265301004301]
高カバレッジの検出器は、経路計画や交通渋滞の回避において、道路利用者にとって直接的かつ遠回りの利点がある。
これらのデータを活用すると、動的時間的相関、道路条件の変化による動的空間的相関など、ユニークな課題が提示される。
本稿では,Transformer が拡張した DetectorNet を提案し,これらの課題に対処する。
論文 参考訳(メタデータ) (2021-10-19T03:47:38Z) - Forecast Network-Wide Traffic States for Multiple Steps Ahead: A Deep
Learning Approach Considering Dynamic Non-Local Spatial Correlation and
Non-Stationary Temporal Dependency [6.019104024723682]
本研究では,交通予測における2つの問題について検討する。(1)交通リンク間の動的・非局所的な空間的相関を捉え,(2)正確な複数ステップの予測を行うための時間依存性のダイナミクスをモデル化する。
本稿では,これらの問題に対処するため,時空間列列モデル(STSeq2Seq)というディープラーニングフレームワークを提案する。
このモデルは、時間的特徴を捉えるためにシーケンスからシーケンス(seq2seq)アーキテクチャに基づいて構築され、空間情報を集約するためのグラフ畳み込みに依存している。
論文 参考訳(メタデータ) (2020-04-06T03:40:56Z) - Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。
これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。
この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-02-21T05:00:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。