論文の概要: DASTSiam: Spatio-Temporal Fusion and Discriminative Augmentation for
Improved Siamese Tracking
- arxiv url: http://arxiv.org/abs/2301.09063v1
- Date: Sun, 22 Jan 2023 06:23:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 15:05:00.159154
- Title: DASTSiam: Spatio-Temporal Fusion and Discriminative Augmentation for
Improved Siamese Tracking
- Title(参考訳): DASTSiam:時空間核融合とシマーズ追跡改善のための差別化
- Authors: Yucheng Huang, Eksan Firkat, Ziwang Xiao, Jihong Zhu, Askar Hamdulla
- Abstract要約: DASTSiamと呼ばれる2つのトランスフォーマーベースのモジュールを導入し、紙時間(ST)融合モジュールと識別(DA)モジュールを提案する。
STモジュールは、オブジェクトの外観変化に対するロバスト性を改善するために、クロスアテンションに基づく歴史的手がかりの蓄積を使用する。
DAモジュールは、テンプレートと検索領域間の意味情報を関連付け、ターゲット識別を改善する。
- 参考スコア(独自算出の注目度): 6.985491314570374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking tasks based on deep neural networks have greatly improved with the
emergence of Siamese trackers. However, the appearance of targets often changes
during tracking, which can reduce the robustness of the tracker when facing
challenges such as aspect ratio change, occlusion, and scale variation. In
addition, cluttered backgrounds can lead to multiple high response points in
the response map, leading to incorrect target positioning. In this paper, we
introduce two transformer-based modules to improve Siamese tracking called
DASTSiam: the spatio-temporal (ST) fusion module and the Discriminative
Augmentation (DA) module. The ST module uses cross-attention based accumulation
of historical cues to improve robustness against object appearance changes,
while the DA module associates semantic information between the template and
search region to improve target discrimination. Moreover, Modifying the label
assignment of anchors also improves the reliability of the object location. Our
modules can be used with all Siamese trackers and show improved performance on
several public datasets through comparative and ablation experiments.
- Abstract(参考訳): ディープニューラルネットワークに基づくトラッキングタスクは、シャム追跡器の出現によって大幅に改善されている。
しかし、目標の出現はしばしば追跡中に変化し、アスペクト比の変化、オクルージョン、スケールの変動といった課題に直面した際にトラッカーの堅牢性が低下する。
さらに、乱れの背景は応答マップ内の複数の高い応答点につながり、誤ったターゲット位置付けにつながる。
本稿では、DASTSiamと呼ばれる2つのトランスフォーマーベースのモジュールを紹介し、時空間(ST)融合モジュールと識別拡張(DA)モジュールについて述べる。
stモジュールは、オブジェクトの出現変化に対するロバスト性を改善するために、クロス・アテンションに基づく歴史的手がかりの蓄積を使用し、daモジュールはテンプレートと検索領域の間のセマンティック情報を関連付け、ターゲットの識別を改善する。
さらに、アンカーのラベル割り当てを変更することで、オブジェクト位置の信頼性も向上する。
当社のモジュールは、すべてのsiameseトラッカで使用でき、比較およびアブレーション実験を通じて、いくつかのパブリックデータセットでパフォーマンスが向上しています。
関連論文リスト
- STCMOT: Spatio-Temporal Cohesion Learning for UAV-Based Multiple Object Tracking [13.269416985959404]
無人航空機(UAV)ビデオにおける複数物体追跡(MOT)は、コンピュータビジョンにおける多様な用途において重要である。
時空間結合型多目的追跡フレームワーク(STCMOT)を提案する。
歴史的埋め込み機能を用いて,ReIDの表現と検出機能を逐次的にモデル化する。
我々のフレームワークはMOTAとIDF1メトリクスで新しい最先端のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2024-09-17T14:34:18Z) - SiamTHN: Siamese Target Highlight Network for Visual Tracking [11.111738354621595]
シームズネットワークベースのトラッカーは、バックボーンネットワークによって生成された特徴マップ内の各チャネルを等しく扱う。
これらのトラッカーにおける分類と回帰分岐の間の構造的リンクはなく、2つの分岐はトレーニング中に個別に最適化される。
Target Highlight Moduleは、生成された類似性応答マップがターゲット領域にもっと焦点を合わせるのを助けるために提案されている。
論文 参考訳(メタデータ) (2023-03-22T04:33:02Z) - OST: Efficient One-stream Network for 3D Single Object Tracking in Point Clouds [6.661881950861012]
本稿では,従来のシームズネットワークで発生した相関操作を回避するために,インスタンスレベルのエンコーディングの強みを活かした新しい一ストリームネットワークを提案する。
提案手法は,クラス固有のトラッキングだけでなく,より少ない計算と高い効率でクラスに依存しないトラッキングを実現する。
論文 参考訳(メタデータ) (2022-10-16T12:31:59Z) - Context-aware Visual Tracking with Joint Meta-updating [11.226947525556813]
本稿では,シーケンス全体に沿った情報を活用することで,両ブランチを共同でメタ更新する,表現空間上のトラッカーを最適化するコンテキスト認識追跡モデルを提案する。
提案手法は,VOT2018におけるEAOスコアの0.514を40FPSの速度で達成し,基礎となるトラッカーの精度とロバスト性を向上できることを示す。
論文 参考訳(メタデータ) (2022-04-04T14:16:00Z) - Unsupervised Learning of Accurate Siamese Tracking [68.58171095173056]
分類枝と回帰枝の両方で時間対応を学習できる新しい教師なし追跡フレームワークを提案する。
トラッカーは、トラッカーネットやLaSOTのような大規模データセット上で、教師なしの手法と同等の性能を発揮する。
論文 参考訳(メタデータ) (2022-04-04T13:39:43Z) - Learning Target-aware Representation for Visual Tracking via Informative
Interactions [49.552877881662475]
トラッキングのための特徴表現のターゲット認識能力を改善するために,新しいバックボーンアーキテクチャを提案する。
提案したGIMモジュールとInBN機構は、CNNやTransformerなど、さまざまなバックボーンタイプに適用可能である。
論文 参考訳(メタデータ) (2022-01-07T16:22:27Z) - Learning Dynamic Compact Memory Embedding for Deformable Visual Object
Tracking [82.34356879078955]
本稿では,セグメント化に基づく変形可能な視覚追跡手法の識別を強化するために,コンパクトなメモリ埋め込みを提案する。
DAVIS 2017ベンチマークでは,D3SやSiamMaskなどのセグメンテーションベースのトラッカーよりも優れている。
論文 参考訳(メタデータ) (2021-11-23T03:07:12Z) - Online Multiple Object Tracking with Cross-Task Synergy [120.70085565030628]
位置予測と埋め込み結合の相乗効果を考慮した新しい統一モデルを提案する。
この2つのタスクは、時間認識対象の注意と注意の注意、およびアイデンティティ認識メモリ集約モデルによってリンクされる。
論文 参考訳(メタデータ) (2021-04-01T10:19:40Z) - Visual Tracking by TridentAlign and Context Embedding [71.60159881028432]
本稿では,Siamese ネットワークに基づく視覚的トラッキングのための新しい TridentAlign とコンテキスト埋め込みモジュールを提案する。
提案トラッカーの性能は最先端トラッカーに匹敵するが,提案トラッカーはリアルタイムに動作可能である。
論文 参考訳(メタデータ) (2020-07-14T08:00:26Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。