論文の概要: Improving Accuracy and Generalization for Efficient Visual Tracking
- arxiv url: http://arxiv.org/abs/2411.18855v1
- Date: Thu, 28 Nov 2024 01:51:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:21:22.767609
- Title: Improving Accuracy and Generalization for Efficient Visual Tracking
- Title(参考訳): 効率的な視覚追跡のための精度向上と一般化
- Authors: Ram Zaveri, Shivang Patel, Yu Gu, Gianfranco Doretto,
- Abstract要約: 我々は,OODシークエンスにおいてもトラッキング性能を大幅に向上させる,高効率なSiameseトラッカーであるSiamABCを紹介する。
SiamABCは、ターゲットの動的変動を橋渡しする新しいアーキテクチャ設計と、トレーニングにおける新たな損失を生かしている。
- 参考スコア(独自算出の注目度): 5.438003462888859
- License:
- Abstract: Efficient visual trackers overfit to their training distributions and lack generalization abilities, resulting in them performing well on their respective in-distribution (ID) test sets and not as well on out-of-distribution (OOD) sequences, imposing limitations to their deployment in-the-wild under constrained resources. We introduce SiamABC, a highly efficient Siamese tracker that significantly improves tracking performance, even on OOD sequences. SiamABC takes advantage of new architectural designs in the way it bridges the dynamic variability of the target, and of new losses for training. Also, it directly addresses OOD tracking generalization by including a fast backward-free dynamic test-time adaptation method that continuously adapts the model according to the dynamic visual changes of the target. Our extensive experiments suggest that SiamABC shows remarkable performance gains in OOD sets while maintaining accurate performance on the ID benchmarks. SiamABC outperforms MixFormerV2-S by 7.6\% on the OOD AVisT benchmark while being 3x faster (100 FPS) on a CPU.
- Abstract(参考訳): 効率的なビジュアルトラッカーはトレーニング分布に過度に適合し、一般化能力が欠如しているため、それぞれのインディストリビューション(ID)テストセットではうまく機能し、アウト・オブ・ディストリビューション(OOD)シーケンスでは機能せず、制約されたリソース下でのデプロイメントに制限が課される。
我々は,OODシークエンスにおいてもトラッキング性能を大幅に向上させる,高効率なSiameseトラッカーであるSiamABCを紹介する。
SiamABCは、ターゲットの動的変動を橋渡しする新しいアーキテクチャ設計と、トレーニングにおける新たな損失を生かしている。
また、ターゲットの動的視覚的変化に応じてモデルを連続的に適応する高速な後方自由な動的テスト時間適応法を含めることで、OODトラッキングの一般化に直接対処する。
大規模な実験により,SamABC は OOD セットの精度を保ちながら,OOD セットにおいて顕著な性能向上を示した。
SiamABCはOOD AVisTベンチマークでMixFormerV2-Sを7.6 %上回り、CPUでは3倍高速(100 FPS)である。
関連論文リスト
- CRoFT: Robust Fine-Tuning with Concurrent Optimization for OOD Generalization and Open-Set OOD Detection [42.33618249731874]
トレーニングデータにおけるエネルギースコアの最大化は、ドメイン一貫性のあるヘッセンの分類損失につながることを示す。
我々は,両タスクの同時最適化を可能にする統合された微調整フレームワークを開発した。
論文 参考訳(メタデータ) (2024-05-26T03:28:59Z) - How to train your ViT for OOD Detection [36.56346240815833]
VisionTransformerは、ImageNetスケール設定のための強力なアウト・オブ・ディストリビューション検出器である。
プレトレーニングとファインタニングの両方がViTの性能に与える影響について検討する。
論文 参考訳(メタデータ) (2024-05-21T08:36:30Z) - On the Robustness of Open-World Test-Time Training: Self-Training with
Dynamic Prototype Expansion [46.30241353155658]
ディープラーニングモデルを低レイテンシで未知のターゲット領域分布に一般化することは、テスト時間トレーニング/適応(TTT/TTA)の研究を動機付けている。
多くの最先端手法は、ターゲットドメインが強いアウト・オブ・ディストリビューション(OOD)データで汚染されると性能を維持することができない。
我々は,自己学習型TTT法の有効性を向上させる適応型強力なOODプルーニングを開発した。
我々は,分散アライメントによる自己学習を正規化し,その組み合わせにより,OWTTTベンチマークの最先端性能が得られる。
論文 参考訳(メタデータ) (2023-08-19T08:27:48Z) - Re-Evaluating LiDAR Scene Flow for Autonomous Driving [80.37947791534985]
自己教師型LiDARシーンフローの一般的なベンチマークは、動的動き、非現実的な対応、非現実的なサンプリングパターンの非現実的な速度を持つ。
実世界のデータセットのスイート上で,トップメソッドのスイートを評価する。
学習に重点を置いているにもかかわらず、ほとんどのパフォーマンス向上は前処理と後処理のステップによって引き起こされる。
論文 参考訳(メタデータ) (2023-04-04T22:45:50Z) - AUTO: Adaptive Outlier Optimization for Online Test-Time OOD Detection [81.49353397201887]
オープンソースアプリケーションに機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
我々は、未ラベルのオンラインデータをテスト時に直接利用してOOD検出性能を向上させる、テスト時OOD検出と呼ばれる新しいパラダイムを導入する。
本稿では,入出力フィルタ,IDメモリバンク,意味的に一貫性のある目的からなる適応外乱最適化(AUTO)を提案する。
論文 参考訳(メタデータ) (2023-03-22T02:28:54Z) - Effective Robustness against Natural Distribution Shifts for Models with
Different Training Data [113.21868839569]
効果的ロバスト性」は、分配内(ID)性能から予測できる以上の余分な分配外ロバスト性を測定する。
異なるデータに基づいてトレーニングされたモデルの有効ロバスト性を評価・比較するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-02-02T19:28:41Z) - Adaptive Siamese Tracking with a Compact Latent Network [219.38172719948048]
追跡タスクを分類に変換することで,シームズをベースとしたトラッカーを簡易化する直感的なビューを提供する。
そこで本研究では,視覚シミュレーションと実追跡例を用いて,詳細な解析を行う。
そこで我々は,古典的なSiamRPN++,SiamFC,SiamBANの3つのトラッカーを調整した。
論文 参考訳(メタデータ) (2023-02-02T08:06:02Z) - Improving Out-of-Distribution Generalization by Adversarial Training
with Structured Priors [17.936426699670864]
サンプルワイド・アドバイザリ・トレーニング (AT) では, アウト・オブ・ディストリビューション (OOD) の一般化が限定的に改善されていることを示す。
OOD-robustモデルのトレーニングのために,低ランク構造をもつ2つのAT変種を提案する。
提案手法は,経験的リスク最小化(ERM)とサンプルワイドATより優れている。
論文 参考訳(メタデータ) (2022-10-13T07:37:42Z) - Efficient Few-Shot Object Detection via Knowledge Inheritance [62.36414544915032]
Few-shot Object Detection (FSOD) は、未確認のタスクに少ないトレーニングサンプルで適応できるジェネリック検出器を学習することを目的としている。
計算量の増加を伴わない効率的なプレトレイン・トランスファー・フレームワーク(PTF)のベースラインを提案する。
また,予測された新しいウェイトと事前訓練されたベースウェイトとのベクトル長の不整合を軽減するために,適応長再スケーリング(ALR)戦略を提案する。
論文 参考訳(メタデータ) (2022-03-23T06:24:31Z) - Siamese Box Adaptive Network for Visual Tracking [100.46025199664642]
我々は、シンプルで効果的な視覚追跡フレームワーク(Siamese Box Adaptive Network, SiamBAN)を提案する。
SiamBANは直接オブジェクトを分類し、その境界ボックスを統一畳み込みネットワーク(FCN)で回帰する
SiamBANは最先端のパフォーマンスを達成し、40FPSで動作し、その有効性と効率を確認する。
論文 参考訳(メタデータ) (2020-03-15T05:58:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。