論文の概要: Towards Efficient Training with Negative Samples in Visual Tracking
- arxiv url: http://arxiv.org/abs/2309.02903v1
- Date: Wed, 6 Sep 2023 10:52:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 15:58:32.626307
- Title: Towards Efficient Training with Negative Samples in Visual Tracking
- Title(参考訳): 視覚トラッキングにおける負のサンプルを用いた効果的なトレーニングに向けて
- Authors: Qingmao Wei, Bi Zeng, Guotian Zeng
- Abstract要約: ビジュアルオブジェクト追跡における現在の最先端(SOTA)手法は、膨大な計算資源と膨大なトレーニングデータを必要とすることが多い。
本研究では、オーバーフィッティングを緩和し、計算要求を減らし、より効率的なトレーニング戦略を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current state-of-the-art (SOTA) methods in visual object tracking often
require extensive computational resources and vast amounts of training data,
leading to a risk of overfitting. This study introduces a more efficient
training strategy to mitigate overfitting and reduce computational
requirements. We balance the training process with a mix of negative and
positive samples from the outset, named as Joint learning with Negative samples
(JN). Negative samples refer to scenarios where the object from the template is
not present in the search region, which helps to prevent the model from simply
memorizing the target, and instead encourages it to use the template for object
location. To handle the negative samples effectively, we adopt a
distribution-based head, which modeling the bounding box as distribution of
distances to express uncertainty about the target's location in the presence of
negative samples, offering an efficient way to manage the mixed sample
training. Furthermore, our approach introduces a target-indicating token. It
encapsulates the target's precise location within the template image. This
method provides exact boundary details with negligible computational cost but
improving performance. Our model, JN-256, exhibits superior performance on
challenging benchmarks, achieving 75.8% AO on GOT-10k and 84.1% AUC on
TrackingNet. Notably, JN-256 outperforms previous SOTA trackers that utilize
larger models and higher input resolutions, even though it is trained with only
half the number of data sampled used in those works.
- Abstract(参考訳): ビジュアルオブジェクト追跡における現在の最先端(SOTA)手法は、しばしば膨大な計算資源と膨大なトレーニングデータを必要とするため、過度に適合するリスクがある。
本研究は,オーバーフィッティングを緩和し,計算要件を削減するための,より効率的なトレーニング戦略を提案する。
トレーニングプロセスは、初期からのネガティブサンプルとポジティブサンプルの混合とバランスを取り、"Joint Learning with Negative sample (JN)"と名づけられた。
負のサンプルは、テンプレートからのオブジェクトが検索領域に存在しないシナリオを指しており、モデルが単にターゲットを記憶するのを防ぐのに役立つ。
負のサンプルを効果的に処理するために,境界ボックスを距離分布としてモデル化し,負のサンプルの存在下でのターゲットの位置の不確かさを表現し,混合サンプルトレーニングを管理する効率的な方法を提供する分布ベースヘッドを採用する。
さらに,本手法では目標指示トークンを導入する。
テンプレートイメージ内のターゲットの正確な位置をカプセル化する。
この手法は計算コストは無視できるが、性能は向上する。
我々のモデルであるJN-256は、GOT-10kで75.8%、TrackingNetで84.1%のAUCを達成した。
特に、JN-256は、より大きなモデルと高い入力解像度を利用する以前のSOTAトラッカーよりも優れている。
関連論文リスト
- BoostAdapter: Improving Vision-Language Test-Time Adaptation via Regional Bootstrapping [64.8477128397529]
本稿では,テスト時間適応フレームワークを提案する。
我々は、インスタンスに依存しない履歴サンプルとインスタンスを意識したブースティングサンプルから特徴を検索するための軽量なキー値メモリを維持している。
理論的には,本手法の背後にある合理性を正当化し,アウト・オブ・ディストリビューションとクロスドメイン・データセットの両方において,その有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-20T15:58:43Z) - It's all about PR -- Smart Benchmarking AI Accelerators using Performance Representatives [40.197673152937256]
統計性能モデルのトレーニングは、しばしば大量のデータを必要とするため、かなりの時間的投資となり、ハードウェアの可用性が制限された場合に困難になる。
本稿では,精度を保ちながらトレーニングサンプル数を著しく削減する性能モデリング手法を提案する。
その結果,単層推定では0.02%,トレーニングサンプル10000点未満では0.68%という平均絶対誤差(MAPE)が得られた。
論文 参考訳(メタデータ) (2024-06-12T15:34:28Z) - KAKURENBO: Adaptively Hiding Samples in Deep Neural Network Training [2.8804804517897935]
深層ニューラルネットワークのトレーニングにおいて,最も重要でないサンプルを隠蔽する手法を提案する。
我々は,学習プロセス全体への貢献に基づいて,与えられたエポックを除外するサンプルを適応的に見つける。
本手法は, ベースラインと比較して, 最大22%の精度でトレーニング時間を短縮できる。
論文 参考訳(メタデータ) (2023-10-16T06:19:29Z) - Better Sampling of Negatives for Distantly Supervised Named Entity
Recognition [39.264878763160766]
本稿では, 正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正の正
提案手法は,4つの遠隔教師付きNERデータセットに対して一貫した性能向上を実現する。
論文 参考訳(メタデータ) (2023-05-22T15:35:39Z) - A Novel Dataset for Evaluating and Alleviating Domain Shift for Human
Detection in Agricultural Fields [59.035813796601055]
トレーニングセットの分布外のデータに展開した場合、ドメインシフトが、よく知られたオブジェクト検出データセット上で訓練された人間の検出モデルに与える影響を評価する。
我々は、ロボットティプラットフォームを用いて、農業ロボット応用の文脈で収集されたOpenDR Humans in Fieldデータセットを紹介した。
論文 参考訳(メタデータ) (2022-09-27T07:04:28Z) - Generating Negative Samples for Sequential Recommendation [83.60655196391855]
逐次レコメンデーション(SR)のための負のサンプル(イテム)を生成することを提案する。
アイテムに対する現在のSRモデルの学習されたユーザの好みに基づいて、各タイムステップで負の項目をサンプリングする。
4つの公開データセットの実験は、SRに高品質な負のサンプルを提供することの重要性を検証する。
論文 参考訳(メタデータ) (2022-08-07T05:44:13Z) - Active Learning for Deep Visual Tracking [51.5063680734122]
畳み込みニューラルネットワーク(CNN)は近年,単一目標追跡タスクに成功している。
本稿では,ディープ・ビジュアル・トラッキングのためのアクティブ・ラーニング手法を提案する。
アクティブラーニングの指導のもと、トレーニングされた深層CNNモデルに基づくトラッカーは、ラベリングコストを低減しつつ、競合的なトラッキング性能を達成することができる。
論文 参考訳(メタデータ) (2021-10-17T11:47:56Z) - Rethinking InfoNCE: How Many Negative Samples Do You Need? [54.146208195806636]
半定量的理論フレームワークを用いて, InfoNCE に最適化された負のサンプル数について検討した。
トレーニングの有効性関数を最大化する$K$値を用いて,最適負サンプリング比を推定する。
論文 参考訳(メタデータ) (2021-05-27T08:38:29Z) - SCE: Scalable Network Embedding from Sparsest Cut [20.08464038805681]
大規模ネットワーク埋め込みは、教師なしの方法で各ノードの潜在表現を学習することである。
このような対照的な学習手法の成功の鍵は、正と負のサンプルを引き出す方法である。
本稿では, 負のサンプルのみを用いた教師なしネットワーク埋め込みのためのSCEを提案する。
論文 参考訳(メタデータ) (2020-06-30T03:18:15Z) - Reinforced Negative Sampling over Knowledge Graph for Recommendation [106.07209348727564]
我々は、高品質なネガティブを探索する強化学習エージェントとして機能する新しい負サンプリングモデル、知識グラフポリシーネットワーク(kgPolicy)を開発した。
kgPolicyは、ターゲットのポジティブなインタラクションからナビゲートし、知識を意識したネガティブなシグナルを適応的に受信し、最終的にはリコメンダをトレーニングする潜在的なネガティブなアイテムを生成する。
論文 参考訳(メタデータ) (2020-03-12T12:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。