論文の概要: Active Learning for Deep Visual Tracking
- arxiv url: http://arxiv.org/abs/2110.13259v1
- Date: Sun, 17 Oct 2021 11:47:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 08:53:12.400100
- Title: Active Learning for Deep Visual Tracking
- Title(参考訳): 深部視覚追跡のためのアクティブラーニング
- Authors: Di Yuan and Xiaojun Chang and Qiao Liu and Dehua Wang and Zhenyu He
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は近年,単一目標追跡タスクに成功している。
本稿では,ディープ・ビジュアル・トラッキングのためのアクティブ・ラーニング手法を提案する。
アクティブラーニングの指導のもと、トレーニングされた深層CNNモデルに基づくトラッカーは、ラベリングコストを低減しつつ、競合的なトラッキング性能を達成することができる。
- 参考スコア(独自算出の注目度): 51.5063680734122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional neural networks (CNNs) have been successfully applied to the
single target tracking task in recent years. Generally, training a deep CNN
model requires numerous labeled training samples, and the number and quality of
these samples directly affect the representational capability of the trained
model. However, this approach is restrictive in practice, because manually
labeling such a large number of training samples is time-consuming and
prohibitively expensive. In this paper, we propose an active learning method
for deep visual tracking, which selects and annotates the unlabeled samples to
train the deep CNNs model. Under the guidance of active learning, the tracker
based on the trained deep CNNs model can achieve competitive tracking
performance while reducing the labeling cost. More specifically, to ensure the
diversity of selected samples, we propose an active learning method based on
multi-frame collaboration to select those training samples that should be and
need to be annotated. Meanwhile, considering the representativeness of these
selected samples, we adopt a nearest neighbor discrimination method based on
the average nearest neighbor distance to screen isolated samples and
low-quality samples. Therefore, the training samples subset selected based on
our method requires only a given budget to maintain the diversity and
representativeness of the entire sample set. Furthermore, we adopt a Tversky
loss to improve the bounding box estimation of our tracker, which can ensure
that the tracker achieves more accurate target states. Extensive experimental
results confirm that our active learning-based tracker (ALT) achieves
competitive tracking accuracy and speed compared with state-of-the-art trackers
on the seven most challenging evaluation benchmarks.
- Abstract(参考訳): 近年、畳み込みニューラルネットワーク(cnns)が単一の目標追跡タスクにうまく適用されている。
一般的に、深層cnnモデルのトレーニングには多数のラベル付きトレーニングサンプルが必要であり、これらのサンプルの数と品質はトレーニングモデルの表現能力に直接影響する。
しかし、このような大量のトレーニングサンプルを手動でラベル付けするのは時間を要するため、実際には制限がある。
本稿では,ラベルなしサンプルを選択・注釈付けして深層cnnsモデルを学習する,深部視覚追跡のためのアクティブ学習手法を提案する。
アクティブラーニングの指導のもと、トレーニングされた深層CNNモデルに基づくトラッカーは、ラベリングコストを低減しつつ、競合追跡性能を達成することができる。
より具体的には、選択したサンプルの多様性を確保するために、複数フレームの協調に基づくアクティブな学習手法を提案し、アノテートが必要なトレーニングサンプルを選択する。
一方, 選択したサンプルの表現性を考慮すると, 隣り合う平均近傍距離に基づく近接識別手法を採用し, 孤立サンプルと低品質サンプルをスクリーニングする。
したがって,本手法に基づいて選択したトレーニングサンプルサブセットは,サンプル全体の多様性と代表性を維持するために,所定の予算しか必要としない。
さらに、トラッカーのバウンディングボックス推定を改善するためにTversky損失を採用し、トラッカーがより正確なターゲット状態を達成することを保証する。
総合的な実験結果から,我々のアクティブラーニングベーストラッカー(ALT)は,7つの最も困難な評価ベンチマークにおいて,最先端トラッカーと比較して,競争力のあるトラッキング精度と速度を達成することを確認した。
関連論文リスト
- BoostAdapter: Improving Vision-Language Test-Time Adaptation via Regional Bootstrapping [64.8477128397529]
本稿では,テスト時間適応フレームワークを提案する。
我々は、インスタンスに依存しない履歴サンプルとインスタンスを意識したブースティングサンプルから特徴を検索するための軽量なキー値メモリを維持している。
理論的には,本手法の背後にある合理性を正当化し,アウト・オブ・ディストリビューションとクロスドメイン・データセットの両方において,その有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-20T15:58:43Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Pre-Trained Vision-Language Models as Partial Annotators [40.89255396643592]
事前学習された視覚言語モデルは、画像と自然言語の統一表現をモデル化するために大量のデータを学習する。
本稿では,事前学習型モデルアプリケーションのための「事前学習型-弱教師付き学習」パラダイムについて検討し,画像分類タスクの実験を行う。
論文 参考訳(メタデータ) (2024-05-23T17:17:27Z) - Learning with Noisy Labels Using Collaborative Sample Selection and
Contrastive Semi-Supervised Learning [76.00798972439004]
Collaborative Sample Selection (CSS)は、特定されたクリーンセットからノイズの多いサンプルを削除する。
半教師付き学習において、対照的な損失を伴う協調学習機構を導入する。
論文 参考訳(メタデータ) (2023-10-24T05:37:20Z) - ScatterSample: Diversified Label Sampling for Data Efficient Graph
Neural Network Learning [22.278779277115234]
グラフニューラルネットワーク(GNN)トレーニングが高価であるいくつかのアプリケーションでは、新しいインスタンスのラベル付けが高価である。
データ効率のよいアクティブサンプリングフレームワークであるScatterSampleを開発し、アクティブな学習環境下でGNNを訓練する。
5つのデータセットに対する実験により、ScatterSampleは他のGNNのアクティブラーニングベースラインよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-06-09T04:05:02Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - CSI: Novelty Detection via Contrastive Learning on Distributionally
Shifted Instances [77.28192419848901]
コントラストシフトインスタンス (CSI) という,単純かつ効果的な手法を提案する。
従来のコントラスト学習法のように,サンプルを他の例と対比することに加えて,本トレーニング手法では,サンプルを分散シフトによる拡張と対比する。
本実験は, 種々の新規検出シナリオにおける本手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-07-16T08:32:56Z) - Progressive Multi-Stage Learning for Discriminative Tracking [25.94944743206374]
本稿では,頑健な視覚追跡のためのサンプル選択の段階的多段階最適化ポリシを用いた共同識別学習手法を提案する。
提案手法は, 時間重み付き, 検出誘導型セルフペースト学習戦略により, 簡単なサンプル選択を行う。
ベンチマークデータセットの実験では、提案した学習フレームワークの有効性が示されている。
論文 参考訳(メタデータ) (2020-04-01T07:01:30Z) - Efficient Deep Representation Learning by Adaptive Latent Space Sampling [16.320898678521843]
監視されたディープラーニングには、アノテーションを備えた大量のトレーニングサンプルが必要です。
本稿では,学習プロセスに供給される情報サンプルを適応的に選択する新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-19T22:17:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。