論文の概要: Learning Tracking Representations from Single Point Annotations
- arxiv url: http://arxiv.org/abs/2404.09504v1
- Date: Mon, 15 Apr 2024 06:50:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-16 13:19:30.720651
- Title: Learning Tracking Representations from Single Point Annotations
- Title(参考訳): 単一点アノテーションによる追跡表現の学習
- Authors: Qiangqiang Wu, Antoni B. Chan,
- Abstract要約: 本稿では,単一点アノテーションから追跡表現を弱教師付きで学習することを提案する。
具体的には,エンド・ツー・エンド・エンド・コントラスト学習に先立って,対象対象対象性を取り入れたソフトコントラスト学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 49.47550029470299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing deep trackers are typically trained with largescale video frames with annotated bounding boxes. However, these bounding boxes are expensive and time-consuming to annotate, in particular for large scale datasets. In this paper, we propose to learn tracking representations from single point annotations (i.e., 4.5x faster to annotate than the traditional bounding box) in a weakly supervised manner. Specifically, we propose a soft contrastive learning (SoCL) framework that incorporates target objectness prior into end-to-end contrastive learning. Our SoCL consists of adaptive positive and negative sample generation, which is memory-efficient and effective for learning tracking representations. We apply the learned representation of SoCL to visual tracking and show that our method can 1) achieve better performance than the fully supervised baseline trained with box annotations under the same annotation time cost; 2) achieve comparable performance of the fully supervised baseline by using the same number of training frames and meanwhile reducing annotation time cost by 78% and total fees by 85%; 3) be robust to annotation noise.
- Abstract(参考訳): 既存のディープトラッカーは通常、注釈付きバウンディングボックスを備えた大規模なビデオフレームで訓練される。
しかし、これらのバウンディングボックスは高価でアノテートに時間がかかる。
本稿では,単一点アノテーション(従来のバウンディングボックスよりも4.5倍高速なアノテート)から追跡表現を弱教師付きで学習することを提案する。
具体的には,対象対象の目的性をエンドツーエンドのコントラスト学習に組み込むソフトコントラスト学習(SoCL)フレームワークを提案する。
我々のSoCLは適応型正と負のサンプル生成で構成されており、これはメモリ効率が高く、トラッキング表現の学習に有効である。
我々は,SoCLの学習表現を視覚的追跡に適用し,その方法が可能であることを示す。
1)同じアノテーションの時間コストでボックスアノテーションでトレーニングされた完全に教師されたベースラインよりも優れたパフォーマンスを達成する。
2 同じ数のトレーニングフレームを用いて、アノテーションの時間コストを78%削減し、総料金を85%削減することにより、完全に監督されたベースラインの同等の性能を達成する。
3)アノテーションノイズに対して頑健である。
関連論文リスト
- One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - FOCAL: A Cost-Aware Video Dataset for Active Learning [13.886774655927875]
アノテーションコストとは、アノテータが与えられたビデオシーケンスのラベル付けと品質保証に要する時間を指す。
本稿では,ビデオデータのシーケンシャルな構造を利用する共形能動学習アルゴリズムを提案する。
共形能動学習法は,従来の能動能動学習法よりも113時間も安価であることを示す。
論文 参考訳(メタデータ) (2023-11-17T15:46:09Z) - Active Self-Training for Weakly Supervised 3D Scene Semantic
Segmentation [17.27850877649498]
本稿では,自己学習と能動的学習を組み合わせた3次元シーンの弱教師付きセグメンテーション手法を提案する。
提案手法は,従来の作業やベースラインよりもシーンセグメンテーションを改善する効果的な手法であることを示す。
論文 参考訳(メタデータ) (2022-09-15T06:00:25Z) - Video Annotation for Visual Tracking via Selection and Refinement [74.08109740917122]
ビデオシーケンスのバウンディングボックスアノテーションを容易にするための新しいフレームワークを提案する。
目標位置の時間的コヒーレンスを捉えることのできる時間的アセスメントネットワークを提案する。
また、選択したトラッキング結果をさらに強化するために、ビジュアルジオメトリ・リファインメント・ネットワークが設計されている。
論文 参考訳(メタデータ) (2021-08-09T05:56:47Z) - Learning to Track Instances without Video Annotations [85.9865889886669]
本稿では,ラベル付き画像データセットとラベルなしビデオシーケンスのみを用いたインスタンス追跡ネットワークを学習する,新しい半教師付きフレームワークを提案する。
画像のみを訓練しても,学習した特徴表現は出現の変動にロバストであることが判明した。
さらに、このモジュールを単一ステージのインスタンスセグメンテーションとポーズ推定フレームワークに統合します。
論文 参考訳(メタデータ) (2021-04-01T06:47:41Z) - Improving Semantic Segmentation via Self-Training [75.07114899941095]
半教師付きアプローチ,特に自己学習パラダイムを用いて,最先端の成果を得ることができることを示す。
まず、ラベル付きデータに基づいて教師モデルを訓練し、次にラベルなしデータの大規模なセット上で擬似ラベルを生成する。
私たちの堅牢なトレーニングフレームワークは、人名と擬似ラベルを共同で消化し、Cityscapes、CamVid、KITTIデータセット上で最高のパフォーマンスを達成することができます。
論文 参考訳(メタデータ) (2020-04-30T17:09:17Z) - Towards Using Count-level Weak Supervision for Crowd Counting [55.58468947486247]
本稿では,少数の位置レベルのアノテーション(十分に教師された)と大量のカウントレベルのアノテーション(弱教師付き)からモデルを学習する,弱教師付き群集カウントの問題について検討する。
我々は、生成した密度マップの自由を制限するための正規化を構築するために、単純なyet効果のトレーニング戦略、すなわちMultiple Auxiliary Tasks Training (MATT)を考案した。
論文 参考訳(メタデータ) (2020-02-29T02:58:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。