論文の概要: Semi-TCL: Semi-Supervised Track Contrastive Representation Learning
- arxiv url: http://arxiv.org/abs/2107.02396v1
- Date: Tue, 6 Jul 2021 05:23:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-08 00:43:05.141268
- Title: Semi-TCL: Semi-Supervised Track Contrastive Representation Learning
- Title(参考訳): Semi-TCL: 半教師付きトラックコントラスト表現学習
- Authors: Wei Li, Yuanjun Xiong, Shuo Yang, Mingze Xu, Yongxin Wang, Wei Xia
- Abstract要約: 我々は、外観埋め込みを学習するために、新しいインスタンス・ツー・トラックマッチングの目的を設計する。
候補検出とトラッカーに永続化されたトラックの埋め込みを比較する。
我々は,この学習目標を,構成的損失の精神に倣って統一的な形で実施する。
- 参考スコア(独自算出の注目度): 40.31083437957288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online tracking of multiple objects in videos requires strong capacity of
modeling and matching object appearances. Previous methods for learning
appearance embedding mostly rely on instance-level matching without considering
the temporal continuity provided by videos. We design a new instance-to-track
matching objective to learn appearance embedding that compares a candidate
detection to the embedding of the tracks persisted in the tracker. It enables
us to learn not only from videos labeled with complete tracks, but also
unlabeled or partially labeled videos. We implement this learning objective in
a unified form following the spirit of constrastive loss. Experiments on
multiple object tracking datasets demonstrate that our method can effectively
learning discriminative appearance embeddings in a semi-supervised fashion and
outperform state of the art methods on representative benchmarks.
- Abstract(参考訳): ビデオ内の複数のオブジェクトのオンライントラッキングには、モデリングとオブジェクトの出現のマッチングが不可欠である。
見た目の埋め込みを学習する以前の方法は、ビデオの時間的連続性を考慮せずにインスタンスレベルのマッチングに依存することが多い。
提案手法は,検出候補とトラッカーに残留するトラックの組込みを比較検討し,その組込みを学習するための新しいインスタンス間マッチング対象を設計する。
これにより、完全なトラックでラベル付けされたビデオだけでなく、ラベル付きまたは部分的にラベル付けされたビデオからも学習できます。
我々は,この学習目標を拘束的損失の精神に従って統一した形で実現する。
複数のオブジェクト追跡データセットに対する実験により,本手法は半教師付き手法による識別的外見埋め込みを効果的に学習し,代表的ベンチマーク上での芸術手法の性能向上を実証した。
関連論文リスト
- QDTrack: Quasi-Dense Similarity Learning for Appearance-Only Multiple
Object Tracking [73.52284039530261]
本稿では,コントラスト学習のために,画像上に数百のオブジェクト領域を密集した擬似Dense類似性学習を提案する。
得られた特徴空間は、オブジェクトアソシエーションの推論時間において、単純な近接探索を許容する。
我々の類似性学習方式は,ビデオデータに限らず,静的入力でも有効なインスタンス類似性を学ぶことができることを示す。
論文 参考訳(メタデータ) (2022-10-12T15:47:36Z) - Few-Shot Action Localization without Knowing Boundaries [9.959844922120523]
対象のアクションの1/2のトリミング例がテスト時にのみ利用可能である場合,未トリミングビデオ中のアクションのローカライズを学習可能であることを示す。
ビデオのペア間の微細な類似パターンをモデル化した時間的類似度行列(TSM)を推定するネットワークを提案する。
提案手法は,最先端の完全教師付き,少数ショットの学習手法に匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2021-06-08T07:32:43Z) - CoCon: Cooperative-Contrastive Learning [52.342936645996765]
自己教師付き視覚表現学習は効率的な映像分析の鍵である。
最近の画像表現の学習の成功は、コントラスト学習がこの課題に取り組むための有望なフレームワークであることを示唆している。
コントラスト学習の協調的バリエーションを導入し、ビュー間の相補的な情報を活用する。
論文 参考訳(メタデータ) (2021-04-30T05:46:02Z) - Multiview Pseudo-Labeling for Semi-supervised Learning from Video [102.36355560553402]
本稿では,映像における半教師付き学習において,外観と動作情報という形で相補的視点を用いた新しい枠組みを提案する。
提案手法は複数のビューを対象とするが,それでも外観と動作の入力間で共有されるモデルを訓練する。
複数のビデオ認識データセットにおいて,本手法は教師あり映像表現学習における従来の標準ベンチマークと比較し,教師あり映像表現学習における従来の手法と比較した。
論文 参考訳(メタデータ) (2021-04-01T17:59:48Z) - Learning to Track Instances without Video Annotations [85.9865889886669]
本稿では,ラベル付き画像データセットとラベルなしビデオシーケンスのみを用いたインスタンス追跡ネットワークを学習する,新しい半教師付きフレームワークを提案する。
画像のみを訓練しても,学習した特徴表現は出現の変動にロバストであることが判明した。
さらに、このモジュールを単一ステージのインスタンスセグメンテーションとポーズ推定フレームワークに統合します。
論文 参考訳(メタデータ) (2021-04-01T06:47:41Z) - Self-supervised Video Object Segmentation [76.83567326586162]
本研究の目的は、半教師付きビデオオブジェクトセグメンテーション(高密度トラッキング)の解決を目的とした自己教師付き表現学習である。
i) 従来の自己教師型アプローチを改善すること、(ii) オンライン適応モジュールによる自己教師型アプローチの強化により、空間的時間的不連続性によるトラッカーのドリフトを緩和すること、(iv) DAVIS-2017とYouTubeの自己教師型アプローチで最先端の結果を示すこと、などが提案されている。
論文 参考訳(メタデータ) (2020-06-22T17:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。