論文の概要: Generalizable Re-Identification from Videos with Cycle Association
- arxiv url: http://arxiv.org/abs/2211.03663v1
- Date: Mon, 7 Nov 2022 16:21:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 17:38:49.869941
- Title: Generalizable Re-Identification from Videos with Cycle Association
- Title(参考訳): サイクルアソシエーションによるビデオからの一般化可能な再同定
- Authors: Zhongdao Wang, Zhaopeng Dou, Jingwei Zhang, Liang Zhen, Yifan Sun,
Yali Li, Shengjin Wang
- Abstract要約: トレーニングの複雑さの低いre-IDのためのスケーラブルな自己教師型学習手法であるCycle Associationを提案する。
提案手法に適したLMPビデオという,大規模でラベルのないre-IDデータセットを構築した。
注目すべきは、CycAsがマーケット1501で82.2%、MSMT17で49.0%、人間のアノテーションがゼロであることである。
- 参考スコア(独自算出の注目度): 49.34754685904562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we are interested in learning a generalizable person
re-identification (re-ID) representation from unlabeled videos. Compared with
1) the popular unsupervised re-ID setting where the training and test sets are
typically under the same domain, and 2) the popular domain generalization (DG)
re-ID setting where the training samples are labeled, our novel scenario
combines their key challenges: the training samples are unlabeled, and
collected form various domains which do no align with the test domain. In other
words, we aim to learn a representation in an unsupervised manner and directly
use the learned representation for re-ID in novel domains. To fulfill this
goal, we make two main contributions: First, we propose Cycle Association
(CycAs), a scalable self-supervised learning method for re-ID with low training
complexity; and second, we construct a large-scale unlabeled re-ID dataset
named LMP-video, tailored for the proposed method. Specifically, CycAs learns
re-ID features by enforcing cycle consistency of instance association between
temporally successive video frame pairs, and the training cost is merely linear
to the data size, making large-scale training possible. On the other hand, the
LMP-video dataset is extremely large, containing 50 million unlabeled person
images cropped from over 10K Youtube videos, therefore is sufficient to serve
as fertile soil for self-supervised learning. Trained on LMP-video, we show
that CycAs learns good generalization towards novel domains. The achieved
results sometimes even outperform supervised domain generalizable models.
Remarkably, CycAs achieves 82.2\% Rank-1 on Market-1501 and 49.0\% Rank-1 on
MSMT17 with zero human annotation, surpassing state-of-the-art supervised DG
re-ID methods. Moreover, we also demonstrate the superiority of CycAs under the
canonical unsupervised re-ID and the pretrain-and-finetune scenarios.
- Abstract(参考訳): 本稿では,ラベルなしビデオから一般化可能な人物再識別(re-ID)表現を学習することに興味がある。
比較すると
1) トレーニングセットとテストセットが通常同じドメイン下にある、一般的な教師なしのリID設定
2) トレーニングサンプルをラベル付けした一般的なドメイン一般化(DG) re-ID設定では,トレーニングサンプルはラベル付けされず,テストドメインと整合しないさまざまなドメインで収集されるという,新たなシナリオが両立している。
言い換えれば、教師なしの方法で表現を学習し、新しいドメインでのre-IDに直接使用することを目指している。
この目標を達成するために、我々は、トレーニングの複雑さを低く抑えるスケーラブルな自己教師型学習手法であるCycle Association (CycAs) と、提案手法に合わせてLMP-videoという名の大規模未ラベルのre-IDデータセットを構築した。
具体的には、CycAsは、時間的に連続したビデオフレームペア間のインスタンス関連のサイクル一貫性を強制することにより、re-ID特徴を学習し、トレーニングコストはデータサイズにのみ線形であり、大規模なトレーニングを可能にする。
一方、LMPビデオデータセットは非常に巨大で、10万本以上のYoutubeビデオから収集された5000万枚の未ラベルの人物画像を含んでいるため、自己教師による学習に十分な土壌として機能する。
CycAsは,LMPビデオで学習し,新しいドメインに対して優れた一般化を学習している。
達成された結果は、時には教師付き領域一般化可能なモデルよりも優れる。
注目すべきは、CycAsがマーケット1501で82.2\% Rank-1、MSMT17で49.0\% Rank-1を達成し、最先端のDG re-IDメソッドを超越していることである。
また,CycAsの非教師付きre-IDおよびプレトレイン・アンド・ファネチューンシナリオ下での優位性も示す。
関連論文リスト
- Unleashing the Potential of Unsupervised Pre-Training with
Intra-Identity Regularization for Person Re-Identification [10.045028405219641]
我々は、UP-ReIDと呼ばれる対照的学習(CL)パイプラインに基づいて、ReIDのための教師なし事前学習フレームワークを設計する。
UP-ReIDにI$2$-の正則化を導入し,大域的な画像的側面と局所的なパッチ的側面の2つの制約としてインスタンス化する。
我々のUP-ReID事前学習モデルは、下流のReID微調整の利点を大いに生かし、最先端の性能を達成することができる。
論文 参考訳(メタデータ) (2021-12-01T07:16:37Z) - Semi-Supervised Domain Generalizable Person Re-Identification [74.75528879336576]
既存の人物の再識別(re-id)メソッドは、新しい目に見えないシナリオにデプロイされると立ち往生する。
近年,新たなシナリオにおける未ラベルの広範なデータをトランスダクティブ学習方式で活用するドメイン適応型人物再認識への取り組みが進められている。
我々は、複数のラベル付きデータセットを探索し、人物の再識別のための一般化されたドメイン不変表現を学習することを目指している。
論文 参考訳(メタデータ) (2021-08-11T06:08:25Z) - Camera-aware Proxies for Unsupervised Person Re-Identification [60.26031011794513]
本稿では、アノテーションを必要としない純粋に教師なしの人物識別(Re-ID)問題に取り組む。
各クラスタを複数のプロキシに分割し、それぞれのプロキシが同じカメラからのインスタンスを表すことを提案する。
カメラ認識プロキシに基づいて、カメラ内およびカメラ間コントラスト学習コンポーネントをre-idモデル用に設計する。
論文 参考訳(メタデータ) (2020-12-19T12:37:04Z) - Multi-Domain Adversarial Feature Generalization for Person
Re-Identification [52.835955258959785]
マルチデータセット特徴一般化ネットワーク(MMFA-AAE)を提案する。
複数のラベル付きデータセットから普遍的なドメイン不変の特徴表現を学習し、それを見えないカメラシステムに一般化することができる。
また、最先端の教師付き手法や教師なしのドメイン適応手法を大きなマージンで超えている。
論文 参考訳(メタデータ) (2020-11-25T08:03:15Z) - Semantics-Guided Clustering with Deep Progressive Learning for
Semi-Supervised Person Re-identification [58.01834972099855]
人物の再識別(re-ID)は、同一人物の画像とカメラビューを一致させる必要がある。
本稿では,SGC-DPL(Deep Progressive Learning)を用いたセマンティックスガイドクラスタリング(Semantics-Guided Clustering)の新たなフレームワークを提案する。
我々のアプローチは、半教師付き環境でラベル付きトレーニングデータを増強することができる。
論文 参考訳(メタデータ) (2020-10-02T18:02:35Z) - CycAs: Self-supervised Cycle Association for Learning Re-identifiable
Descriptions [61.724894233252414]
本稿では,人物再識別(re-ID)問題に対する自己教師型学習手法を提案する。
既存の教師なしのメソッドは通常、ビデオトラッカーやクラスタリングのような擬似ラベルに依存している。
疑似ラベルを使わずに、生のビデオから歩行者の埋め込みを学習できる別の教師なし手法を導入する。
論文 参考訳(メタデータ) (2020-07-15T09:52:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。