論文の概要: Unleashing the Potential of Tracklets for Unsupervised Video Person Re-Identification
- arxiv url: http://arxiv.org/abs/2406.14261v1
- Date: Thu, 20 Jun 2024 12:30:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 13:52:01.133112
- Title: Unleashing the Potential of Tracklets for Unsupervised Video Person Re-Identification
- Title(参考訳): 教師なしビデオパーソン再同定のためのトラッカーレットの可能性の解き放つ
- Authors: Nanxing Meng, Qizao Wang, Bin Li, Xiangyang Xue,
- Abstract要約: 本稿では、教師なしの映像人物の再識別を促進するためのSSR-C(Self-Supervised Refined Clustering)フレームワークを提案する。
教師なしビデオ人物再同定のためのSSR-Cは最先端の教師付き手法に匹敵する結果が得られる。
- 参考スコア(独自算出の注目度): 40.83058938096914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With rich temporal-spatial information, video-based person re-identification methods have shown broad prospects. Although tracklets can be easily obtained with ready-made tracking models, annotating identities is still expensive and impractical. Therefore, some video-based methods propose using only a few identity annotations or camera labels to facilitate feature learning. They also simply average the frame features of each tracklet, overlooking unexpected variations and inherent identity consistency within tracklets. In this paper, we propose the Self-Supervised Refined Clustering (SSR-C) framework without relying on any annotation or auxiliary information to promote unsupervised video person re-identification. Specifically, we first propose the Noise-Filtered Tracklet Partition (NFTP) module to reduce the feature bias of tracklets caused by noisy tracking results, and sequentially partition the noise-filtered tracklets into "sub-tracklets". Then, we cluster and further merge sub-tracklets using the self-supervised signal from tracklet partition, which is enhanced through a progressive strategy to generate reliable pseudo labels, facilitating intra-class cross-tracklet aggregation. Moreover, we propose the Class Smoothing Classification (CSC) loss to efficiently promote model learning. Extensive experiments on the MARS and DukeMTMC-VideoReID datasets demonstrate that our proposed SSR-C for unsupervised video person re-identification achieves state-of-the-art results and is comparable to advanced supervised methods.
- Abstract(参考訳): 豊かな時間空間情報により、映像に基づく人物再同定手法は幅広い可能性を示している。
トラックレットは用意された追跡モデルで容易に得ることができるが、注釈付きIDは高価で実用的ではない。
そのため、いくつかのビデオベース手法では、機能学習を容易にするために、いくつかのアイデンティティアノテーションやカメララベルのみを使用することを提案する。
また、各トラックレットのフレーム特性を平均化し、予期せぬ変動とトラックレット内の固有のアイデンティティ一貫性を見落としている。
本稿では,教師なしビデオ人物の再識別を促進するため,アノテーションや補助情報に頼ることなく,自己改善型クラスタリング(SSR-C)フレームワークを提案する。
具体的には、ノイズフィルタトラックレット分割(NFTP)モジュールを提案し、ノイズフィルタトラックレットを「サブトラックレット」に順次分割する。
そして、トラストレットパーティションからの自己指示信号を用いてサブトラックレットをクラスタ化し、さらにマージし、プログレッシブ戦略により拡張し、信頼性の高い擬似ラベルを生成し、クラス内のクロストラックレットアグリゲーションを容易にする。
さらに,モデル学習を効率的に促進するクラス平滑化分類(CSC)の損失を提案する。
MARSとDukeMTMC-VideoReIDデータセットの大規模な実験により、教師なしの人物再識別のためのSSR-Cが最先端の教師付き手法に匹敵する結果が得られた。
関連論文リスト
- Weakly Supervised Video Individual CountingWeakly Supervised Video
Individual Counting [126.75545291243142]
Video Individual Countingは、単一のビデオ内のユニークな個人数を予測することを目的としている。
トラジェクトリラベルが提供されない弱い教師付きVICタスクを導入する。
そこで我々は,ネットワークを駆動し,インフロー,アウトフロー,残りを識別するために,エンドツーエンドのトレーニング可能なソフトコントラスト損失を考案した。
論文 参考訳(メタデータ) (2023-12-10T16:12:13Z) - A Free Lunch to Person Re-identification: Learning from Automatically
Generated Noisy Tracklets [52.30547023041587]
非教師付きビデオベース再識別(re-ID)手法は、re-IDデータセットのアノテートに必要な高コストの問題を解決するために提案されている。
しかし、彼らのパフォーマンスは監督対象よりもはるかに低い。
本稿では,自動生成人追跡装置から再IDモデルを学習することで,この問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-04-02T16:18:13Z) - Semi-TCL: Semi-Supervised Track Contrastive Representation Learning [40.31083437957288]
我々は、外観埋め込みを学習するために、新しいインスタンス・ツー・トラックマッチングの目的を設計する。
候補検出とトラッカーに永続化されたトラックの埋め込みを比較する。
我々は,この学習目標を,構成的損失の精神に倣って統一的な形で実施する。
論文 参考訳(メタデータ) (2021-07-06T05:23:30Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - Self-supervised Video Object Segmentation [76.83567326586162]
本研究の目的は、半教師付きビデオオブジェクトセグメンテーション(高密度トラッキング)の解決を目的とした自己教師付き表現学習である。
i) 従来の自己教師型アプローチを改善すること、(ii) オンライン適応モジュールによる自己教師型アプローチの強化により、空間的時間的不連続性によるトラッカーのドリフトを緩和すること、(iv) DAVIS-2017とYouTubeの自己教師型アプローチで最先端の結果を示すこと、などが提案されている。
論文 参考訳(メタデータ) (2020-06-22T17:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。