論文の概要: Large-Scale Unsupervised Person Re-Identification with Contrastive
Learning
- arxiv url: http://arxiv.org/abs/2105.07914v1
- Date: Mon, 17 May 2021 14:55:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-05-18 20:23:36.196295
- Title: Large-Scale Unsupervised Person Re-Identification with Contrastive
Learning
- Title(参考訳): コントラスト学習による大規模教師なし人物再同定
- Authors: Weiquan Huang, Yan Bai, Qiuyu Ren, Xinbo Zhao, Ming Feng and Yin Wang
- Abstract要約: ほとんどの既存の非監視およびドメイン適応ReIDメソッドは、実験で公開データセットのみを使用します。
コントラスト学習による大規模自己監視画像分類の最近の進歩に触発され, 大規模非ラベル監視映像だけでReID表現を学習することを提案する。
- 参考スコア(独自算出の注目度): 17.04597303816259
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing public person Re-Identification~(ReID) datasets are small in modern
terms because of labeling difficulty. Although unlabeled surveillance video is
abundant and relatively easy to obtain, it is unclear how to leverage these
footage to learn meaningful ReID representations. In particular, most existing
unsupervised and domain adaptation ReID methods utilize only the public
datasets in their experiments, with labels removed. In addition, due to small
data sizes, these methods usually rely on fine tuning by the unlabeled training
data in the testing domain to achieve good performance. Inspired by the recent
progress of large-scale self-supervised image classification using contrastive
learning, we propose to learn ReID representation from large-scale unlabeled
surveillance video alone. Assisted by off-the-shelf pedestrian detection tools,
we apply the contrastive loss at both the image and the tracklet levels.
Together with a principal component analysis step using camera labels freely
available, our evaluation using a large-scale unlabeled dataset shows far
superior performance among unsupervised methods that do not use any training
data in the testing domain. Furthermore, the accuracy improves with the data
size and therefore our method has great potential with even larger and more
diversified datasets.
- Abstract(参考訳): 既存のpublic person re-identification~(reid)データセットはラベリングが難しいため、現代の用語では小さい。
ラベルのない監視ビデオは豊富で比較的入手が容易であるが、これらの映像を使って有意義なreid表現を学習する方法は明らかではない。
特に、既存の教師なしおよびドメイン適応のReIDメソッドは、実験において公開データセットのみを使用し、ラベルを削除している。
さらに、データサイズが小さいため、これらのメソッドは通常、優れたパフォーマンスを達成するためにテストドメイン内のラベルなしのトレーニングデータによる微調整に依存する。
コントラスト学習を用いた大規模自己監督画像分類の最近の進歩に触発されて,大規模無ラベル監視ビデオからReID表現を学習することを提案する。
既成の歩行者検出ツールを用いて,画像とトラックレットの両方のコントラスト損失を適用した。
カメララベルを自由に使用できる主成分分析ステップと合わせて,テスト領域でトレーニングデータを使用しない教師なし手法において,大規模非ラベルデータセットを用いた評価が極めて優れていることを示す。
さらに、データサイズによって精度が向上するので、我々の手法はより大きく、より多様化したデータセットで大きな可能性を秘めている。
関連論文リスト
- Weakly Semi-supervised Tool Detection in Minimally Invasive Surgery
Videos [11.61305113932032]
外科的ツール検出は、最小侵襲の手術ビデオの分析と評価に不可欠である。
インスタンスレベルのラベルを持つ大規模なイメージデータセットは、アノテーションの負担のために制限されることが多い。
本研究では,非常にコストのかかるアノテーションの重み付けと検出性能のバランスをとることを提案する。
論文 参考訳(メタデータ) (2024-01-05T13:05:02Z) - Domain Adaptive Multiple Instance Learning for Instance-level Prediction
of Pathological Images [45.132775668689604]
アノテーションのコストを増大させることなく、ターゲットデータセットの分類性能を向上させるためのタスク設定を提案する。
両手法の監督情報を効果的に組み合わせるために,信頼性の高い擬似ラベルを作成する手法を提案する。
論文 参考訳(メタデータ) (2023-04-07T08:31:06Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - Semi-weakly Supervised Contrastive Representation Learning for Retinal
Fundus Images [0.2538209532048867]
本稿では,半弱化アノテーションを用いた表現学習のための,半弱化教師付きコントラスト学習フレームワークを提案する。
SWCLの移動学習性能を7つの公立網膜眼底データセットで実証的に検証した。
論文 参考訳(メタデータ) (2021-08-04T15:50:09Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - Labelling unlabelled videos from scratch with multi-modal
self-supervision [82.60652426371936]
ビデオデータセットの教師なしラベリングは、強力な機能エンコーダから解放されない。
人間のアノテーションを使わずにビデオデータセットの擬似ラベリングを可能にする新しいクラスタリング手法を提案する。
広範囲な分析により、結果として得られたクラスタは、真理の人間ラベルと高いセマンティックオーバーラップがあることが示されている。
論文 参考訳(メタデータ) (2020-06-24T12:28:17Z) - Don't Wait, Just Weight: Improving Unsupervised Representations by
Learning Goal-Driven Instance Weights [92.16372657233394]
自己教師付き学習技術は、役に立たないデータから有用な表現を学習することで、パフォーマンスを向上させることができる。
ベイジアンのインスタンスの重み付けを学習することで、下流の分類精度を向上させることができることを示す。
本研究では,STL-10 と Visual Decathlon の自己教師型回転予測タスクを用いて,BetaDataWeighter の評価を行った。
論文 参考訳(メタデータ) (2020-06-22T15:59:32Z) - Laplacian Denoising Autoencoder [114.21219514831343]
本稿では,新しいタイプの自動符号化器を用いてデータ表現を学習することを提案する。
勾配領域における潜伏クリーンデータを破損させて雑音入力データを生成する。
いくつかのビジュアルベンチマークの実験では、提案されたアプローチでより良い表現が学べることが示されている。
論文 参考訳(メタデータ) (2020-03-30T16:52:39Z) - Evolving Losses for Unsupervised Video Representation Learning [91.2683362199263]
大規模未ラベル映像データから映像表現を学習する新しい手法を提案する。
提案した教師なし表現学習では,単一のRGBネットワークが実現し,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-02-26T16:56:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。