論文の概要: Unsupervised Person Re-identification via Simultaneous Clustering and
Consistency Learning
- arxiv url: http://arxiv.org/abs/2104.00202v1
- Date: Thu, 1 Apr 2021 02:10:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-03 06:06:57.403269
- Title: Unsupervised Person Re-identification via Simultaneous Clustering and
Consistency Learning
- Title(参考訳): 同時クラスタリングと一貫性学習による教師なし人物再同定
- Authors: Junhui Yin, Jiayan Qiu, Siqing Zhang, Jiyang Xie, Zhanyu Ma, and Jun
Guo
- Abstract要約: 静止画からの視覚的一貫性とトレーニングプロセス中の時間的一貫性を学習することにより、教師なし再IDのプリテキストタスクを設計します。
2つのエンコードされたビューを同じクラスタにグループ化し、ビュー間の視覚的一貫性を高めることで、モデルを最適化する。
- 参考スコア(独自算出の注目度): 22.008371113710137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised person re-identification (re-ID) has become an important topic
due to its potential to resolve the scalability problem of supervised re-ID
models. However, existing methods simply utilize pseudo labels from clustering
for supervision and thus have not yet fully explored the semantic information
in data itself, which limits representation capabilities of learned models. To
address this problem, we design a pretext task for unsupervised re-ID by
learning visual consistency from still images and temporal consistency during
training process, such that the clustering network can separate the images into
semantic clusters automatically. Specifically, the pretext task learns
semantically meaningful representations by maximizing the agreement between two
encoded views of the same image via a consistency loss in latent space.
Meanwhile, we optimize the model by grouping the two encoded views into same
cluster, thus enhancing the visual consistency between views. Experiments on
Market-1501, DukeMTMC-reID and MSMT17 datasets demonstrate that our proposed
approach outperforms the state-of-the-art methods by large margins.
- Abstract(参考訳): 教師なし人物再識別(re-ID)は、教師付き再IDモデルのスケーラビリティ問題を解決する可能性から重要なトピックとなっている。
しかし、既存の手法ではクラスタリングの擬似ラベルを単純に利用して監視を行うため、学習モデルの表現能力を制限するデータ自体のセマンティックな情報を十分に検討していない。
そこで本研究では,学習中の静止画像から視覚的一貫性と時間的一貫性を学習し,教師なし再識別のためのプリテキストタスクを設計し,クラスタリングネットワークが画像を自動的にセマンティッククラスタに分離できるようにする。
具体的には,2つの同一画像の符号化されたビュー間の一致を潜在空間の一貫性損失によって最大化することにより,意味的に意味のある表現を学習する。
一方、2つの符号化されたビューを同じクラスタにグループ化することでモデルを最適化し、ビュー間の視覚的一貫性を高める。
market-1501, dukemtmc-reid, msmt17データセットにおける実験により,提案手法が最先端手法よりも大きなマージンで優れていることが示された。
関連論文リスト
- Pose-Transformation and Radial Distance Clustering for Unsupervised Person Re-identification [5.522856885199346]
人物再識別(re-ID)は、重複しないカメラ間での同一性マッチングの問題に対処することを目的としている。
監視されたアプローチでは、取得が困難になり、トレーニング対象のデータセットに対して本質的にバイアスがかかる可能性のあるID情報が必要となる。
本稿では,真のラベルの知識をゼロにすることで,学習した特徴の識別能力を向上する手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T20:55:30Z) - Discriminative Anchor Learning for Efficient Multi-view Clustering [59.11406089896875]
マルチビュークラスタリング(DALMC)のための識別的アンカー学習を提案する。
元のデータセットに基づいて、識別的なビュー固有の特徴表現を学習する。
これらの表現に基づいて異なるビューからアンカーを構築することで、共有アンカーグラフの品質が向上します。
論文 参考訳(メタデータ) (2024-09-25T13:11:17Z) - Self Supervised Correlation-based Permutations for Multi-View Clustering [7.972599673048582]
汎用データのためのエンドツーエンドのディープラーニングベースのMVCフレームワークを提案する。
我々のアプローチは、新しい置換に基づく正準相関目標を用いて有意義な融合データ表現を学習することである。
10つのMVCベンチマークデータセットを用いて、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T08:08:30Z) - CGUA: Context-Guided and Unpaired-Assisted Weakly Supervised Person
Search [54.106662998673514]
本稿では,コンテキストガイドとアンペア支援(CGUA)を弱教師付き人物検索フレームワークとして導入する。
具体的には、クラスタリングプロセスにおけるコンテキスト情報を活用する新しいコンテキストガイドクラスタ(CGC)アルゴリズムを提案する。
本手法は,より多様なラベル付きデータを活用することにより,最先端の教師付き手法に匹敵する,あるいは優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-27T13:57:30Z) - UniVIP: A Unified Framework for Self-Supervised Visual Pre-training [50.87603616476038]
単一中心オブジェクトまたは非調和データセット上で,汎用的な視覚表現を学習するための,新しい自己教師型フレームワークを提案する。
大規模実験により、非高調波COCOで事前訓練されたUniVIPは、最先端の転送性能を実現することが示された。
また、ImageNetのような単一中心オブジェクトのデータセットを利用でき、線形探索において同じ事前学習エポックでBYOLを2.5%上回る。
論文 参考訳(メタデータ) (2022-03-14T10:04:04Z) - Mind Your Clever Neighbours: Unsupervised Person Re-identification via
Adaptive Clustering Relationship Modeling [19.532602887109668]
教師なし人物再識別(Re-ID)は、教師付きRe-IDモデルのスケーラビリティ問題を解決する可能性から注目されている。
既存の教師なし手法の多くは反復的なクラスタリング機構を採用しており、教師なしクラスタリングによって生成された擬似ラベルに基づいてネットワークを訓練している。
高品質な擬似ラベルを生成し,クラスタリングエラーの影響を軽減するために,教師なしのRe-IDのための新しいクラスタリング関係モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T10:55:07Z) - Camera-aware Proxies for Unsupervised Person Re-Identification [60.26031011794513]
本稿では、アノテーションを必要としない純粋に教師なしの人物識別(Re-ID)問題に取り組む。
各クラスタを複数のプロキシに分割し、それぞれのプロキシが同じカメラからのインスタンスを表すことを提案する。
カメラ認識プロキシに基づいて、カメラ内およびカメラ間コントラスト学習コンポーネントをre-idモデル用に設計する。
論文 参考訳(メタデータ) (2020-12-19T12:37:04Z) - CoADNet: Collaborative Aggregation-and-Distribution Networks for
Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。
課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。
我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文 参考訳(メタデータ) (2020-11-10T04:28:11Z) - Temporal Continuity Based Unsupervised Learning for Person
Re-Identification [15.195514083289801]
本稿では,非教師なしの集中型クラスタリング手法を提案し,その基盤となるre-id識別情報を段階的に学習し活用する。
我々は、時間連続性に基づく教師なし学習(TCUL)と呼ぶ。
特に、TCULは、無ラベル(ターゲット)データセットのセンターベースのクラスタリングを同時に行い、無関係なラベル付き(ソース)データセットで事前トレーニングされた畳み込みニューラルネットワーク(CNN)を微調整する。
カメラ内の画像の時間的連続性と、カメラ間の特徴マップの空間的類似性を利用して、再識別モデルをトレーニングするための信頼性の高い擬似ラベルを生成する。
論文 参考訳(メタデータ) (2020-09-01T05:29:30Z) - Unsupervised Person Re-identification via Softened Similarity Learning [122.70472387837542]
人物再識別(re-ID)はコンピュータビジョンにおいて重要なトピックである。
本稿では,ラベル付き情報を必要としないre-IDの教師なし設定について検討する。
2つの画像ベースおよびビデオベースデータセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-04-07T17:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。