論文の概要: TCMM: Token Constraint and Multi-Scale Memory Bank of Contrastive Learning for Unsupervised Person Re-identification
- arxiv url: http://arxiv.org/abs/2501.09044v1
- Date: Wed, 15 Jan 2025 07:14:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-17 15:11:33.961650
- Title: TCMM: Token Constraint and Multi-Scale Memory Bank of Contrastive Learning for Unsupervised Person Re-identification
- Title(参考訳): TCMM:教師なし人物再識別のためのトークン制約とマルチスケールコントラスト学習銀行
- Authors: Zheng-An Zhu, Hsin-Che Chien, Chen-Kuo Chiang,
- Abstract要約: 本稿では,ViTアーキテクチャに対するパッチノイズによる損傷を軽減するために,ViT Token Constraintを提案する。
提案されたマルチスケールメモリは、外れ値サンプルの探索を強化し、機能の一貫性を維持する。
- 参考スコア(独自算出の注目度): 2.3183978396999967
- License:
- Abstract: This paper proposes the ViT Token Constraint and Multi-scale Memory bank (TCMM) method to address the patch noises and feature inconsistency in unsupervised person re-identification works. Many excellent methods use ViT features to obtain pseudo labels and clustering prototypes, then train the model with contrastive learning. However, ViT processes images by performing patch embedding, which inevitably introduces noise in patches and may compromise the performance of the re-identification model. On the other hand, previous memory bank based contrastive methods may lead data inconsistency due to the limitation of batch size. Furthermore, existing pseudo label methods often discard outlier samples that are difficult to cluster. It sacrifices the potential value of outlier samples, leading to limited model diversity and robustness. This paper introduces the ViT Token Constraint to mitigate the damage caused by patch noises to the ViT architecture. The proposed Multi-scale Memory enhances the exploration of outlier samples and maintains feature consistency. Experimental results demonstrate that our system achieves state-of-the-art performance on common benchmarks. The project is available at \href{https://github.com/andy412510/TCMM}{https://github.com/andy412510/TCMM}.
- Abstract(参考訳): 本稿では、教師なしの人物再識別作業におけるパッチノイズや特徴の不整合に対処するための、VITトークン制約とマルチスケールメモリバンク(TCMM)手法を提案する。
多くの優れた方法は、ViT機能を使って擬似ラベルとクラスタリングプロトタイプを取得し、対照的な学習でモデルを訓練する。
しかし、ViTはパッチ埋め込みによって画像を処理し、パッチ内のノイズを必然的に導入し、再識別モデルの性能を損なう可能性がある。
一方、以前のメモリバンクベースのコントラスト法は、バッチサイズに制限があるため、データの一貫性を損なう可能性がある。
さらに、既存の擬似ラベル法は、しばしばクラスタ化が難しい外れ値サンプルを破棄する。
外部サンプルの潜在的な価値を犠牲にして、モデルの多様性と堅牢性に制限を与えます。
本稿では,ViTアーキテクチャに対するパッチノイズによる損傷を軽減するために,ViT Token Constraintを提案する。
提案されたマルチスケールメモリは、外れ値サンプルの探索を強化し、機能の一貫性を維持する。
実験により,本システムは,一般的なベンチマーク上での最先端性能を実証した。
このプロジェクトは \href{https://github.com/andy412510/TCMM}{https://github.com/andy412510/TCMM} で入手できる。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - STAMP: Outlier-Aware Test-Time Adaptation with Stable Memory Replay [76.06127233986663]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の分散シフトに、未ラベルのデータのみを用いて対処することを目的としている。
本稿では,サンプル認識とオフリエ拒絶の両方を行う問題に注意を払っている。
本稿では,STAble Memory rePlay (STAMP) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-22T16:25:41Z) - EMS-SD: Efficient Multi-sample Speculative Decoding for Accelerating Large Language Models [40.651650382105636]
Vanillaメソッドは、サンプル間で新しいトークンの数が一貫していることを保証するために、パディングトークンを追加する。
本稿では,メモリや計算のオーバーヘッドを増大させることなく,異なるサンプルで受け入れられる不整合トークンの問題を解決する手法を提案する。
提案手法は, パディングトークンを追加することなく, 異なるサンプルの予測トークンが矛盾する状況に対処できる。
論文 参考訳(メタデータ) (2024-05-13T08:24:21Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images [76.47980643420375]
本稿では,意味的対応の学習に固有のデータ・ハングリー・マターが存在するという仮説に基づく。
我々は,機械の監督を通じて,ペア化されたキーポイントを確実に強化する単純な機械注釈器を実証する。
我々のモデルは,SPair-71k,PF-PASCAL,PF-WILLOWといった意味対応学習ベンチマークの最先端モデルを上回る。
論文 参考訳(メタデータ) (2023-11-30T13:22:15Z) - Which Tokens to Use? Investigating Token Reduction in Vision
Transformers [64.99704164972513]
4つの画像分類データセットを用いた10種類のトークン削減手法の削減パターンについて検討した。
トップKプルーニング法は驚くほど強力なベースラインであることがわかった。
リダクションパターンの類似性は、モデルパフォーマンスの適度なプロキシである。
論文 参考訳(メタデータ) (2023-08-09T01:51:07Z) - Twin Contrastive Learning with Noisy Labels [45.31997043789471]
我々は、頑健な表現を学習し、分類のためのノイズラベルを処理する、新しい双子のコントラスト学習モデルTCLを提案する。
TCLは、CIFAR-10で90%ノイズラベルで7.5%改善した。
論文 参考訳(メタデータ) (2023-03-13T08:53:47Z) - Label Noise-Robust Learning using a Confidence-Based Sieving Strategy [15.997774467236352]
ラベルノイズを伴うタスクの学習では、オーバーフィッティングに対するモデルの堅牢性を改善することが重要な課題である。
サンプルをノイズのあるラベルで識別し、モデルを学習するのを防ぐことは、この課題に対処するための有望なアプローチである。
本研究では, 信頼度誤差と呼ばれる新しい判別基準と, クリーンサンプルとノイズサンプルを効果的に識別するためのCONFESと呼ばれるシービング戦略を提案する。
論文 参考訳(メタデータ) (2022-10-11T10:47:28Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - Multi-Objective Interpolation Training for Robustness to Label Noise [17.264550056296915]
標準教師付きコントラスト学習はラベル雑音の存在下で劣化することを示す。
コントラスト学習により学習したロバストな特徴表現を利用する新しいラベルノイズ検出手法を提案する。
合成および実世界のノイズベンチマークの実験は、MOIT/MOIT+が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2020-12-08T15:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。