論文の概要: Dynamic Modality-Camera Invariant Clustering for Unsupervised Visible-Infrared Person Re-identification
- arxiv url: http://arxiv.org/abs/2412.08231v1
- Date: Wed, 11 Dec 2024 09:31:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:03:54.846225
- Title: Dynamic Modality-Camera Invariant Clustering for Unsupervised Visible-Infrared Person Re-identification
- Title(参考訳): 教師なし可視赤外人物再識別のための動的モダリティ・カメラ不変クラスタリング
- Authors: Yiming Yang, Weipeng Hu, Haifeng Hu,
- Abstract要約: 教師なし学習の可視的人物再識別(USL-VI-ReID)は、教師付き手法よりも柔軟で費用対効果の高い代替手段を提供する。
既存の方法は単純にモダリティ固有のサンプルをクラスタリングし、インスタンス・クラスタ間またはクラスタ・クラスタ間相互関連を達成するために強力なアソシエーション技術を用いる。
我々は,USL-VI-ReIDのための動的モダリティ・カメラ不変クラスタリング(DMIC)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 46.63906666692304
- License:
- Abstract: Unsupervised learning visible-infrared person re-identification (USL-VI-ReID) offers a more flexible and cost-effective alternative compared to supervised methods. This field has gained increasing attention due to its promising potential. Existing methods simply cluster modality-specific samples and employ strong association techniques to achieve instance-to-cluster or cluster-to-cluster cross-modality associations. However, they ignore cross-camera differences, leading to noticeable issues with excessive splitting of identities. Consequently, this undermines the accuracy and reliability of cross-modal associations. To address these issues, we propose a novel Dynamic Modality-Camera Invariant Clustering (DMIC) framework for USL-VI-ReID. Specifically, our DMIC naturally integrates Modality-Camera Invariant Expansion (MIE), Dynamic Neighborhood Clustering (DNC) and Hybrid Modality Contrastive Learning (HMCL) into a unified framework, which eliminates both the cross-modality and cross-camera discrepancies in clustering. MIE fuses inter-modal and inter-camera distance coding to bridge the gaps between modalities and cameras at the clustering level. DNC employs two dynamic search strategies to refine the network's optimization objective, transitioning from improving discriminability to enhancing cross-modal and cross-camera generalizability. Moreover, HMCL is designed to optimize instance-level and cluster-level distributions. Memories for intra-modality and inter-modality training are updated using randomly selected samples, facilitating real-time exploration of modality-invariant representations. Extensive experiments have demonstrated that our DMIC addresses the limitations present in current clustering approaches and achieve competitive performance, which significantly reduces the performance gap with supervised methods.
- Abstract(参考訳): 教師なし学習の可視的人物再識別(USL-VI-ReID)は、教師付き手法よりも柔軟で費用対効果の高い代替手段を提供する。
この分野は有望な可能性から注目を集めている。
既存の方法は単純にモダリティ固有のサンプルをクラスタリングし、インスタンス・クラスタ間またはクラスタ・クラスタ間相互関連を達成するために強力なアソシエーション技術を用いる。
しかし、彼らはカメラ間の差異を無視し、アイデンティティの過度な分割で顕著な問題を引き起こした。
結果として、これはクロスモーダルアソシエーションの正確さと信頼性を損なう。
これらの課題に対処するため,USL-VI-ReIDのための動的モダリティ・カメラ不変クラスタリング(DMIC)フレームワークを提案する。
具体的には、DMICは自然にModality-Camera Invariant Expansion (MIE)、Dynamic Neighborhood Clustering (DNC)、Hybrid Modality Contrastive Learning (HMCL)を統合フレームワークに統合し、クラスタリングにおけるクロスモダリティとクロスカメラの相違を解消する。
MIEは、モダリティとカメラの間のギャップをクラスタリングレベルで埋めるために、モダリティ間とカメラ間距離のコーディングを融合する。
DNCは2つの動的探索戦略を用いて、ネットワークの最適化の目的を洗練し、差別性の改善から、クロスモーダルとクロスカメラの一般化性の向上へと移行した。
さらに、HMCLはインスタンスレベルの分散とクラスタレベルの分散を最適化するために設計されている。
モダリティ内およびモダリティ間トレーニングのための記憶は、ランダムに選択されたサンプルを用いて更新され、モダリティ不変表現のリアルタイム探索を容易にする。
大規模な実験により,我々のDMICは,現在のクラスタリング手法の限界に対処し,競合性能を実現し,教師付き手法による性能ギャップを著しく低減することを示した。
関連論文リスト
- Extended Cross-Modality United Learning for Unsupervised Visible-Infrared Person Re-identification [34.93081601924748]
教師なし学習は、ラベルなしのモダリティデータセットからモダリティ不変の特徴を学習することを目的としている。
既存の手法では、クロスモダリティクラスタリングが欠如し、クラスタレベルの関連性を過度に追求する。
拡張Modality-Camera Clustering (EMCC) と Two-Step Memory Updating Strategy (TSMem) を併用した拡張Modality-Camera Clustering (EMCC) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-26T09:30:26Z) - Unleashing Network Potentials for Semantic Scene Completion [50.95486458217653]
本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。
AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。
AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2024-03-12T11:48:49Z) - Exploring Homogeneous and Heterogeneous Consistent Label Associations for Unsupervised Visible-Infrared Person ReID [57.500045584556794]
均質かつ不均一なインスタンスレベルの構造を同時に説明できるModality-Unified Label Transfer (MULT) モジュールを導入する。
提案したMULTは、生成した擬似ラベルがモダリティ間の整合性を維持しつつ、モダリティ内の構造的整合性を維持することを保証する。
実験の結果,提案手法は既存のUSL-VI-ReID法よりも優れていた。
論文 参考訳(メタデータ) (2024-02-01T15:33:17Z) - Multi-Memory Matching for Unsupervised Visible-Infrared Person Re-Identification [30.983346937558743]
USL-VI-ReIDの主な課題は、擬似ラベルを効果的に生成し、擬似ラベル対応を確立することである。
我々はUSL-VI-ReIDのためのマルチメモリマッチングフレームワークを提案する。
公開SYSU-MM01とRegDBデータセットの実験は、確立された相互モダリティ対応の信頼性を示す。
論文 参考訳(メタデータ) (2024-01-12T01:24:04Z) - Unsupervised Visible-Infrared Person ReID by Collaborative Learning with Neighbor-Guided Label Refinement [53.044703127757295]
教師なし学習 可視赤外人物再識別 (USL-VI-ReID) は、ラベルなしのクロスモダリティデータセットからモダリティ不変の特徴を学習することを目的としている。
本稿では,生成したラベルを1つのモダリティからそれに対応するモダリティに同時に割り当てる,Dual Optimal Transport Label Assignment (DOTLA) フレームワークを提案する。
提案したDOTLA機構は、相互強化と相互モダリティデータアソシエーションの効率的な解を定式化することにより、不十分でノイズの多いラベルアソシエーションの副作用を効果的に低減することができる。
論文 参考訳(メタデータ) (2023-05-22T04:40:30Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - Dynamic Clustering and Cluster Contrastive Learning for Unsupervised
Person Re-identification [29.167783500369442]
教師なしRe-ID手法は、ラベルのないデータから堅牢で差別的な特徴を学習することを目的としている。
本稿では,動的クラスタリングとクラスタコントラスト学習(DCCC)手法を提案する。
提案したDCCCの有効性を検証するために, 広く利用されている複数の公開データセットの実験を行った。
論文 参考訳(メタデータ) (2023-03-13T01:56:53Z) - Weakly supervised segmentation with cross-modality equivariant
constraints [7.757293476741071]
弱い教師付き学習は、セマンティックセグメンテーションにおける大きなラベル付きデータセットの必要性を軽減するための魅力的な代替手段として登場した。
本稿では,マルチモーダル画像シナリオにおける自己スーパービジョンを活用した新しい学習戦略を提案する。
私たちのアプローチは、同じ学習条件下で関連する最近の文学を上回ります。
論文 参考訳(メタデータ) (2021-04-06T13:14:20Z) - Contradictory Structure Learning for Semi-supervised Domain Adaptation [67.89665267469053]
現在の逆順応法は、クロスドメインの特徴を整列させようとする。
1)条件分布ミスマッチ、2)決定境界のソース領域へのバイアス。
本稿では,対向構造の学習を統一することで,半教師付きドメイン適応のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-06T22:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。