論文の概要: Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification
- arxiv url: http://arxiv.org/abs/2502.06619v1
- Date: Mon, 10 Feb 2025 16:16:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:31:31.162477
- Title: Unleashing the Potential of Pre-Trained Diffusion Models for Generalizable Person Re-Identification
- Title(参考訳): 一般化可能な人物再同定のための事前学習拡散モデルの可能性
- Authors: Jiachen Li, Xiaojin Gong,
- Abstract要約: ドメイン一般化可能な再識別(DG Re-ID)は、1つ以上のソースドメインでモデルをトレーニングし、目に見えないターゲットドメインのパフォーマンスを評価することを目的としている。
相関型条件付スキームを用いた拡散モデル支援表現学習法を提案する。
本手法は,相関型条件付スキームを用いて,差別的でコントラストのあるRe-IDモデルと事前学習した拡散モデルを統合する。
- 参考スコア(独自算出の注目度): 11.08111819781513
- License:
- Abstract: Domain-generalizable re-identification (DG Re-ID) aims to train a model on one or more source domains and evaluate its performance on unseen target domains, a task that has attracted growing attention due to its practical relevance. While numerous methods have been proposed, most rely on discriminative or contrastive learning frameworks to learn generalizable feature representations. However, these approaches often fail to mitigate shortcut learning, leading to suboptimal performance. In this work, we propose a novel method called diffusion model-assisted representation learning with a correlation-aware conditioning scheme (DCAC) to enhance DG Re-ID. Our method integrates a discriminative and contrastive Re-ID model with a pre-trained diffusion model through a correlation-aware conditioning scheme. By incorporating ID classification probabilities generated from the Re-ID model with a set of learnable ID-wise prompts, the conditioning scheme injects dark knowledge that captures ID correlations to guide the diffusion process. Simultaneously, feedback from the diffusion model is back-propagated through the conditioning scheme to the Re-ID model, effectively improving the generalization capability of Re-ID features. Extensive experiments on both single-source and multi-source DG Re-ID tasks demonstrate that our method achieves state-of-the-art performance. Comprehensive ablation studies further validate the effectiveness of the proposed approach, providing insights into its robustness. Codes will be available at https://github.com/RikoLi/DCAC.
- Abstract(参考訳): ドメイン一般化可能な再識別(DG Re-ID)は、1つ以上のソースドメイン上でモデルをトレーニングし、未確認のターゲットドメインのパフォーマンスを評価することを目的としている。
多くの手法が提案されているが、ほとんどの場合、一般化可能な特徴表現を学習するために差別的あるいは対照的な学習フレームワークに依存している。
しかし、これらのアプローチはしばしばショートカット学習の軽減に失敗し、亜最適性能をもたらす。
本研究では,DG Re-IDを向上させるために,相関対応条件付きスキーム(DCAC)を用いた拡散モデル支援表現学習法を提案する。
本手法は,相関型条件付スキームを用いて,差別的でコントラストのあるRe-IDモデルと事前学習した拡散モデルを統合する。
Re-IDモデルから生成されたID分類確率を学習可能なIDワイドプロンプトのセットに組み込むことで、条件付けスキームは、ID相関を捉えた暗黒の知識を注入して拡散過程を導出する。
同時に、拡散モデルからのフィードバックは条件付けスキームからRe-IDモデルへのバックプロパゲートされ、Re-ID特徴の一般化能力を効果的に向上する。
単一ソースと複数ソースのDG Re-IDタスクに対する大規模な実験により,本手法が最先端の性能を実現することを示す。
包括的アブレーション研究は、提案手法の有効性をさらに検証し、その堅牢性に関する洞察を与える。
コードはhttps://github.com/RikoLi/DCAC.comで入手できる。
関連論文リスト
- Efficient Multi-Model Fusion with Adversarial Complementary Representation Learning [26.393644289860084]
単一モデルシステムは、話者検証(SV)や画像分類といったタスクにおいて、しばしば欠陥に悩まされる。
本稿では、新たに訓練されたモデルが以前取得した知識を回避できる逆相補表現学習(ACoRL)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-24T07:47:55Z) - Model Will Tell: Training Membership Inference for Diffusion Models [15.16244745642374]
トレーニングメンバーシップ推論(TMI)タスクは、ターゲットモデルのトレーニングプロセスで特定のサンプルが使用されているかどうかを判断することを目的としている。
本稿では,拡散モデル内における本質的な生成先行情報を活用することで,TMIタスクの新たな視点を探求する。
論文 参考訳(メタデータ) (2024-03-13T12:52:37Z) - Bridging Generative and Discriminative Models for Unified Visual
Perception with Diffusion Priors [56.82596340418697]
本稿では,豊富な生成前駆体を含む事前学習型安定拡散(SD)モデルと,階層的表現を統合可能な統一型ヘッド(Uヘッド)と,識別前駆体を提供する適応型専門家からなる,シンプルで効果的なフレームワークを提案する。
包括的調査では、異なる時間ステップで潜伏変数に隠された知覚の粒度や様々なU-netステージなど、バーマスの潜在的な特性が明らかになった。
有望な結果は,有望な学習者としての拡散モデルの可能性を示し,情報的かつ堅牢な視覚表現の確立にその意義を定めている。
論文 参考訳(メタデータ) (2024-01-29T10:36:57Z) - Mitigate Domain Shift by Primary-Auxiliary Objectives Association for
Generalizing Person ReID [39.98444065846305]
ReIDモデルは、インスタンス分類の目的に関するトレーニングを通じてのみドメイン不変表現を学ぶのに苦労します。
本稿では,弱いラベル付き歩行者唾液度検出のための補助学習目標を用いて,プライマリReIDインスタンス分類目標のモデル学習を指導する手法を提案する。
我々のモデルは、最近のテストタイムダイアグラムで拡張してPAOA+を形成し、補助的な目的に対してオンザフライ最適化を行うことができる。
論文 参考訳(メタデータ) (2023-10-24T15:15:57Z) - Leveraging Diffusion Disentangled Representations to Mitigate Shortcuts
in Underspecified Visual Tasks [92.32670915472099]
拡散確率モデル(DPM)を用いた合成カウンターファクトの生成を利用したアンサンブルの多様化フレームワークを提案する。
拡散誘導型分散化は,データ収集を必要とする従来の手法に匹敵するアンサンブル多様性を達成し,ショートカットからの注意を回避できることを示す。
論文 参考訳(メタデータ) (2023-10-03T17:37:52Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - GaitGCI: Generative Counterfactual Intervention for Gait Recognition [15.348742723718964]
Gaitは、歩行者を歩行パターンから識別することを目的とした、最も有望なバイオメトリクスの1つだ。
一般的な手法は共同設立者には受け入れられず、結果としてネットワークは効果的な歩行パターンを反映する領域にほとんど焦点を合わせない。
本稿では、対実干渉学習(CIL)と多様性制約動的畳み込み(DCDC)からなる、GaitGCIと呼ばれる生成対実干渉フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-06T05:59:23Z) - Feature Diversity Learning with Sample Dropout for Unsupervised Domain
Adaptive Person Re-identification [0.0]
本稿では,ノイズの多い擬似ラベルを限定することで,より優れた一般化能力を持つ特徴表現を学習する手法を提案する。
我々は,古典的な相互学習アーキテクチャの下で,FDL(Feature Diversity Learning)と呼ばれる新しい手法を提案する。
実験の結果,提案するFDL-SDは,複数のベンチマークデータセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-01-25T10:10:48Z) - A Novel Mix-normalization Method for Generalizable Multi-source Person
Re-identification [49.548815417844786]
人物再識別(Re-ID)は、監督されたシナリオにおいて大きな成功を収めた。
モデルがソースドメインに過度に適合するため、教師付きモデルを任意の未確認領域に直接転送することは困難である。
ドメイン・アウェア・ミックス正規化(DMN)とドメイン・ウェア・センター正規化(DCR)からなるMixNormを提案する。
論文 参考訳(メタデータ) (2022-01-24T18:09:38Z) - Learning Domain Invariant Representations for Generalizable Person
Re-Identification [71.35292121563491]
ReID(Generalizable person Re-Identification)は、最近のコンピュータビジョンコミュニティで注目を集めている。
DIR-ReID(Domain Invariant Representations for Generalizable Person Re-Identification)という新しい一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-29T18:59:48Z) - Multi-Domain Adversarial Feature Generalization for Person
Re-Identification [52.835955258959785]
マルチデータセット特徴一般化ネットワーク(MMFA-AAE)を提案する。
複数のラベル付きデータセットから普遍的なドメイン不変の特徴表現を学習し、それを見えないカメラシステムに一般化することができる。
また、最先端の教師付き手法や教師なしのドメイン適応手法を大きなマージンで超えている。
論文 参考訳(メタデータ) (2020-11-25T08:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。