論文の概要: DPM++: Dynamic Masked Metric Learning for Occluded Person Re-identification
- arxiv url: http://arxiv.org/abs/2605.06637v1
- Date: Thu, 07 May 2026 17:47:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:12.058874
- Title: DPM++: Dynamic Masked Metric Learning for Occluded Person Re-identification
- Title(参考訳): DPM++: Occluded Person Re-identificationのための動的マスケードメトリックラーニング
- Authors: Lei Tan, Yingshi Luan, Pincong Zou, Pingyang Dai, Liujuan Cao,
- Abstract要約: DPM++は、排除された人物の再識別のための動的マスクドメトリックラーニングフレームワークである。
入力適応マスク付きメトリックを学習し、隠蔽されたインスタンスごとに信頼性の高いIDサブスペースを動的に選択する。
全体的なシナリオと排他的シナリオの両方において、従来の最先端の手法を一貫して上回ります。
- 参考スコア(独自算出の注目度): 32.9985650634494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although person re-identification has made impressive progress, occlusion caused by obstacles remains an unsettled issue in real applications. The difficulty lies in the mismatch between incomplete occluded samples and holistic identity representations. Severe occlusion removes discriminative body cues and introduces interference from background clutter and occluders, making global metric learning unreliable. Existing methods mainly rely on extra pre-trained models to estimate visible parts for alignment or construct occluded samples via data augmentation, but still lack a unified framework that learns robust visibility-consistent matching under realistic occlusion patterns. In this paper, we propose DPM++, a Dynamic Masked Metric Learning framework for occluded person re-identification. DPM++ learns an input-adaptive masked metric that dynamically selects reliable identity subspaces for each occluded instance, enabling matching to emphasize visibility-consistent evidence while suppressing unreliable components. Built upon the classifier-prototype space, DPM++ introduces a CLIP-based two-stage supervision scheme, where ID-level semantic priors are learned from the text branch and transferred into the classifier-prototype space for dynamic masked matching. To strengthen the masked metric, we introduce a saliency-guided patch transfer strategy to synthesize controllable and photo-realistic occluded samples during training. Exploiting real scene priors, this strategy exposes the model to realistic partial observations and provides richer supervision than random erasing. In addition, occlusion-aware sample pairing and mask-guided optimization improve the stability and effectiveness of the framework. Experiments on occluded and holistic person re-identification benchmarks show that DPM++ consistently outperforms previous state-of-the-art methods in both holistic and occlusion scenarios.
- Abstract(参考訳): 人物の再識別は目覚ましい進歩を遂げたものの、障害による閉塞は、実際のアプリケーションでは未解決の問題のままである。
難しさは、不完全閉塞標本と全体的同一性表現のミスマッチにある。
重度の閉塞は、差別的な身体の手がかりを取り除き、背景クラッタや咬合器からの干渉を導入し、グローバルなメートル法学習を信頼できないものにする。
既存の手法は主に、データ拡張を通じて、アライメントや隠蔽されたサンプルを推定するために、事前訓練された余分なモデルを頼っているが、現実的な閉塞パターンの下で堅牢な可視性マッチングを学ぶ統一されたフレームワークはいまだに欠けている。
本稿では,隠蔽された人物の再識別のための動的マスケードメトリック学習フレームワークであるDPM++を提案する。
DPM++は入力適応型マスク付きメトリックを学習し、ブロックされた各インスタンスの信頼性の高いIDサブスペースを動的に選択し、マッチングにより、信頼性の低いコンポーネントを抑えながら、可視性のあるエビデンスを強調することができる。
分類器-プロトタイプ空間に基づいて構築されたDPM++は、CLIPベースの2段階監視スキームを導入し、IDレベルのセマンティックプリミティブをテキストブランチから学習し、動的マスクマッチングのために分類器-プロトタイプ空間に転送する。
マスク付き測定値を強化するため、トレーニング中に可制御性および光リアルな隠蔽サンプルを合成するサリエンシ誘導パッチ転送戦略を導入する。
この戦略は、現実的な部分的な観察にモデルを公開し、ランダムな消去よりもリッチな監視を提供する。
さらに、オクルージョン対応サンプルペアリングとマスク誘導最適化により、フレームワークの安定性と有効性が改善される。
包括的および包括的人物再識別ベンチマークの実験は、DPM++が包括的および包括的シナリオの両方において、従来の最先端メソッドを一貫して上回っていることを示している。
関連論文リスト
- Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
異常セグメンテーションのための textbfSelf-textbfPerceptinon textbfTuning (textbfSPT) 法を提案する。
SPT法は, 自己描画型チューニング戦略を取り入れ, 異常マスクの初期粗いドラフトを生成し, 精製処理を行う。
論文 参考訳(メタデータ) (2024-11-26T08:33:25Z) - Exploring Stronger Transformer Representation Learning for Occluded Person Re-Identification [2.552131151698595]
我々はトランスフォーマーに基づく人物識別フレームワークであるSSSC-TransReIDを組み合わせた新しい自己監督・監督手法を提案した。
我々は、ネガティブなサンプルや追加の事前学習なしに、人物の再識別のための特徴表現を強化することができる自己教師付きコントラスト学習ブランチを設計した。
提案モデルでは, 平均平均精度(mAP) とランク1の精度において, 最先端のReID手法よりも優れたRe-ID性能が得られ, 高いマージンで性能が向上する。
論文 参考訳(メタデータ) (2024-10-21T03:17:25Z) - Dynamic Patch-aware Enrichment Transformer for Occluded Person
Re-Identification [14.219232629274186]
DPEFormer(Dynamic Patch-aware Enrichment Transformer)と呼ばれるエンドツーエンドのソリューションを提案する。
このモデルは,人体情報と隠蔽情報を自動的かつ動的に識別する。
DPSM と DPEFormer 全体が識別ラベルのみを用いて効果的に学習できることを保証するため,本手法では,実効性を有する Occlusion Augmentation (ROA) 戦略も提案する。
論文 参考訳(メタデータ) (2024-02-16T03:53:30Z) - Unsupervised Continual Anomaly Detection with Contrastively-learned
Prompt [80.43623986759691]
UCADと呼ばれる新しい非教師付き連続異常検出フレームワークを提案する。
このフレームワークは、対照的に学習したプロンプトを通じて、UDAに継続的な学習能力を持たせる。
我々は総合的な実験を行い、教師なし連続異常検出とセグメンテーションのベンチマークを設定した。
論文 参考訳(メタデータ) (2024-01-02T03:37:11Z) - Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。