論文の概要: PGDS: Pose-Guidance Deep Supervision for Mitigating Clothes-Changing in Person Re-Identification
- arxiv url: http://arxiv.org/abs/2312.05634v3
- Date: Sat, 1 Jun 2024 05:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-04 20:01:52.199578
- Title: PGDS: Pose-Guidance Deep Supervision for Mitigating Clothes-Changing in Person Re-Identification
- Title(参考訳): PGDS:Pse-Guidance Deep Supervision for Mitigating Clothes-Changing in Person Redentification
- Authors: Quoc-Huy Trinh, Nhat-Tan Bui, Dinh-Hieu Hoang, Phuoc-Thao Vo Thi, Hai-Dang Nguyen, Debesh Jha, Ulas Bagci, Ngan Le, Minh-Triet Tran,
- Abstract要約: 個人再識別(Re-ID)タスクは、監視カメラによる複数の個人追跡を強化することを目的としている。
Re-IDで直面する最も重要な課題の1つは着替えであり、同じ人が異なる衣装に現れる可能性がある。
Re-IDタスク内でポーズガイダンスを学習するための効果的なフレームワークである Pose-Guidance Deep Supervision (PGDS) を提案する。
- 参考スコア(独自算出の注目度): 10.140070649542949
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person Re-Identification (Re-ID) task seeks to enhance the tracking of multiple individuals by surveillance cameras. It supports multimodal tasks, including text-based person retrieval and human matching. One of the most significant challenges faced in Re-ID is clothes-changing, where the same person may appear in different outfits. While previous methods have made notable progress in maintaining clothing data consistency and handling clothing change data, they still rely excessively on clothing information, which can limit performance due to the dynamic nature of human appearances. To mitigate this challenge, we propose the Pose-Guidance Deep Supervision (PGDS), an effective framework for learning pose guidance within the Re-ID task. It consists of three modules: a human encoder, a pose encoder, and a Pose-to-Human Projection module (PHP). Our framework guides the human encoder, i.e., the main re-identification model, with pose information from the pose encoder through multiple layers via the knowledge transfer mechanism from the PHP module, helping the human encoder learn body parts information without increasing computation resources in the inference stage. Through extensive experiments, our method surpasses the performance of current state-of-the-art methods, demonstrating its robustness and effectiveness for real-world applications. Our code is available at https://github.com/huyquoctrinh/PGDS.
- Abstract(参考訳): 個人再識別(Re-ID)タスクは、監視カメラによる複数の個人追跡を強化することを目的としている。
テキストベースの人物検索や人間のマッチングなど、マルチモーダルタスクをサポートする。
Re-IDで直面する最も重要な課題の1つは着替えであり、同じ人が異なる衣装に現れる可能性がある。
従来は衣服データの整合性維持や衣服の変化データ処理において顕著な進歩を遂げてきたが、外見のダイナミックな性質によって性能が制限されるため、服の情報に過度に依存している。
この課題を軽減するために,Re-IDタスク内でポーズガイダンスを学習するための効果的なフレームワークである Pose-Guidance Deep Supervision (PGDS) を提案する。
人間エンコーダ、ポーズエンコーダ、Pose-to-Human Projectionモジュール(PHP)の3つのモジュールで構成されている。
本稿では,PHPモジュールからの知識伝達機構を介し,ポーズエンコーダから複数のレイヤを通してポーズ情報を抽出し,推論段階において計算資源を増大させることなく,人間のエンコーダが情報の一部を学習するのを支援する。
大規模な実験を通じて,本手法は現在の最先端手法の性能を超越し,実世界の応用におけるロバスト性と有効性を示す。
私たちのコードはhttps://github.com/huyquoctrinh/PGDS.comで公開されています。
関連論文リスト
- RefHCM: A Unified Model for Referring Perceptions in Human-Centric Scenarios [60.772871735598706]
RefHCM(Referring Human-Centric Model)は、人間中心の幅広い参照タスクを統合するためのフレームワークである。
RefHCMは、画像、テキスト、座標、パースマップを含む生のマルチモーダルデータをセマンティックトークンに変換するためにシーケンスマージを採用している。
この研究は、一般的なフレームワークで人間の知覚を参照しようとする最初の試みである。
論文 参考訳(メタデータ) (2024-12-19T08:51:57Z) - UniPose: A Unified Multimodal Framework for Human Pose Comprehension, Generation and Editing [79.68232381605661]
さまざまなモダリティにまたがって人間のポーズを理解し、生成し、編集するためのフレームワークであるUniPoseを提案する。
具体的には、3Dポーズを個別のポーズトークンに変換するためにポーズトークンライザを適用し、統一語彙内のLCMへのシームレスな統合を可能にする。
統一的な学習戦略から恩恵を受けるUniPoseは、さまざまなポーズ関連タスク間で知識を効果的に伝達し、目に見えないタスクに適応し、拡張された能力を示す。
論文 参考訳(メタデータ) (2024-11-25T08:06:30Z) - Identity-Sensitive Knowledge Propagation for Cloth-Changing Person
Re-identification [17.588668735411783]
衣服交換者再識別(CC-ReID)は、衣服の変化による人物の身元を一致させることを目的としている。
典型的なバイオメトリックスに基づくCC-ReID法は、人間の生体特性から布に関係のない特徴を学習するために、面倒なポーズや身体部分の推定器を必要とする。
本稿では,CC-ReIDのための効果的なアイデンティティ・センシティブな知識伝達フレームワーク(DeSKPro)を提案する。
我々のフレームワークは最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-08-25T12:01:49Z) - Motion-Aware Transformer For Occluded Person Re-identification [1.9899263094148867]
本研究では,非閉塞者Re-IDを用いた自己教師型深層学習手法を提案する。
従来の研究とは異なり、さまざまな姿勢の写真から得られる動き情報は、主要な人間の身体成分を識別するのに役立ちます。
論文 参考訳(メタデータ) (2022-02-09T02:53:10Z) - Multigranular Visual-Semantic Embedding for Cloth-Changing Person
Re-identification [38.7806002518266]
本研究は, 布を交換するReIDのための新しいビジュアル・セマンティック・埋め込み・アルゴリズム(MVSE)を提案する。
衣服の変化のある人を完全に表現するために、多粒性特徴表現スキーム(MGR)を採用し、その後、布脱感ネットワーク(CDN)を設計する。
人的属性の整合に使用される視覚意味情報を得るために,部分意味整合ネットワーク(PSA)を提案する。
論文 参考訳(メタデータ) (2021-08-10T09:14:44Z) - PoseTrackReID: Dataset Description [97.7241689753353]
詩情報は、背景や閉塞音から有用な特徴情報を遠ざけるのに役立つ。
PoseTrackReIDでは、人物のリIDと複数人のポーズトラッキングのギャップを埋めたいと考えています。
このデータセットは、マルチフレームの人物のre-IDに関する現在の最先端メソッドに対する優れたベンチマークを提供する。
論文 参考訳(メタデータ) (2020-11-12T07:44:25Z) - Unsupervised 3D Human Pose Representation with Viewpoint and Pose
Disentanglement [63.853412753242615]
優れた3次元ポーズ表現を学習することは、人間のポーズ関連タスクにとって重要である。
本稿では,3次元ポーズ表現を学習するために,新しいシームズ・デノナイズドオートエンコーダを提案する。
提案手法は,2つの本質的に異なるタスクに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-07-14T14:25:22Z) - Long-Term Cloth-Changing Person Re-identification [154.57752691285046]
人物再識別(Re-ID)は、異なる場所や時間におけるカメラビュー間で対象人物をマッチングすることを目的としている。
既存のRe-ID研究は、ある人が同じ服装で異なるカメラビューに再び現れる、短期的な布一貫した環境に焦点を当てている。
本研究は,例えば,何日,何ヶ月にもわたって,長期にまたがって人とのマッチングを行う,はるかに困難かつ実践的な環境に焦点をあてる。
論文 参考訳(メタデータ) (2020-05-26T11:27:21Z) - Intra-Camera Supervised Person Re-Identification [87.88852321309433]
本稿では,カメラごとの個人識別アノテーションに基づく新しい人物識別パラダイムを提案する。
これにより、最も時間がかかり、面倒なカメラ間IDラベリングプロセスがなくなる。
MATE(Multi-tAsk mulTi-labEl)Deep Learning method for intra-Camera Supervised (ICS) person re-id。
論文 参考訳(メタデータ) (2020-02-12T15:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。