論文の概要: Attention-based Shape and Gait Representations Learning for Video-based
Cloth-Changing Person Re-Identification
- arxiv url: http://arxiv.org/abs/2402.03716v1
- Date: Tue, 6 Feb 2024 05:11:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 16:33:36.173063
- Title: Attention-based Shape and Gait Representations Learning for Video-based
Cloth-Changing Person Re-Identification
- Title(参考訳): 映像に基づく衣服交換者再識別のための注意型形状と歩行表現学習
- Authors: Vuong D. Nguyen, Samiha Mirza, Pranav Mantini, Shishir K. Shah
- Abstract要約: 我々は「注意に基づく形状と歩行表現学習」(ASGL)を提案することにより、映像ベースの衣服交換者Re-ID(VCCRe-ID)の実践的問題に対処する。
当社のASGLフレームワークは,衣服不変歩行手がかりを学習することにより,衣服変動下でのRe-ID性能を向上させる。
提案するST-GATはマルチヘッドアテンションモジュールから構成されており,歩行埋め込みの堅牢性を高めることができる。
- 参考スコア(独自算出の注目度): 1.6385815610837167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current state-of-the-art Video-based Person Re-Identification (Re-ID)
primarily relies on appearance features extracted by deep learning models.
These methods are not applicable for long-term analysis in real-world scenarios
where persons have changed clothes, making appearance information unreliable.
In this work, we deal with the practical problem of Video-based Cloth-Changing
Person Re-ID (VCCRe-ID) by proposing "Attention-based Shape and Gait
Representations Learning" (ASGL) for VCCRe-ID. Our ASGL framework improves
Re-ID performance under clothing variations by learning clothing-invariant gait
cues using a Spatial-Temporal Graph Attention Network (ST-GAT). Given the
3D-skeleton-based spatial-temporal graph, our proposed ST-GAT comprises
multi-head attention modules, which are able to enhance the robustness of gait
embeddings under viewpoint changes and occlusions. The ST-GAT amplifies the
important motion ranges and reduces the influence of noisy poses. Then, the
multi-head learning module effectively reserves beneficial local temporal
dynamics of movement. We also boost discriminative power of person
representations by learning body shape cues using a GAT. Experiments on two
large-scale VCCRe-ID datasets demonstrate that our proposed framework
outperforms state-of-the-art methods by 12.2% in rank-1 accuracy and 7.0% in
mAP.
- Abstract(参考訳): 現在最先端のビデオベースPerson Re-Identification (Re-ID)は、主にディープラーニングモデルによって抽出された外観特徴に依存している。
これらの方法は、着替えた人が実世界のシナリオで長期分析に当てはまらないため、外観情報が信頼できない。
本稿では、VCCRe-IDのための「注意に基づく形状と歩行表現学習」(ASGL)を提案することにより、ビデオベースの衣服交換者Re-ID(VCCRe-ID)の実践的問題に対処する。
我々のASGLフレームワークは,空間時空間グラフアテンションネットワーク(ST-GAT)を用いて衣服不変歩行キューを学習することにより,衣服の変動下でのRe-ID性能を向上させる。
提案するST-GATは,3次元スケルトンに基づく時空間時間グラフを考慮し,視点変化や閉塞下での歩行埋め込みの堅牢性を高めることができるマルチヘッドアテンションモジュールを備える。
ST-GATは重要な動き範囲を増幅し、ノイズポーズの影響を低減する。
そして、マルチヘッド学習モジュールは、有効な局所時間的運動動態を効果的に予約する。
また,GATを用いて身体形状の手がかりを学習することで,人物表現の識別力を高める。
大規模VCCRe-IDデータセットの2つの実験により、提案するフレームワークは、ランク1の精度で12.2%、mAPで7.0%、最先端の手法より優れていることが示された。
関連論文リスト
- Multiple Information Prompt Learning for Cloth-Changing Person Re-Identification [17.948263914620238]
布を交換するReIDのためのMIPL(Multiple Information prompt Learning)方式を提案する。
CISモジュールは、衣料品情報を元のRGBイメージ機能から切り離すように設計されている。
The Bio-guided attention (BGA) module is proposed to increase the learning intensity of the model for key information。
論文 参考訳(メタデータ) (2024-11-01T03:08:10Z) - Exploring Stronger Transformer Representation Learning for Occluded Person Re-Identification [2.552131151698595]
我々はトランスフォーマーに基づく人物識別フレームワークであるSSSC-TransReIDを組み合わせた新しい自己監督・監督手法を提案した。
我々は、ネガティブなサンプルや追加の事前学習なしに、人物の再識別のための特徴表現を強化することができる自己教師付きコントラスト学習ブランチを設計した。
提案モデルでは, 平均平均精度(mAP) とランク1の精度において, 最先端のReID手法よりも優れたRe-ID性能が得られ, 高いマージンで性能が向上する。
論文 参考訳(メタデータ) (2024-10-21T03:17:25Z) - MIMAFace: Face Animation via Motion-Identity Modulated Appearance Feature Learning [30.61146302275139]
動作レベルと同一性レベルの両方でCLIP特徴を変調する動き入出力学習モジュール(MIA)を導入する。
また、クリップ間の時間関係をモデル化するICA(Inter-Clip Affinity Learning Module)を設計する。
提案手法は, 表情と視線を正確に制御し, 忠実なアイデンティティを保存し, クリック内時間的整合性を維持するアニメーション映像を生成する。
論文 参考訳(メタデータ) (2024-09-23T16:33:53Z) - Tran-GCN: A Transformer-Enhanced Graph Convolutional Network for Person Re-Identification in Monitoring Videos [8.559235103954341]
Person Re-Identification (Re-ID) はコンピュータビジョンで人気を博し、クロスカメラの歩行者認識を可能にしている。
監視ビデオにおける人物識別性能を向上させるために,トランスフォーマー強化グラフ畳み込みネットワーク(Tran-GCN)モデルを提案する。
論文 参考訳(メタデータ) (2024-09-14T09:42:48Z) - Exploring Fine-Grained Representation and Recomposition for Cloth-Changing Person Re-Identification [78.52704557647438]
補助的なアノテーションやデータなしに両方の制約に対処するために,新しいFIne-fine Representation and Recomposition (FIRe$2$) フレームワークを提案する。
FIRe$2$は、広く使われている5つのRe-IDベンチマークで最先端のパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2023-08-21T12:59:48Z) - Distillation-guided Representation Learning for Unconstrained Gait Recognition [50.0533243584942]
本研究では,屋外シナリオにおける人間認証のためのGADER(GAit Detection and Recognition)フレームワークを提案する。
GADERは、歩行情報を含むフレームのみを使用する新しい歩行認識手法により識別的特徴を構築する。
室内および屋外のデータセットに一貫した改善を示すため,複数の歩行ベースライン(SoTA)について評価を行った。
論文 参考訳(メタデータ) (2023-07-27T01:53:57Z) - Shape-Erased Feature Learning for Visible-Infrared Person
Re-Identification [90.39454748065558]
体型は、VI-ReIDにとって重要なモダリティシェードの1つである。
本稿では,2つの部分空間におけるモダリティ共有特徴を関連づける形状学習パラダイムを提案する。
SYSU-MM01, RegDB, HITSZ-VCMデータセットを用いた実験により, 本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-04-09T10:22:10Z) - Feature Disentanglement Learning with Switching and Aggregation for
Video-based Person Re-Identification [9.068045610800667]
映像人物再識別(Re-ID)では、連続したフレームから対象人物の特徴を一貫して抽出する必要がある。
既存の手法は時間的情報の使用方法にのみ焦点をあてる傾向があり、しばしばネットワークは同じような外観と同じ背景に騙される。
本稿では,DSANet(Disentanglement and Switching and Aggregation Network)を提案する。
論文 参考訳(メタデータ) (2022-12-16T04:27:56Z) - A High-Accuracy Unsupervised Person Re-identification Method Using
Auxiliary Information Mined from Datasets [53.047542904329866]
マルチモーダルな特徴学習のためのデータセットから抽出した補助情報を利用する。
本稿では,Restricted Label Smoothing Cross Entropy Loss (RLSCE), Weight Adaptive Triplet Loss (WATL), Dynamic Training Iterations (DTI)の3つの効果的なトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-05-06T10:16:18Z) - TCGL: Temporal Contrastive Graph for Self-supervised Video
Representation Learning [79.77010271213695]
本稿では,TCGL(Temporal Contrastive Graph Learning)という,ビデオの自己教師型学習フレームワークを提案する。
TCGLは、フレームとスニペットの順序に関する以前の知識をグラフ構造、すなわち、インター/インタースニペットの時間トラストグラフ(TCG)に統合します。
ラベルなしビデオの監視信号を生成するために,適応スニペット順序予測(ASOP)モジュールを導入する。
論文 参考訳(メタデータ) (2021-12-07T09:27:56Z) - A Self-Supervised Gait Encoding Approach with Locality-Awareness for 3D
Skeleton Based Person Re-Identification [65.18004601366066]
3Dスケルトン配列内の歩行特徴による人物再識別(Re-ID)は、いくつかの利点を持つ新しい話題である。
本稿では、ラベルのない骨格データを利用して人物の歩行表現を学習できる自己教師付き歩行符号化手法を提案する。
論文 参考訳(メタデータ) (2020-09-05T16:06:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。