論文の概要: A Deep Hierarchical Feature Sparse Framework for Occluded Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2401.07469v1
- Date: Mon, 15 Jan 2024 04:51:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 18:12:03.220665
- Title: A Deep Hierarchical Feature Sparse Framework for Occluded Person
Re-Identification
- Title(参考訳): 人物再同定のための階層的特徴スパースフレームワーク
- Authors: Yihu Song and Shuaishi Liu
- Abstract要約: SuReIDという名前のスピードアップ人用ReIDフレームワークは、推論を高速化しながら閉塞干渉を軽減するために提案される。
実験の結果,SUReIDは驚くほど高速な推論で優れた性能を発揮することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing methods tackle the problem of occluded person re-identification
(ReID) by utilizing auxiliary models, resulting in a complicated and
inefficient ReID framework that is unacceptable for real-time applications. In
this work, a speed-up person ReID framework named SUReID is proposed to
mitigate occlusion interference while speeding up inference. The SUReID
consists of three key components: hierarchical token sparsification (HTS)
strategy, non-parametric feature alignment knowledge distillation (NPKD), and
noise occlusion data augmentation (NODA). The HTS strategy works by pruning the
redundant tokens in the vision transformer to achieve highly effective
self-attention computation and eliminate interference from occlusions or
background noise. However, the pruned tokens may contain human part features
that contaminate the feature representation and degrade the performance. To
solve this problem, the NPKD is employed to supervise the HTS strategy,
retaining more discriminative tokens and discarding meaningless ones.
Furthermore, the NODA is designed to introduce more noisy samples, which
further trains the ability of the HTS to disentangle different tokens.
Experimental results show that the SUReID achieves superior performance with
surprisingly fast inference.
- Abstract(参考訳): 既存のほとんどの手法は補助モデルを利用することで隠蔽された人物再識別(ReID)の問題に取り組み、結果としてリアルタイムアプリケーションでは受け入れられない複雑で非効率なReIDフレームワークが実現される。
本研究では,SuReIDというスピードアップ人用ReIDフレームワークを提案し,推論を高速化しながら閉塞干渉を軽減する。
SUReIDは、階層的トークンスペーシフィケーション(HTS)戦略、非パラメトリックな特徴アライメント知識蒸留(NPKD)、ノイズ閉塞データ拡張(NODA)という3つの重要な構成要素から構成される。
HTS戦略は、視覚変換器に冗長トークンを刻み込み、高効率な自己注意計算を実現し、閉塞やバックグラウンドノイズからの干渉を取り除くことで機能する。
しかし、プルーンドトークンには特徴表現を汚染し、性能を低下させる人間の部分的特徴が含まれている可能性がある。
この問題を解決するため、NPKDはHTS戦略を監督し、より差別的なトークンを保持し、意味のないトークンを捨てる。
さらにNODAは、よりノイズの多いサンプルを導入するように設計されており、HTSが異なるトークンをアンタングルする能力をさらに訓練する。
実験の結果,SUReIDは驚くほど高速な推論で優れた性能を発揮することがわかった。
関連論文リスト
- DDRN:a Data Distribution Reconstruction Network for Occluded Person Re-Identification [5.7703191981015305]
本研究では,データ分布を利用した生成モデルを提案し,無関係な詳細をフィルタリングする。
Occluded-Dukeデータセットでは、62.4%(+1.1%)のmAPと71.3%(+0.6%)のランク1の精度を達成した。
論文 参考訳(メタデータ) (2024-10-09T06:52:05Z) - Part Representation Learning with Teacher-Student Decoder for Occluded
Person Re-identification [65.63180725319906]
本稿では,隠蔽者ReIDのためのTSD(Teacher-Student Decoder)フレームワークを提案する。
提案するTSDは,Parsing-aware Teacher Decoder (PTD) と標準学生デコーダ (SSD) から構成される。
論文 参考訳(メタデータ) (2023-12-15T13:54:48Z) - Erasing, Transforming, and Noising Defense Network for Occluded Person
Re-Identification [36.91680117072686]
我々は,隠蔽された人物のリIDを解決するために,ETNDNet(Easing, Transforming, and Noising Defense Network)を提案する。
提案するETNDNetでは,特徴マップをランダムに消去し,不完全な情報を持つ逆表現を生成する。
第3に、障害物や歩行者以外の歩行者が導入したノイズ情報に対処するために、ランダムな値で特徴マップを摂動する。
論文 参考訳(メタデータ) (2023-07-14T06:42:21Z) - Multi-Dimensional Refinement Graph Convolutional Network with Robust
Decouple Loss for Fine-Grained Skeleton-Based Action Recognition [19.031036881780107]
本稿では,CVSTA(Channel-Variable Space-Temporal Attention)と呼ばれるフレキシブルアテンションブロックを提案する。
CVSTAに基づくMDR-GCN(Multi-dimensional Refinement Graph Convolutional Network)を構築し,チャネルレベル,ジョイントレベル,フレームレベルの特徴の識別を改善する。
さらに,CVSTAの効果を著しく向上し,騒音の影響を低減させるロバスト・デデュプル・ロス(RDL)を提案する。
論文 参考訳(メタデータ) (2023-06-27T09:23:36Z) - Learning Feature Recovery Transformer for Occluded Person
Re-identification [71.18476220969647]
本稿では,FRT(Feature Recovery Transformer)と呼ばれる2つの課題を同時に解決する手法を提案する。
特徴マッチング時のノイズの干渉を低減するため,両画像に現れる可視領域に着目し,類似性を計算するための可視グラフを開発した。
2つ目の課題は、グラフの類似性に基づいて、各クエリ画像に対して、ギャラリー内の$k$-nearestの隣人の特徴セットを利用して、完全な特徴を復元するリカバリトランスフォーマを提案することである。
論文 参考訳(メタデータ) (2023-01-05T02:36:16Z) - A High-Accuracy Unsupervised Person Re-identification Method Using
Auxiliary Information Mined from Datasets [53.047542904329866]
マルチモーダルな特徴学習のためのデータセットから抽出した補助情報を利用する。
本稿では,Restricted Label Smoothing Cross Entropy Loss (RLSCE), Weight Adaptive Triplet Loss (WATL), Dynamic Training Iterations (DTI)の3つの効果的なトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-05-06T10:16:18Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z) - Enhanced countering adversarial attacks via input denoising and feature
restoring [15.787838084050957]
ディープニューラルネットワーク(DNN)は、クリーン/オリジンサンプルにおいて知覚できない摂動を伴う敵の例/サンプル(AE)に対して脆弱である。
本稿では,IDFR(Input Denoising and Feature Restoring)による対向攻撃手法の強化について述べる。
提案したIDFRは, 凸船体最適化に基づく拡張型インプットデノイザ (ID) と隠れ型ロスィ特徴復元器 (FR) から構成される。
論文 参考訳(メタデータ) (2021-11-19T07:34:09Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z) - Transferable, Controllable, and Inconspicuous Adversarial Attacks on
Person Re-identification With Deep Mis-Ranking [83.48804199140758]
システム出力のランキングを乱す学習とミスランクの定式化を提案する。
また,新たなマルチステージネットワークアーキテクチャを開発することで,バックボックス攻撃を行う。
そこで本手法では, 異なるマルチショットサンプリングにより, 悪意のある画素数を制御することができる。
論文 参考訳(メタデータ) (2020-04-08T18:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。