論文の概要: Feature Erasing and Diffusion Network for Occluded Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2112.08740v1
- Date: Thu, 16 Dec 2021 09:47:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 15:52:02.060515
- Title: Feature Erasing and Diffusion Network for Occluded Person
Re-Identification
- Title(参考訳): 人物再同定のための特徴消去と拡散ネットワーク
- Authors: Zhikang Wang, Feng Zhu, Shixiang Tang, Rui Zhao, Lihuo He, Jiangning
Song
- Abstract要約: 被写体再識別は、被写体画像を異なるカメラビューの全体像に合わせることを目的としている。
従来の手法は主に、NTPの特徴汚染を無視しながら、NPOに対するモデルの堅牢性を高めることに焦点を当てていた。
NPOとNTPを同時に扱う新しい特徴消去拡散ネットワーク(FED)を提案する。
- 参考スコア(独自算出の注目度): 20.720999782234216
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occluded person re-identification (ReID) aims at matching occluded person
images to holistic ones across different camera views. Target Pedestrians (TP)
are usually disturbed by Non-Pedestrian Occlusions (NPO) and NonTarget
Pedestrians (NTP). Previous methods mainly focus on increasing model's
robustness against NPO while ignoring feature contamination from NTP. In this
paper, we propose a novel Feature Erasing and Diffusion Network (FED) to
simultaneously handle NPO and NTP. Specifically, NPO features are eliminated by
our proposed Occlusion Erasing Module (OEM), aided by the NPO augmentation
strategy which simulates NPO on holistic pedestrian images and generates
precise occlusion masks. Subsequently, we Subsequently, we diffuse the
pedestrian representations with other memorized features to synthesize NTP
characteristics in the feature space which is achieved by a novel Feature
Diffusion Module (FDM) through a learnable cross attention mechanism. With the
guidance of the occlusion scores from OEM, the feature diffusion process is
mainly conducted on visible body parts, which guarantees the quality of the
synthesized NTP characteristics. By jointly optimizing OEM and FDM in our
proposed FED network, we can greatly improve the model's perception ability
towards TP and alleviate the influence of NPO and NTP. Furthermore, the
proposed FDM only works as an auxiliary module for training and will be
discarded in the inference phase, thus introducing little inference
computational overhead. Experiments on occluded and holistic person ReID
benchmarks demonstrate the superiority of FED over state-of-the-arts, where FED
achieves 86.3% Rank-1 accuracy on Occluded-REID, surpassing others by at least
4.7%.
- Abstract(参考訳): occluded person re-identification (reid) は、異なるカメラビューの全体像と、occluded personイメージをマッチングすることを目的としている。
目標歩行者(tp)は通常、非ペレスタル閉塞(npo)と非目標歩行者(ntp)によって妨害される。
従来の手法は主に、NTPの特徴汚染を無視しながら、NPOに対するモデルの堅牢性を高めることに焦点を当てていた。
本稿では,NPO と NTP を同時に扱う新しい特徴消去拡散ネットワーク (FED) を提案する。
具体的には,本提案したOcclusion Erasing Module (OEM) によってNPOの特徴を排除し,NPOを総合的な歩行者画像上でシミュレートし,正確な閉塞マスクを生成するNPO拡張戦略によって支援する。
その後,新しい特徴拡散モジュール (FDM) によって達成される特徴空間のNTP特性を学習可能なクロスアテンション機構によって合成するために,歩行者表現を他の記憶特徴と拡散させる。
OEMからのオクルージョンスコアの誘導により, 合成したNTP特性の品質を保証するために, 主に可視体部に特徴拡散処理を行う。
提案するFEDネットワークにおけるOEMとFDMの協調最適化により,TPに対する認識能力を大幅に向上し,NPOとNTPの影響を軽減することができる。
さらに、提案するFDMは、トレーニング用の補助モジュールとしてのみ機能し、推論フェーズで破棄されるため、推論計算オーバーヘッドが少なくなる。
包括的かつ包括的なReIDベンチマークの実験は、FEDがOccluded-REID上で86.3%のランク-1の精度を達成し、少なくとも4.7%の差でFEDの優位性を示した。
関連論文リスト
- Augmented Neural Fine-Tuning for Efficient Backdoor Purification [16.74156528484354]
最近の研究では、様々なバックドア攻撃に対するディープニューラルネットワーク(DNN)の脆弱性が明らかにされている。
神経活動の最適再編成を目的としたニューラルマスクファインチューニング(NFT)を提案する。
NFTはトリガー合成プロセスを緩和し、逆探索モジュールの要求をなくす。
論文 参考訳(メタデータ) (2024-07-14T02:36:54Z) - Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery [71.6345505427213]
DPMeshは、人間のメッシュリカバリを排除した革新的なフレームワークである。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルに埋め込まれた対象構造と空間的関係について、より深い拡散に乗じる。
論文 参考訳(メタデータ) (2024-04-01T18:59:13Z) - Open-Set Face Recognition with Maximal Entropy and Objectosphere Loss [7.710785884166695]
この作業は、低い偽陽性識別率で動作することが期待されるオープンセットタスクであるウォッチリストに集中する。
コスト関数と組み合わせることで、付加的な負の顔画像の利点を享受できるコンパクトなアダプタネットワークを導入する。
提案手法では,顔認識を特徴抽出器として,事前学習したディープニューラルネットワーク(DNN)を採用する。
論文 参考訳(メタデータ) (2023-11-01T09:52:02Z) - Improving Neural Additive Models with Bayesian Principles [54.29602161803093]
ニューラル加算モデル(NAM)は、個別の加算サブネットワークでキャリブレーションされた入力特徴を扱うことにより、ディープニューラルネットワークの透明性を高める。
本研究では,Laplace-approximated NAM (LA-NAMs) を開発した。
論文 参考訳(メタデータ) (2023-05-26T13:19:15Z) - OccRob: Efficient SMT-Based Occlusion Robustness Verification of Deep
Neural Networks [7.797299214812479]
Occlusionは、ディープニューラルネットワーク(DNN)に対する一般的かつ容易に実現可能なセマンティック摂動である
DNNを騙していくつかのセグメントを隠蔽することで入力画像を誤分類し、おそらく深刻なエラーを引き起こす可能性がある。
DNNの既存のロバスト性検証アプローチは、非意味的な摂動に重点を置いている。
論文 参考訳(メタデータ) (2023-01-27T18:54:00Z) - AP-BSN: Self-Supervised Denoising for Real-World Images via Asymmetric
PD and Blind-Spot Network [60.650035708621786]
ブラインド・スポット・ネットワーク(BSN)とその変種は、自己監督型デノナイジングにおいて大きな進歩を遂げた。
自己教師付きBSNを用いて空間的に相関した実世界の雑音に対処することは困難である。
近年,実世界の雑音の空間的相関を取り除くために,画素シャッフルダウンサンプリング (PD) が提案されている。
本稿では,この問題に対処する非対称PD(AP)を提案する。
論文 参考訳(メタデータ) (2022-03-22T15:04:37Z) - Quality-aware Part Models for Occluded Person Re-identification [77.24920810798505]
咬合は人体再識別(ReID)にとって大きな課題となる
既存のアプローチは一般的に、計算効率とReIDの精度の両面で最適であるように、目に見える身体の部品を推測するための外部ツールに依存している。
閉塞型ReIDのためのQPM(Quality-Aware Part Models)という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-01-01T03:51:09Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z) - NMS-Loss: Learning with Non-Maximum Suppression for Crowded Pedestrian
Detection [39.417540296897194]
ネットワークパラメータを追加せずにNMSプロシージャをエンドツーエンドにトレーニングできる新しいNMS-Lossを提案する。
我々のNMS-ロスは、FPが抑制されず、FNがNMSによって誤って排除された2つの症例を罰する。
NMS-Lossの助けを借りて、我々の検出器、すなわちNMS-Pedは、CityPersonsデータセットで5.92%、CityPersonsデータセットで10.08%のミスレートで印象的な結果を得る。
論文 参考訳(メタデータ) (2021-06-04T12:06:46Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。