論文の概要: Dynamic Prototype Mask for Occluded Person Re-Identification
- arxiv url: http://arxiv.org/abs/2207.09046v1
- Date: Tue, 19 Jul 2022 03:31:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 13:49:35.080618
- Title: Dynamic Prototype Mask for Occluded Person Re-Identification
- Title(参考訳): 人物再同定のための動的プロトタイプマスク
- Authors: Lei Tan, Pingyang Dai, Rongrong Ji, Yongjian Wu
- Abstract要約: 既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
- 参考スコア(独自算出の注目度): 88.7782299372656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although person re-identification has achieved an impressive improvement in
recent years, the common occlusion case caused by different obstacles is still
an unsettled issue in real application scenarios. Existing methods mainly
address this issue by employing body clues provided by an extra network to
distinguish the visible part. Nevertheless, the inevitable domain gap between
the assistant model and the ReID datasets has highly increased the difficulty
to obtain an effective and efficient model. To escape from the extra
pre-trained networks and achieve an automatic alignment in an end-to-end
trainable network, we propose a novel Dynamic Prototype Mask (DPM) based on two
self-evident prior knowledge. Specifically, we first devise a Hierarchical Mask
Generator which utilizes the hierarchical semantic to select the visible
pattern space between the high-quality holistic prototype and the feature
representation of the occluded input image. Under this condition, the occluded
representation could be well aligned in a selected subspace spontaneously.
Then, to enrich the feature representation of the high-quality holistic
prototype and provide a more complete feature space, we introduce a Head Enrich
Module to encourage different heads to aggregate different patterns
representation in the whole image. Extensive experimental evaluations conducted
on occluded and holistic person re-identification benchmarks demonstrate the
superior performance of the DPM over the state-of-the-art methods. The code is
released at https://github.com/stone96123/DPM.
- Abstract(参考訳): 近年、人物の再識別は目覚ましい改善を遂げているが、異なる障害によって引き起こされる共通の閉塞ケースは、実際のアプリケーションシナリオにおいてまだ未解決の問題である。
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを用いてこの問題に対処している。
それにもかかわらず、アシスタントモデルとReIDデータセットの間の避けられない領域ギャップは、効果的で効率的なモデルを得るのが困難になっている。
予備学習ネットワークから脱出し、エンドツーエンドトレーニング可能なネットワークで自動アライメントを実現するために、2つの自明な事前知識に基づく新しい動的プロトタイプマスク(dpm)を提案する。
具体的には、階層型マスク生成器を考案し、階層型セマンティクスを用いて、高品質な総合プロトタイプと隠蔽された入力画像の特徴表現との間の可視パターン空間を選択する。
この条件下では、occluded表現は選択された部分空間内で自然に整列することができる。
次に,高品質な全体的プロトタイプの特徴表現を豊かにするとともに,より完全な機能空間を提供するため,画像全体に異なるパターン表現を集約するために,ヘッドエンリッチモジュールを導入する。
包括的および包括的人物再同定ベンチマークによる広範囲な実験的評価は、最先端の手法よりもDPMの優れた性能を示す。
コードはhttps://github.com/stone96123/dpmでリリースされる。
関連論文リスト
- Latent Diffusion Models for Attribute-Preserving Image Anonymization [4.080920304681247]
本稿では,遅延拡散モデル(LDM)に基づく画像匿名化への最初のアプローチを提案する。
CAFLaGE-Baseは、事前訓練された制御ネットと、実画像と匿名画像との距離を増やすために設計された新しい制御機構を組み合わせた2つのLCMを提案する。
論文 参考訳(メタデータ) (2024-03-21T19:09:21Z) - Dynamic Patch-aware Enrichment Transformer for Occluded Person
Re-Identification [14.219232629274186]
DPEFormer(Dynamic Patch-aware Enrichment Transformer)と呼ばれるエンドツーエンドのソリューションを提案する。
このモデルは,人体情報と隠蔽情報を自動的かつ動的に識別する。
DPSM と DPEFormer 全体が識別ラベルのみを用いて効果的に学習できることを保証するため,本手法では,実効性を有する Occlusion Augmentation (ROA) 戦略も提案する。
論文 参考訳(メタデータ) (2024-02-16T03:53:30Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Hierarchical Forgery Classifier On Multi-modality Face Forgery Clues [61.37306431455152]
我々は,HFC-MFFD (hierarchical Forgery for Multi-modality Face Forgery Detection) を提案する。
HFC-MFFDは、マルチモーダルシナリオにおけるフォージェリー認証を強化するために、堅牢なパッチベースのハイブリッド表現を学習する。
クラス不均衡問題を緩和し、さらに検出性能を高めるために、特定の階層的な顔偽造を提案する。
論文 参考訳(メタデータ) (2022-12-30T10:54:29Z) - Siamese Transition Masked Autoencoders as Uniform Unsupervised Visual
Anomaly Detector [4.33060257697635]
本稿では,様々な視覚異常検出タスクを均一に処理するための,Samese Transition Masked Autoencoders (ST-MAE) と呼ばれる新しいフレームワークを提案する。
我々の深い特徴遷移スキームは、通常のパターンを抽出する非教師付きセマンティックな自己監督タスクをもたらす。
論文 参考訳(メタデータ) (2022-11-01T09:45:49Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Multi-Domain Adversarial Feature Generalization for Person
Re-Identification [52.835955258959785]
マルチデータセット特徴一般化ネットワーク(MMFA-AAE)を提案する。
複数のラベル付きデータセットから普遍的なドメイン不変の特徴表現を学習し、それを見えないカメラシステムに一般化することができる。
また、最先端の教師付き手法や教師なしのドメイン適応手法を大きなマージンで超えている。
論文 参考訳(メタデータ) (2020-11-25T08:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。