論文の概要: Diverse Part Discovery: Occluded Person Re-identification with
Part-Aware Transformer
- arxiv url: http://arxiv.org/abs/2106.04095v1
- Date: Tue, 8 Jun 2021 04:29:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 15:57:20.531886
- Title: Diverse Part Discovery: Occluded Person Re-identification with
Part-Aware Transformer
- Title(参考訳): 異物発見:部品認識変換器で人物を識別する
- Authors: Yulin Li, Jianfeng He, Tianzhu Zhang, Xiang Liu, Yongdong Zhang, Feng
Wu
- Abstract要約: 蓄積された人物の再識別(Re-ID)は、様々な障害や人によってしばしば妨げられるため、困難な作業である。
本稿では,多種多様な部分発見を通して,隠蔽されたRe-IDのための新しいエンドツーエンドのPart-Aware Transformer(PAT)を提案する。
- 参考スコア(独自算出の注目度): 95.02123369512384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occluded person re-identification (Re-ID) is a challenging task as persons
are frequently occluded by various obstacles or other persons, especially in
the crowd scenario. To address these issues, we propose a novel end-to-end
Part-Aware Transformer (PAT) for occluded person Re-ID through diverse part
discovery via a transformer encoderdecoder architecture, including a pixel
context based transformer encoder and a part prototype based transformer
decoder. The proposed PAT model enjoys several merits. First, to the best of
our knowledge, this is the first work to exploit the transformer
encoder-decoder architecture for occluded person Re-ID in a unified deep model.
Second, to learn part prototypes well with only identity labels, we design two
effective mechanisms including part diversity and part discriminability.
Consequently, we can achieve diverse part discovery for occluded person Re-ID
in a weakly supervised manner. Extensive experimental results on six
challenging benchmarks for three tasks (occluded, partial and holistic Re-ID)
demonstrate that our proposed PAT performs favorably against stat-of-the-art
methods.
- Abstract(参考訳): Re-ID(Occluded person re-identification)は,特に観衆のシナリオにおいて,様々な障害や他者によって隠蔽されることの多い課題である。
そこで,本稿では,画素コンテクストベースのトランスコーダや部分プロトタイプベースのトランスコーダなど,トランスフォーマエンコーダアーキテクチャによる多種多様な部分発見を通じて,オクルードされた人物を識別する,エンド・ツー・エンドのパート・ツー・アウェア・トランスフォーマ(pat)を提案する。
提案したPATモデルにはいくつかのメリットがある。
第一に、我々の知る限りでは、これは統一された深層モデルでオクルードされた人物に対するトランスフォーマーエンコーダ-デコーダアーキテクチャを利用する最初の仕事である。
第2に、識別ラベルのみを用いて、部品のプロトタイプを学習するために、部分の多様性と部分の識別可能性を含む2つの効果的なメカニズムを設計する。
その結果,隠蔽者のRe-IDを弱教師付きで多種多様な部分発見が可能となった。
3つのタスク (occluded, partial and holistic re-id) に対する6つの難易度ベンチマークの広範な実験結果から,提案手法がstat-of-the-art法に対して好成績を示した。
関連論文リスト
- Exploring Stronger Transformer Representation Learning for Occluded Person Re-Identification [2.552131151698595]
我々はトランスフォーマーに基づく人物識別フレームワークであるSSSC-TransReIDを組み合わせた新しい自己監督・監督手法を提案した。
我々は、ネガティブなサンプルや追加の事前学習なしに、人物の再識別のための特徴表現を強化することができる自己教師付きコントラスト学習ブランチを設計した。
提案モデルでは, 平均平均精度(mAP) とランク1の精度において, 最先端のReID手法よりも優れたRe-ID性能が得られ, 高いマージンで性能が向上する。
論文 参考訳(メタデータ) (2024-10-21T03:17:25Z) - Transformer for Object Re-Identification: A Survey [69.61542572894263]
ビジョントランスフォーマーは、TransformerベースのRe-IDをさらに深く研究している。
本稿では、TransformerベースのRe-IDの総合的なレビューと詳細な分析を行う。
本稿では,教師なしRe-IDのトレンドを考えると,最先端性能を実現するための新しいトランスフォーマーベースラインUntransReIDを提案する。
論文 参考訳(メタデータ) (2024-01-13T03:17:57Z) - Part Representation Learning with Teacher-Student Decoder for Occluded
Person Re-identification [65.63180725319906]
本稿では,隠蔽者ReIDのためのTSD(Teacher-Student Decoder)フレームワークを提案する。
提案するTSDは,Parsing-aware Teacher Decoder (PTD) と標準学生デコーダ (SSD) から構成される。
論文 参考訳(メタデータ) (2023-12-15T13:54:48Z) - Transformer Based Multi-Grained Features for Unsupervised Person
Re-Identification [9.874360118638918]
視覚変換器(ViT)を改良したデュアルブランチネットワークアーキテクチャを構築した。
各ブランチで出力されるローカルトークンをリフォームし、その後一様に複数のストライプに分割して、部分レベルの特徴を生成する。
2つのブランチのグローバルトークンは、グローバル機能を生成するために平均化されます。
論文 参考訳(メタデータ) (2022-11-22T13:51:17Z) - Sequential Transformer for End-to-End Person Search [4.920657401819193]
人物探索は、現実的かつ未収集のギャラリーイメージから対象人物を同時にローカライズし、認識することを目的としている。
本稿では,この課題に対処するエンド・ツー・エンドの人物探索のためのシークエンシャル・トランスフォーマー(SeqTR)を提案する。
我々のSeqTRは検出変換器と、検出タスクと再IDタスクを逐次処理する新しいre-ID変換器を備えている。
論文 参考訳(メタデータ) (2022-11-06T09:32:30Z) - Integral Migrating Pre-trained Transformer Encoder-decoders for Visual
Object Detection [78.2325219839805]
imTEDは、数発のオブジェクト検出の最先端を最大7.6%改善する。
MS COCOデータセットの実験は、imTEDが一貫してそのデータセットを2.8%上回っていることを示している。
論文 参考訳(メタデータ) (2022-05-19T15:11:20Z) - Human-Object Interaction Detection via Disentangled Transformer [63.46358684341105]
本稿では,2つのサブタスクの学習を容易にするために,エンコーダとデコーダの両方をアンタングル化するDisentangled Transformerを提案する。
提案手法は,2つの公開HOIベンチマークにおいて,従来よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2022-04-20T08:15:04Z) - PSTR: End-to-End One-Step Person Search With Transformers [140.32813648935752]
本稿では,一段階のトランスフォーマーに基づく人物検索フレームワークPSTRを提案する。
PSSモジュールは、人検出用の検出エンコーダデコーダと、人再識別子用の識別リIDデコーダを含む。
PRWベンチマークでは、平均平均精度(mAP)が56.5%に達する。
論文 参考訳(メタデータ) (2022-04-07T10:22:33Z) - Learning Disentangled Representation Implicitly via Transformer for
Occluded Person Re-Identification [35.40162083252931]
DRL-Netは、厳格な人物画像アライメントや追加の監督を必要とすることなく、隠蔽されたre-IDを処理する表現学習ネットワークである。
定義されていないセマンティックコンポーネントの表現を自動的に切り離すことで、画像の類似度を測定する。
DRL-Netは、一貫して優れたre-ID性能を達成し、Occluded-DukeMTMCに対して大きなマージンで最先端の性能を上回る。
論文 参考訳(メタデータ) (2021-07-06T04:24:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。