論文の概要: PSTR: End-to-End One-Step Person Search With Transformers
- arxiv url: http://arxiv.org/abs/2204.03340v1
- Date: Thu, 7 Apr 2022 10:22:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-08 14:52:35.225119
- Title: PSTR: End-to-End One-Step Person Search With Transformers
- Title(参考訳): PSTR:トランスフォーマーを使ったワンステップ検索
- Authors: Jiale Cao and Yanwei Pang and Rao Muhammad Anwer and Hisham Cholakkal
and Jin Xie and Mubarak Shah and Fahad Shahbaz Khan
- Abstract要約: 本稿では,一段階のトランスフォーマーに基づく人物検索フレームワークPSTRを提案する。
PSSモジュールは、人検出用の検出エンコーダデコーダと、人再識別子用の識別リIDデコーダを含む。
PRWベンチマークでは、平均平均精度(mAP)が56.5%に達する。
- 参考スコア(独自算出の注目度): 140.32813648935752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel one-step transformer-based person search framework, PSTR,
that jointly performs person detection and re-identification (re-id) in a
single architecture. PSTR comprises a person search-specialized (PSS) module
that contains a detection encoder-decoder for person detection along with a
discriminative re-id decoder for person re-id. The discriminative re-id decoder
utilizes a multi-level supervision scheme with a shared decoder for
discriminative re-id feature learning and also comprises a part attention block
to encode relationship between different parts of a person. We further
introduce a simple multi-scale scheme to support re-id across person instances
at different scales. PSTR jointly achieves the diverse objectives of
object-level recognition (detection) and instance-level matching (re-id). To
the best of our knowledge, we are the first to propose an end-to-end one-step
transformer-based person search framework. Experiments are performed on two
popular benchmarks: CUHK-SYSU and PRW. Our extensive ablations reveal the
merits of the proposed contributions. Further, the proposed PSTR sets a new
state-of-the-art on both benchmarks. On the challenging PRW benchmark, PSTR
achieves a mean average precision (mAP) score of 56.5%. The source code is
available at \url{https://github.com/JialeCao001/PSTR}.
- Abstract(参考訳): 本稿では,1つのアーキテクチャで人物検出と再識別(re-id)を共同で行う,ワンステップトランスフォーマーに基づく人物検索フレームワークPSTRを提案する。
PSTRは、人検出用検出エンコーダデコーダと、人再識別子用識別リIDデコーダとを含む人探索特化(PSS)モジュールを含む。
識別用再idデコーダは、識別用再id特徴学習のための共有デコーダを備えた多レベル監督スキームと、人の異なる部分間の関係をエンコードする部分注意ブロックとを備える。
さらに,個人インスタンス間のリidを異なるスケールでサポートする,簡易なマルチスケールスキームについても紹介する。
PSTRは、オブジェクトレベルの認識(検出)とインスタンスレベルのマッチング(re-id)の多様な目的を共同で達成する。
我々の知る限りでは、我々は初めてエンドツーエンドのワンステップトランスフォーマーベースの人物検索フレームワークを提案する。
CUHK-SYSUとPRWの2つの人気のあるベンチマークで実験が行われている。
提案された貢献のメリットを広範囲に説明します。
さらに、提案したPSTRは、両方のベンチマークで新しい最先端を設定できる。
PRWベンチマークでは、平均平均精度(mAP)が56.5%に達する。
ソースコードは \url{https://github.com/jialecao001/pstr} で入手できる。
関連論文リスト
- PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - LEAPS: End-to-End One-Step Person Search With Learnable Proposals [50.39493100627476]
LEAPSという学習可能な提案を用いたエンドツーエンドのワンステップ人物探索手法を提案する。
スパースと学習可能な提案のセットが与えられた後、LEAPSは動的人物検索ヘッドを使用して、非最大抑圧後処理なしで直接人物検出および対応するre-id特徴生成を行う。
論文 参考訳(メタデータ) (2023-03-21T13:59:32Z) - Plug and Play Active Learning for Object Detection [12.50247484568549]
オブジェクト検出のためのPlug and Play Active Learning(PPAL)を導入する。
PPALは不確実性と多様性に基づくサンプリングフェーズを含む2段階の手法である。
我々は,MS-COCOおよびPascal VOCデータセット上で,異なる検出器アーキテクチャを用いてPPALをベンチマークした。
論文 参考訳(メタデータ) (2022-11-21T16:13:23Z) - Sequential Transformer for End-to-End Person Search [4.920657401819193]
人物探索は、現実的かつ未収集のギャラリーイメージから対象人物を同時にローカライズし、認識することを目的としている。
本稿では,この課題に対処するエンド・ツー・エンドの人物探索のためのシークエンシャル・トランスフォーマー(SeqTR)を提案する。
我々のSeqTRは検出変換器と、検出タスクと再IDタスクを逐次処理する新しいre-ID変換器を備えている。
論文 参考訳(メタデータ) (2022-11-06T09:32:30Z) - Diverse Part Discovery: Occluded Person Re-identification with
Part-Aware Transformer [95.02123369512384]
蓄積された人物の再識別(Re-ID)は、様々な障害や人によってしばしば妨げられるため、困難な作業である。
本稿では,多種多様な部分発見を通して,隠蔽されたRe-IDのための新しいエンドツーエンドのPart-Aware Transformer(PAT)を提案する。
論文 参考訳(メタデータ) (2021-06-08T04:29:07Z) - Anchor-Free Person Search [127.88668724345195]
パーソンサーチ(person search)は、クエリーの人物を同時にローカライズし、特定することを目的としている。
既存の作品の多くはfaster-rcnnのような2段検出器を採用しており、精度は高いが計算オーバーヘッドは高い。
この課題に効率的に取り組む最初のアンカーフリーフレームワークであるFeature-Aligned Person Search Network(AlignPS)を紹介します。
論文 参考訳(メタデータ) (2021-03-22T07:04:29Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。