論文の概要: Sequential Transformer for End-to-End Person Search
- arxiv url: http://arxiv.org/abs/2211.04323v1
- Date: Sun, 6 Nov 2022 09:32:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 16:48:45.024632
- Title: Sequential Transformer for End-to-End Person Search
- Title(参考訳): エンドツーエンド人物探索のための逐次変換器
- Authors: Long Chen, Jinhua Xu
- Abstract要約: 人物探索は、現実的かつ未収集のギャラリーイメージから対象人物を同時にローカライズし、認識することを目的としている。
本稿では,この課題に対処するエンド・ツー・エンドの人物探索のためのシークエンシャル・トランスフォーマー(SeqTR)を提案する。
我々のSeqTRは検出変換器と、検出タスクと再IDタスクを逐次処理する新しいre-ID変換器を備えている。
- 参考スコア(独自算出の注目度): 4.920657401819193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person Search aims to simultaneously localize and recognize a target person
from realistic and uncropped gallery images. One major challenge of person
search comes from the contradictory goals of the two sub-tasks, i.e., person
detection focuses on finding the commonness of all persons so as to distinguish
persons from the background, while person re-identification (re-ID) focuses on
the differences among different persons. In this paper, we propose a novel
Sequential Transformer (SeqTR) for end-to-end person search to deal with this
challenge. Our SeqTR contains a detection transformer and a novel re-ID
transformer that sequentially addresses detection and re-ID tasks. The re-ID
transformer comprises the self-attention layer that utilizes contextual
information and the cross-attention layer that learns local fine-grained
discriminative features of the human body. Moreover, the re-ID transformer is
shared and supervised by multi-scale features to improve the robustness of
learned person representations. Extensive experiments on two widely-used person
search benchmarks, CUHK-SYSU and PRW, show that our proposed SeqTR not only
outperforms all existing person search methods with a 59.3% mAP on PRW but also
achieves comparable performance to the state-of-the-art results with an mAP of
94.8% on CUHK-SYSU.
- Abstract(参考訳): Person Searchは、ターゲットの人物をリアルなギャラリーイメージから、同時にローカライズし、認識することを目的としている。
人探索の大きな課題の一つは,2つのサブタスクの矛盾する目標,すなわち,人物検出は,人物と背景を区別するために,すべての人の共通性を見出すことに焦点を合わせ,また,人物再同定(re-id)は異なる人物間の差異に焦点をあてることである。
本稿では,この課題に対処するエンド・ツー・エンドの人物探索のためのシークエンシャル・トランスフォーマー(SeqTR)を提案する。
我々のSeqTRは検出変換器と、検出タスクと再IDタスクを逐次処理する新しいre-ID変換器を備えている。
リイドトランスは、文脈情報を利用するセルフアテンション層と、人体の局所的なきめ細かい識別特徴を学ぶクロスアテンション層とを含む。
さらに、学習者表現の堅牢性を向上させるため、マルチスケール機能によってre-ID変換器を共有・管理する。
CUHK-SYSU と PRW の2つの広く使われている人物検索ベンチマークにおいて,提案したSeqTR は 59.3% mAP の既存人物検索手法を PRW で上回る結果を得ただけでなく, CUHK-SYSU で 94.8% のmAP を達成している。
関連論文リスト
- Transformer for Object Re-Identification: A Survey [69.61542572894263]
ビジョントランスフォーマーは、TransformerベースのRe-IDをさらに深く研究している。
本稿では、TransformerベースのRe-IDの総合的なレビューと詳細な分析を行う。
本稿では,教師なしRe-IDのトレンドを考えると,最先端性能を実現するための新しいトランスフォーマーベースラインUntransReIDを提案する。
論文 参考訳(メタデータ) (2024-01-13T03:17:57Z) - PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - Learning Feature Recovery Transformer for Occluded Person
Re-identification [71.18476220969647]
本稿では,FRT(Feature Recovery Transformer)と呼ばれる2つの課題を同時に解決する手法を提案する。
特徴マッチング時のノイズの干渉を低減するため,両画像に現れる可視領域に着目し,類似性を計算するための可視グラフを開発した。
2つ目の課題は、グラフの類似性に基づいて、各クエリ画像に対して、ギャラリー内の$k$-nearestの隣人の特徴セットを利用して、完全な特徴を復元するリカバリトランスフォーマを提案することである。
論文 参考訳(メタデータ) (2023-01-05T02:36:16Z) - PSTR: End-to-End One-Step Person Search With Transformers [140.32813648935752]
本稿では,一段階のトランスフォーマーに基づく人物検索フレームワークPSTRを提案する。
PSSモジュールは、人検出用の検出エンコーダデコーダと、人再識別子用の識別リIDデコーダを含む。
PRWベンチマークでは、平均平均精度(mAP)が56.5%に達する。
論文 参考訳(メタデータ) (2022-04-07T10:22:33Z) - Cascade Transformers for End-to-End Person Search [18.806369852341334]
エンドツーエンドの人物検索のためのカスケード付加注意変換器(COAT)を提案する。
COATは、第1段階の人の検出に焦点を当て、第2段階の人の検出と再識別の表現を同時に、段階的に洗練する。
2つのベンチマークデータセット上で最先端の性能を達成することで,本手法の利点を実証する。
論文 参考訳(メタデータ) (2022-03-17T22:42:12Z) - Subtask-dominated Transfer Learning for Long-tail Person Search [12.311100923753449]
人物探索は、パノラマギャラリー画像から質問者を見つけるために、人物検出と人物再識別(Re-ID)を統一する。
1つの大きな課題は、不均衡なロングテールの個人識別分布である。
本稿では,この問題を解決するために,Subtask-dominated Transfer Learning (STL)法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:34:48Z) - Diverse Part Discovery: Occluded Person Re-identification with
Part-Aware Transformer [95.02123369512384]
蓄積された人物の再識別(Re-ID)は、様々な障害や人によってしばしば妨げられるため、困難な作業である。
本稿では,多種多様な部分発見を通して,隠蔽されたRe-IDのための新しいエンドツーエンドのPart-Aware Transformer(PAT)を提案する。
論文 参考訳(メタデータ) (2021-06-08T04:29:07Z) - Person Re-identification based on Robust Features in Open-world [0.0]
既存の再ID研究の欠点を解決するために、低コストで高効率な手法を提案します。
グループ畳み込みによるポーズ推定モデルに基づく歩行者の連続キーポイント獲得手法を提案する。
本手法は, ランク-1: 60.9%, ランク-5: 78.1%, mAP: 49.2%を達成した。
論文 参考訳(メタデータ) (2021-02-22T06:49:28Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - FMT:Fusing Multi-task Convolutional Neural Network for Person Search [33.91664470686695]
本稿では,検出と再同定の相関性と不均一性に対処するために,FMT-CNN(Fusing Multi-task Convolutional Neural Network)を提案する。
CUHK-SYSU Person Searchデータセットの実験結果から,提案手法の性能は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-01T05:20:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。