論文の概要: UPAR: Unified Pedestrian Attribute Recognition and Person Retrieval
- arxiv url: http://arxiv.org/abs/2209.02522v1
- Date: Tue, 6 Sep 2022 14:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:19:30.093768
- Title: UPAR: Unified Pedestrian Attribute Recognition and Person Retrieval
- Title(参考訳): UPAR:統一歩行者属性認識と個人検索
- Authors: Andreas Specker, Mickael Cormier, J\"urgen Beyerer
- Abstract要約: UPAR, Unified Person Attribute Recognition データセットについて述べる。
PA100k、PETA、RAPv2、Market1501の4つの有名な人物属性認識データセットに基づいている。
私たちは、12の属性カテゴリに対して、40の重要なバイナリ属性を調和させるために、3,3Mの追加アノテーションを提供することで、これらのデータセットを統一します。
- 参考スコア(独自算出の注目度): 4.6193503399184275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognizing soft-biometric pedestrian attributes is essential in video
surveillance and fashion retrieval. Recent works show promising results on
single datasets. Nevertheless, the generalization ability of these methods
under different attribute distributions, viewpoints, varying illumination, and
low resolutions remains rarely understood due to strong biases and varying
attributes in current datasets. To close this gap and support a systematic
investigation, we present UPAR, the Unified Person Attribute Recognition
Dataset. It is based on four well-known person attribute recognition datasets:
PA100K, PETA, RAPv2, and Market1501. We unify those datasets by providing 3,3M
additional annotations to harmonize 40 important binary attributes over 12
attribute categories across the datasets. We thus enable research on
generalizable pedestrian attribute recognition as well as attribute-based
person retrieval for the first time. Due to the vast variance of the image
distribution, pedestrian pose, scale, and occlusion, existing approaches are
greatly challenged both in terms of accuracy and efficiency. Furthermore, we
develop a strong baseline for PAR and attribute-based person retrieval based on
a thorough analysis of regularization methods. Our models achieve
state-of-the-art performance in cross-domain and specialization settings on
PA100k, PETA, RAPv2, Market1501-Attributes, and UPAR. We believe UPAR and our
strong baseline will contribute to the artificial intelligence community and
promote research on large-scale, generalizable attribute recognition systems.
- Abstract(参考訳): ソフトバイオメトリックな歩行者属性の認識はビデオサーベイランスやファッション検索に不可欠である。
最近の研究は単一のデータセットで有望な結果を示している。
しかしながら、これらの手法の様々な属性分布、視点、様々な照明、低解像度での一般化能力は、現在のデータセットの強いバイアスと様々な属性のためにほとんど理解されていない。
このギャップを埋め、体系的な調査を支援するために、統一人属性認識データセットUPARを提案する。
PA100K、PETA、RAPv2、Market1501の4つの有名な属性認識データセットに基づいている。
データセット全体で12の属性カテゴリに対して、40の重要なバイナリ属性を調和させるために、3,3Mの追加アノテーションを提供することで、これらのデータセットを統一します。
これにより、一般化可能な歩行者属性認識と属性に基づく人物検索を初めて行うことができる。
画像分布、歩行者のポーズ、スケール、閉塞の広大なばらつきにより、既存のアプローチは精度と効率の両面で大きな課題を抱えている。
さらに,正規化手法の徹底的な解析に基づいて,parと属性に基づく人物検索のための強力なベースラインを開発した。
本モデルはPA100k, PETA, RAPv2, Market1501-Attributes, UPARのクロスドメインおよび特殊化設定における最先端性能を実現する。
私たちは、UPARと強力なベースラインが人工知能コミュニティに貢献し、大規模で一般化可能な属性認識システムの研究を促進すると信じています。
関連論文リスト
- Spatio-Temporal Side Tuning Pre-trained Foundation Models for Video-based Pedestrian Attribute Recognition [58.79807861739438]
既存の歩行者認識アルゴリズム(PAR)は主に静的画像に基づいて開発されている。
本稿では,時間的情報を完全に活用できるビデオフレームを用いて,人間の属性を理解することを提案する。
論文 参考訳(メタデータ) (2024-04-27T14:43:32Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - SequencePAR: Understanding Pedestrian Attributes via A Sequence
Generation Paradigm [18.53048511206039]
本稿では,歩行者属性認識のための新しいシーケンス生成パラダイム,SequencePARを提案する。
事前トレーニングされたCLIPモデルを使用して歩行者機能を抽出し、テキストプロンプトのガイダンスの下で、属性セットをクエリトークンに埋め込む。
マスク付きマルチヘッドアテンション層がデコーダモジュールに導入され、トレーニング中に属性予測を行いながら、モデルが次の属性を思い出すのを防ぐ。
論文 参考訳(メタデータ) (2023-12-04T05:42:56Z) - A Solution to Co-occurrence Bias: Attributes Disentanglement via Mutual
Information Minimization for Pedestrian Attribute Recognition [10.821982414387525]
そこで本研究では,現在の手法が,データセット分布のシーンやアイデンティティに適合する属性の相互依存性の一般化に実際に苦慮していることを示す。
現実的な場面で頑健なモデルをレンダリングするために,属性不整形特徴学習を提案し,属性の認識が他者の存在に依存しないことを保証する。
論文 参考訳(メタデータ) (2023-07-28T01:34:55Z) - TransFA: Transformer-based Representation for Face Attribute Evaluation [87.09529826340304]
我々はtextbfTransFA を用いたtextbfattribute 評価のための新しい textbf Transformer 表現を提案する。
提案するTransFAは,最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-12T10:58:06Z) - Reinforced Pedestrian Attribute Recognition with Group Optimization
Reward [15.630702608104421]
Pedestrian Attribute Recognition(PAR)における2つの重要な課題は、画像と属性のアライメント関係と、不均衡なデータ分布である。
本稿では,強化学習フレームワークによる意思決定課題として取り上げる。
エージェントを用いて各属性群を識別し,深層Q-ラーニングアルゴリズムを用いて学習する。
論文 参考訳(メタデータ) (2022-05-21T03:38:03Z) - Spatial and Semantic Consistency Regularizations for Pedestrian
Attribute Recognition [50.932864767867365]
本稿では,各属性に対する空間的および意味的一貫性を実現するために,2つの相補的正規化からなるフレームワークを提案する。
属性の正確な位置に基づいて,本質的および識別的意味的特徴を抽出する意味的整合性正規化を提案する。
その結果,提案手法はパラメータを増大させることなく,最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-09-13T03:36:44Z) - Rethinking of Pedestrian Attribute Recognition: A Reliable Evaluation
under Zero-Shot Pedestrian Identity Setting [48.347987541336146]
我々は、歩行者属性認識の状況を分析し、後退する時が来たと論じている。
我々は、歩行者属性認識を他の類似タスクと正式に定義し、区別する。
歩行者属性認識の進捗を測定するために,既存の4つのデータセットと2つの提案データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-07-08T03:12:24Z) - Pedestrian Attribute Recognition in Video Surveillance Scenarios Based
on View-attribute Attention Localization [8.807717261983539]
注目度(VALA)に基づく新しいビュー属性ローカライズ手法を提案する。
特定のビュー属性は、抽出された属性特徴と、異なるビューからの属性に対する信頼度としてビュー予測器によって予測される4つのビュースコアによって構成される。
3つのワイドデータセット(RAP, RAPv2, PETA, PA-100K)による実験により, 最先端手法と比較して, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-06-11T16:09:31Z) - Deep Template Matching for Pedestrian Attribute Recognition with the
Auxiliary Supervision of Attribute-wise Keypoints [33.35677385823819]
Pedestrian Attribute Recognition (PAR)は、ビデオ監視のシナリオにおいて重要な役割を担っているため、広く注目を集めている。
最近の研究は、属性に対応する領域をローカライズするための、注意機構やボディ部分の提案など、複雑なモジュールを設計している。
これらの研究は属性特定領域のローカライゼーションがパフォーマンス向上に役立つことを証明している。
しかし、これらの部分情報に基づく手法は、モデル複雑さの増加とともに正確ではない。
論文 参考訳(メタデータ) (2020-11-13T07:52:26Z) - Data Augmentation Imbalance For Imbalanced Attribute Classification [60.71438625139922]
本稿では,データ拡張不均衡(DAI)と呼ばれる新しい再サンプリングアルゴリズムを提案する。
我々のDAIアルゴリズムは歩行者属性のデータセットに基づいて最先端の結果を得る。
論文 参考訳(メタデータ) (2020-04-19T20:43:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。