論文の概要: FOCUS: Fine-grained Optimization with Semantic Guided Understanding for Pedestrian Attributes Recognition
- arxiv url: http://arxiv.org/abs/2506.22836v1
- Date: Sat, 28 Jun 2025 10:38:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.594249
- Title: FOCUS: Fine-grained Optimization with Semantic Guided Understanding for Pedestrian Attributes Recognition
- Title(参考訳): FOCUS: 歩行者属性認識のためのセマンティックガイドによる微粒化最適化
- Authors: Hongyan An, Kuan Zhu, Xin He, Haiyun Guo, Chaoyang Zhao, Ming Tang, Jinqiao Wang,
- Abstract要約: 歩行者属性認識は、インテリジェント輸送とセキュリティにおける基本的な認識課題である。
このきめ細かいタスクに対処するため、既存のほとんどの手法は属性情報を豊かにするための地域特徴の抽出に重点を置いている。
PARに対するsemantitextbfC gtextbfUided undertextbfStanding(FOCUS)アプローチを用いたtextbfFine-fine textbfOptimizationを提案する。
- 参考スコア(独自算出の注目度): 40.85042685914472
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Pedestrian attribute recognition (PAR) is a fundamental perception task in intelligent transportation and security. To tackle this fine-grained task, most existing methods focus on extracting regional features to enrich attribute information. However, a regional feature is typically used to predict a fixed set of pre-defined attributes in these methods, which limits the performance and practicality in two aspects: 1) Regional features may compromise fine-grained patterns unique to certain attributes in favor of capturing common characteristics shared across attributes. 2) Regional features cannot generalize to predict unseen attributes in the test time. In this paper, we propose the \textbf{F}ine-grained \textbf{O}ptimization with semanti\textbf{C} g\textbf{U}ided under\textbf{S}tanding (FOCUS) approach for PAR, which adaptively extracts fine-grained attribute-level features for each attribute individually, regardless of whether the attributes are seen or not during training. Specifically, we propose the Multi-Granularity Mix Tokens (MGMT) to capture latent features at varying levels of visual granularity, thereby enriching the diversity of the extracted information. Next, we introduce the Attribute-guided Visual Feature Extraction (AVFE) module, which leverages textual attributes as queries to retrieve their corresponding visual attribute features from the Mix Tokens using a cross-attention mechanism. To ensure that textual attributes focus on the appropriate Mix Tokens, we further incorporate a Region-Aware Contrastive Learning (RACL) method, encouraging attributes within the same region to share consistent attention maps. Extensive experiments on PA100K, PETA, and RAPv1 datasets demonstrate the effectiveness and strong generalization ability of our method.
- Abstract(参考訳): 歩行者属性認識(PAR)は、インテリジェント輸送とセキュリティにおける基本的な認識課題である。
このきめ細かいタスクに対処するため、既存のほとんどの手法は属性情報を豊かにするための地域特徴の抽出に重点を置いている。
しかしながら、地域的特徴は、一般的にこれらのメソッドで定義された属性の固定セットを予測するために使用され、これは2つの側面のパフォーマンスと実用性を制限します。
1)地域特性は,属性間で共有される共通特性を捉えるために,特定の属性に特有のきめ細かいパターンを損なう可能性がある。
2) 地域的特徴は, テスト時間内に見知らぬ属性を予測するために一般化できない。
本稿では,各属性の微粒化特性を個別に抽出するPARに対して,Semanti\textbf{C} g\textbf{U}ided under\textbf{S}tanding (FOCUS)アプローチを用いた \textbf{F}ine-fine \textbf{O}ptimizationを提案する。
具体的には,多角性混合トークン(MGMT)を用いて,視覚的粒度の異なる遅延特徴を捕捉し,抽出した情報の多様性を向上する。
次に、Attribute-guided Visual Feature extract (AVFE)モジュールを導入し、テキスト属性をクエリとして利用して、クロスアテンション機構を用いてMix Tokensから対応する視覚属性の特徴を検索する。
テキスト属性が適切な混合トークンに焦点を合わせるために、同一領域内の属性が一貫した注意マップを共有することを奨励する領域認識コントラスト学習(RACL)手法をさらに取り入れる。
PA100K, PETA, RAPv1データセットの大規模な実験により, 本手法の有効性と強力な一般化能力が示された。
関連論文リスト
- ViTA-PAR: Visual and Textual Attribute Alignment with Attribute Prompting for Pedestrian Attribute Recognition [8.982938200941092]
歩行者属性認識(PAR)は、衣服、アクセサリー、性別などの個人の詳細な属性を特定することを目的としている。
ViTA-PARは4つのPARベンチマークで検証され、効率的な推論で競合性能を達成する。
論文 参考訳(メタデータ) (2025-06-02T08:07:06Z) - LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification [63.07563443280147]
本稿では,AG-ReID のための新しいフレームワーク LATex を提案する。
属性ベースのテキスト知識を活用するために、プロンプトチューニング戦略を採用する。
我々のフレームワークは、AG-ReIDを改善するために属性ベースのテキスト知識を完全に活用できる。
論文 参考訳(メタデータ) (2025-03-31T04:47:05Z) - A Solution to Co-occurrence Bias: Attributes Disentanglement via Mutual
Information Minimization for Pedestrian Attribute Recognition [10.821982414387525]
そこで本研究では,現在の手法が,データセット分布のシーンやアイデンティティに適合する属性の相互依存性の一般化に実際に苦慮していることを示す。
現実的な場面で頑健なモデルをレンダリングするために,属性不整形特徴学習を提案し,属性の認識が他者の存在に依存しないことを保証する。
論文 参考訳(メタデータ) (2023-07-28T01:34:55Z) - ASD: Towards Attribute Spatial Decomposition for Prior-Free Facial
Attribute Recognition [11.757112726108822]
顔属性の空間特性の表現は、顔属性認識(FAR)にとって重要な課題である
近年のFARの性能向上は,余分な事前情報による空間特性記述の恩恵を受け,信頼性の高い性能を実現している。
本研究では,属性の空間的曖昧さを余分な事前情報なしで軽減する属性空間分解法(ASD)を提案する。
論文 参考訳(メタデータ) (2022-10-25T02:25:05Z) - TransFA: Transformer-based Representation for Face Attribute Evaluation [87.09529826340304]
我々はtextbfTransFA を用いたtextbfattribute 評価のための新しい textbf Transformer 表現を提案する。
提案するTransFAは,最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-12T10:58:06Z) - Attribute Prototype Network for Any-Shot Learning [113.50220968583353]
属性ローカライズ機能を統合した画像表現は、任意のショット、すなわちゼロショットと少数ショットのイメージ分類タスクに有用である、と我々は主張する。
クラスレベルの属性のみを用いてグローバルな特徴とローカルな特徴を共同で学習する新しい表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-04T02:25:40Z) - Spatial and Semantic Consistency Regularizations for Pedestrian
Attribute Recognition [50.932864767867365]
本稿では,各属性に対する空間的および意味的一貫性を実現するために,2つの相補的正規化からなるフレームワークを提案する。
属性の正確な位置に基づいて,本質的および識別的意味的特徴を抽出する意味的整合性正規化を提案する。
その結果,提案手法はパラメータを増大させることなく,最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-09-13T03:36:44Z) - Pedestrian Attribute Recognition in Video Surveillance Scenarios Based
on View-attribute Attention Localization [8.807717261983539]
注目度(VALA)に基づく新しいビュー属性ローカライズ手法を提案する。
特定のビュー属性は、抽出された属性特徴と、異なるビューからの属性に対する信頼度としてビュー予測器によって予測される4つのビュースコアによって構成される。
3つのワイドデータセット(RAP, RAPv2, PETA, PA-100K)による実験により, 最先端手法と比較して, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-06-11T16:09:31Z) - Attributes-Guided and Pure-Visual Attention Alignment for Few-Shot
Recognition [27.0842107128122]
属性誘導型アテンションモジュール (AGAM) を設計し, 属性を付加し, より識別的な特徴を学習する。
提案モジュールは,最先端性能を実現するため,単純なメートル法に基づくアプローチを大幅に改善することができる。
論文 参考訳(メタデータ) (2020-09-10T08:38:32Z) - Attribute Mix: Semantic Data Augmentation for Fine Grained Recognition [102.45926816660665]
本研究では属性レベルのデータ拡張戦略であるAttribute Mixを提案する。
その原則は、属性の特徴が細粒度のサブカテゴリ間で共有され、画像間でシームレスに転送可能であることである。
論文 参考訳(メタデータ) (2020-04-06T14:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。