論文の概要: Spatial and Semantic Consistency Regularizations for Pedestrian
Attribute Recognition
- arxiv url: http://arxiv.org/abs/2109.05686v1
- Date: Mon, 13 Sep 2021 03:36:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:37:29.512312
- Title: Spatial and Semantic Consistency Regularizations for Pedestrian
Attribute Recognition
- Title(参考訳): 歩行者属性認識のための空間的・意味的一貫性規則化
- Authors: Jian Jia and Xiaotang Chen and Kaiqi Huang
- Abstract要約: 本稿では,各属性に対する空間的および意味的一貫性を実現するために,2つの相補的正規化からなるフレームワークを提案する。
属性の正確な位置に基づいて,本質的および識別的意味的特徴を抽出する意味的整合性正規化を提案する。
その結果,提案手法はパラメータを増大させることなく,最先端の手法に対して良好に動作することがわかった。
- 参考スコア(独自算出の注目度): 50.932864767867365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While recent studies on pedestrian attribute recognition have shown
remarkable progress in leveraging complicated networks and attention
mechanisms, most of them neglect the inter-image relations and an important
prior: spatial consistency and semantic consistency of attributes under
surveillance scenarios. The spatial locations of the same attribute should be
consistent between different pedestrian images, \eg, the ``hat" attribute and
the ``boots" attribute are always located at the top and bottom of the picture
respectively. In addition, the inherent semantic feature of the ``hat"
attribute should be consistent, whether it is a baseball cap, beret, or helmet.
To fully exploit inter-image relations and aggregate human prior in the model
learning process, we construct a Spatial and Semantic Consistency (SSC)
framework that consists of two complementary regularizations to achieve spatial
and semantic consistency for each attribute. Specifically, we first propose a
spatial consistency regularization to focus on reliable and stable
attribute-related regions. Based on the precise attribute locations, we further
propose a semantic consistency regularization to extract intrinsic and
discriminative semantic features. We conduct extensive experiments on popular
benchmarks including PA100K, RAP, and PETA. Results show that the proposed
method performs favorably against state-of-the-art methods without increasing
parameters.
- Abstract(参考訳): 近年の歩行者属性認識研究では,複雑なネットワークや注意機構の活用が著しく進んでいるが,そのほとんどは画像間の関係や,監視シナリオにおける属性の空間的一貫性と意味的一貫性を無視している。
同じ属性の空間的位置は、異なる歩行者画像の間で一貫性を持たなければならない。\e, ``hat" 属性と ``boots" 属性は、それぞれ画像の上部と下部に置かれる。
さらに、`hat"属性の固有の意味的特徴は、野球帽、ベレー帽、ヘルメットであっても一貫性があるべきである。
画像間関係を十分に活用し,モデル学習プロセスに先立って人間を集約するために,各属性の空間的・意味的一貫性を実現するために,2つの補完的正規化からなる空間的・意味的一貫性(ssc)フレームワークを構築する。
具体的には,まず,信頼性と安定した属性関連領域に着目した空間的一貫性の正規化を提案する。
属性の正確な位置に基づいて、本質的および識別的意味的特徴を抽出する意味的整合性正規化を提案する。
PA100K, RAP, PETAなど, 人気のあるベンチマークについて広範な実験を行った。
その結果,提案手法はパラメータを増加させることなく,最先端手法に対して好適に動作することがわかった。
関連論文リスト
- Dual Relation Mining Network for Zero-Shot Learning [48.89161627050706]
本稿では,効果的な視覚・意味的相互作用を実現し,知識伝達のための属性間の意味的関係を学習するためのDual Relation Mining Network(DRMN)を提案する。
具体的には,多層的特徴融合により視覚情報を強化する視覚・意味的関係マイニングのためのデュアルアテンションブロック(DAB)を提案する。
セマンティック・インタラクション・トランスフォーマ(SIT)を用いて画像間の属性表現の一般化を促進する。
論文 参考訳(メタデータ) (2024-05-06T16:31:19Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.94040814459116]
自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文 参考訳(メタデータ) (2023-08-19T09:12:13Z) - A Solution to Co-occurrence Bias: Attributes Disentanglement via Mutual
Information Minimization for Pedestrian Attribute Recognition [10.821982414387525]
そこで本研究では,現在の手法が,データセット分布のシーンやアイデンティティに適合する属性の相互依存性の一般化に実際に苦慮していることを示す。
現実的な場面で頑健なモデルをレンダリングするために,属性不整形特徴学習を提案し,属性の認識が他者の存在に依存しないことを保証する。
論文 参考訳(メタデータ) (2023-07-28T01:34:55Z) - Leveraging Hidden Positives for Unsupervised Semantic Segmentation [5.937673383513695]
隠れ陽性を抽出することで、コントラスト学習を活用して、豊かな意味関係を学習する。
隣接パッチ間のセマンティック一貫性を学習するための勾配伝搬戦略を導入する。
提案手法は,COCO-stuff,Cityscapes,Potsdam-3データセットにおけるSOTA(State-of-the-art)の新たな結果を実現する。
論文 参考訳(メタデータ) (2023-03-27T08:57:28Z) - Calibrated Feature Decomposition for Generalizable Person
Re-Identification [82.64133819313186]
Calibrated Feature Decomposition (CFD)モジュールは、人物の再識別の一般化能力の向上に焦点を当てている。
キャリブレーション・アンド・スタンダード化されたバッチ正規化(CSBN)は、キャリブレーションされた人物表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-11-27T17:12:43Z) - Matched sample selection with GANs for mitigating attribute confounding [30.488267816304177]
保護属性間の属性分布のバランスのとれたフルデータセットから画像のサブセットを選択するマッチングアプローチを提案する。
私たちのマッチングアプローチでは、セマンティック属性を保存する方法で、まず実際の画像を生成ネットワークの潜在空間に投影します。
次に、選択された保護属性にまたがるこの潜在空間で敵の一致を見つけ、セマンティクスと知覚属性が保護属性間でバランスをとるデータセットを生成する。
論文 参考訳(メタデータ) (2021-03-24T19:18:44Z) - Unsupervised segmentation via semantic-apparent feature fusion [21.75371777263847]
本研究では,意味親和性特徴融合(SAFF)に基づく教師なし前景セグメンテーション手法を提案する。
前景オブジェクトのキー領域はセマンティック機能によって正確に応答できる。
意味的特徴と明らかな特徴を融合させ、画像内適応的特徴量学習と画像間共通特徴学習のモジュールをカスケードすることにより、ベースラインをはるかに超える性能を達成する。
論文 参考訳(メタデータ) (2020-05-21T08:28:49Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。