論文の概要: Dynamic Template Initialization for Part-Aware Person Re-ID
- arxiv url: http://arxiv.org/abs/2208.11440v1
- Date: Wed, 24 Aug 2022 11:20:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 12:04:50.851795
- Title: Dynamic Template Initialization for Part-Aware Person Re-ID
- Title(参考訳): パートアウェアのRe-IDに対する動的テンプレート初期化
- Authors: Kalana Abeywardena, Shechem Sumanthiran, Sanoojan Baliah, Nadarasar
Bahavan, Nalith Udugampola, Ajith Pasqual, Chamira Edussooriya and Ranga
Rodrigo
- Abstract要約: 空間アテンションベースのDynamic Partテンプレート初期化モジュール。
背骨の部分的な特徴は、多様な人体部分のテンプレートを抽出するために用いられる。
全体的、排他的、部分的なRe-IDタスクベンチマークに関するテスト。
- 参考スコア(独自算出の注目度): 0.640781528166787
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Many of the existing Person Re-identification (Re-ID) approaches depend on
feature maps which are either partitioned to localize parts of a person or
reduced to create a global representation. While part localization has shown
significant success, it uses either na{\i}ve position-based partitions or
static feature templates. These, however, hypothesize the pre-existence of the
parts in a given image or their positions, ignoring the input image-specific
information which limits their usability in challenging scenarios such as Re-ID
with partial occlusions and partial probe images. In this paper, we introduce a
spatial attention-based Dynamic Part Template Initialization module that
dynamically generates part-templates using mid-level semantic features at the
earlier layers of the backbone. Following a self-attention layer, human
part-level features of the backbone are used to extract the templates of
diverse human body parts using a simplified cross-attention scheme which will
then be used to identify and collate representations of various human parts
from semantically rich features, increasing the discriminative ability of the
entire model. We further explore adaptive weighting of part descriptors to
quantify the absence or occlusion of local attributes and suppress the
contribution of the corresponding part descriptors to the matching criteria.
Extensive experiments on holistic, occluded, and partial Re-ID task benchmarks
demonstrate that our proposed architecture is able to achieve competitive
performance. Codes will be included in the supplementary material and will be
made publicly available.
- Abstract(参考訳): 既存のペルソナ再識別(Re-ID)アプローチの多くは、人の一部をローカライズするために分割されたり、グローバルな表現を作成するために縮小されたりした特徴マップに依存している。
部分ローカライゼーションは大きな成功を収めているが、na{\i}ve位置ベースのパーティションまたは静的機能テンプレートを使用する。
しかし、これらは、ある画像またはその位置にある部分の事前存在を仮説化し、部分的閉塞を伴うRe-IDや部分的なプローブ画像のような挑戦的なシナリオでのユーザビリティを制限する入力画像固有の情報を無視する。
本稿では,空間的注意に基づく動的部分テンプレート初期化モジュールについて紹介する。
セルフアテンション層に追従して、様々な人体部位のテンプレートを簡易なクロスアテンションスキームを用いて抽出し、意味的にリッチな特徴から様々なヒト部位の表現を識別・照合し、モデル全体の識別能力を高める。
さらに,局所属性の欠如やオクルージョンを定量化するための部分記述子の適応的な重み付けについて検討し,対応する部分記述子のマッチング基準への寄与を抑制する。
全体的,排他的,部分的なRe-IDタスクベンチマークに関する大規模な実験は,提案アーキテクチャが競合性能を達成可能であることを実証している。
コードは補足資料に含まれ、公開される予定だ。
関連論文リスト
- Distilling Spectral Graph for Object-Context Aware Open-Vocabulary Semantic Segmentation [47.047267066525265]
画像にオブジェクトレベルの文脈知識を取り入れた新しいアプローチを導入する。
提案手法は,多種多様なデータセットにまたがる高い一般化性を有する最先端性能を実現する。
論文 参考訳(メタデータ) (2024-11-26T06:34:48Z) - Multi-Stage Spatio-Temporal Aggregation Transformer for Video Person
Re-identification [78.08536797239893]
本稿では,2つの新しいプロキシ埋め込みモジュールを設計したMSTAT(Multi-Stage Space-Temporal Aggregation Transformer)を提案する。
MSTATは、属性関連、アイデンティティ関連、および属性関連情報をビデオクリップからエンコードする3つのステージから構成される。
MSTATは様々な標準ベンチマークで最先端の精度を達成できることを示す。
論文 参考訳(メタデータ) (2023-01-02T05:17:31Z) - DiP: Learning Discriminative Implicit Parts for Person Re-Identification [18.89539401924382]
我々は,明示的な身体部分から分離された識別的暗黙的部分(DiP)を学習することを提案する。
また、各DiPに対して幾何学的解釈を与えるために、新しい暗黙的位置を提案する。
提案手法は,複数人のReIDベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-12-24T17:59:01Z) - Framework-agnostic Semantically-aware Global Reasoning for Segmentation [29.69187816377079]
本稿では,画像特徴を潜在表現に投影し,それら間の関係を推論するコンポーネントを提案する。
我々の設計では、活性化領域が空間的に不整合であることを保証することにより、潜在領域が意味概念を表現することを奨励している。
潜在トークンはセマンティックに解釈可能で多様性があり、下流タスクに転送可能な豊富な機能セットを提供します。
論文 参考訳(メタデータ) (2022-12-06T21:42:05Z) - Body Part-Based Representation Learning for Occluded Person
Re-Identification [102.27216744301356]
隠蔽人物再識別(ReID)とは,隠蔽人物画像と包括的人物画像とのマッチングを目的とした人物検索タスクである。
パートベースの手法は、微細な情報を提供し、部分的に見える人間の体を表現するのに適しているため、有益であることが示されている。
本稿では,BPBreIDという身体部分に基づくReIDモデルを提案する。
論文 参考訳(メタデータ) (2022-11-07T16:48:41Z) - Part-aware Prototypical Graph Network for One-shot Skeleton-based Action
Recognition [57.86960990337986]
ワンショットスケルトンに基づくアクション認識は、ベースクラスから新しいクラスへの変換可能な表現を学習する上で、ユニークな課題となる。
単発骨格に基づく行動認識のためのパートアウェアなプロトタイプ表現を提案する。
本手法の有効性を2つの公開骨格に基づく行動認識データセットに示す。
論文 参考訳(メタデータ) (2022-08-19T04:54:56Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Fine-grained Few-shot Recognition by Deep Object Parsing [43.61794876834115]
テストインスタンスをK部分を推論することで解析し、各部分が特徴空間内の別の位置を占める。
我々は、そのアクティブテンプレートと、その部分位置の相対幾何学を比較して、テストインスタンスを認識する。
論文 参考訳(メタデータ) (2022-07-14T17:59:05Z) - Calibrated Feature Decomposition for Generalizable Person
Re-Identification [82.64133819313186]
Calibrated Feature Decomposition (CFD)モジュールは、人物の再識別の一般化能力の向上に焦点を当てている。
キャリブレーション・アンド・スタンダード化されたバッチ正規化(CSBN)は、キャリブレーションされた人物表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-11-27T17:12:43Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。