論文の概要: OIMNet++: Prototypical Normalization and Localization-aware Learning for
Person Search
- arxiv url: http://arxiv.org/abs/2207.10320v1
- Date: Thu, 21 Jul 2022 06:34:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-22 13:01:33.970485
- Title: OIMNet++: Prototypical Normalization and Localization-aware Learning for
Person Search
- Title(参考訳): OIMNet++: 人物検索のためのプロトタイプ正規化とローカライズ対応学習
- Authors: Sanghoon Lee, Youngmin Oh, Donghyeon Baek, Junghyup Lee, Bumsub Ham
- Abstract要約: 我々は,人物検索,すなわち,生のシーン画像から人物をローカライズし,再同定するタスクに対処する。
近年のアプローチは、人探索の先駆的な研究であるOIMNetに基づいて構築され、共同人物表現を学習し、検出と人の再識別の両方を行う。
ProtoNormと呼ばれる新しい正規化レイヤを導入し、人身認証の長期分布を考慮しつつ、歩行者の提案から特徴を校正する。
- 参考スコア(独自算出の注目度): 34.460973847554364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the task of person search, that is, localizing and re-identifying
query persons from a set of raw scene images. Recent approaches are typically
built upon OIMNet, a pioneer work on person search, that learns joint person
representations for performing both detection and person re-identification
(reID) tasks. To obtain the representations, they extract features from
pedestrian proposals, and then project them on a unit hypersphere with L2
normalization. These methods also incorporate all positive proposals, that
sufficiently overlap with the ground truth, equally to learn person
representations for reID. We have found that 1) the L2 normalization without
considering feature distributions degenerates the discriminative power of
person representations, and 2) positive proposals often also depict background
clutter and person overlaps, which could encode noisy features to person
representations. In this paper, we introduce OIMNet++ that addresses the
aforementioned limitations. To this end, we introduce a novel normalization
layer, dubbed ProtoNorm, that calibrates features from pedestrian proposals,
while considering a long-tail distribution of person IDs, enabling L2
normalized person representations to be discriminative. We also propose a
localization-aware feature learning scheme that encourages better-aligned
proposals to contribute more in learning discriminative representations.
Experimental results and analysis on standard person search benchmarks
demonstrate the effectiveness of OIMNet++.
- Abstract(参考訳): 我々は,人物検索,すなわち,生のシーン画像から人物をローカライズし,再同定するタスクに対処する。
近年のアプローチは、人探索の先駆的な研究であるOIMNetに基づいて構築され、人の再識別(reID)タスクを実行するために、共同人物表現を学習している。
表現を得るために、歩行者の提案から特徴を抽出し、l2正規化を持つ単位超球面に投影する。
これらの手法は全ての肯定的な提案を取り入れており、それは基礎的真理と十分に重なるものであり、同様にreidの人的表現を学ぶ。
私たちはそれを見つけました
1)特徴分布を考慮しないl2正規化は、人的表現の判別能力を低下させ、
2) 肯定的な提案は背景クラッタや人物重複も表現し, 雑音特性を人物表現に符号化する。
本稿では,上記の制限に対処するOIMNet++を紹介する。
この目的のために, 歩行者idのロングテール分布を考慮しつつ, 歩行者提案の特徴を補う新しい正規化層protonormを導入し, l2正規化人物表現を判別可能にした。
また,識別表現の学習において,より協調的な提案を奨励するローカライズ・アウェア特徴学習スキームを提案する。
標準人物探索ベンチマークの実験結果と解析により,OIMNet++の有効性が示された。
関連論文リスト
- PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - Body Part-Based Representation Learning for Occluded Person
Re-Identification [102.27216744301356]
隠蔽人物再識別(ReID)とは,隠蔽人物画像と包括的人物画像とのマッチングを目的とした人物検索タスクである。
パートベースの手法は、微細な情報を提供し、部分的に見える人間の体を表現するのに適しているため、有益であることが示されている。
本稿では,BPBreIDという身体部分に基づくReIDモデルを提案する。
論文 参考訳(メタデータ) (2022-11-07T16:48:41Z) - Global-Local Context Network for Person Search [125.51080862575326]
パーソンサーチは、自然に切り刻まれた画像からクエリーを共同でローカライズし、識別することを目的としている。
我々は,対象人物を取り巻く環境情報を多様かつ局所的に利用し,それぞれがシーンとグループコンテキストを参照する。
本稿では,機能強化を目的としたグローバル・ローカル・コンテキスト・ネットワーク(GLCNet)を提案する。
論文 参考訳(メタデータ) (2021-12-05T07:38:53Z) - Exploring Visual Context for Weakly Supervised Person Search [155.46727990750227]
人探索は、歩行者の検出と人物の再識別を共同で扱う、困難なタスクとして最近登場した。
既存のアプローチは、バウンディングボックスとIDアノテーションの両方が利用可能な完全に教師付き設定に従っている。
本稿では,ボックスアノテーションのみを用いた弱教師付き人物検索について実験的に考察する。
論文 参考訳(メタデータ) (2021-06-19T14:47:13Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - A Convolutional Baseline for Person Re-Identification Using Vision and
Language Descriptions [24.794592610444514]
現実世界の監視シナリオでは、クエリされた人に関する視覚的な情報は頻繁に提供されない。
クロスエントロピー損失によって制御される2つのストリームディープ畳み込みニューラルネットワークフレームワークを示す。
学習した視覚表現は、単一のモダリティシステムと比較して、より堅牢で、検索時に22%向上する。
論文 参考訳(メタデータ) (2020-02-20T10:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。