論文の概要: A Multi-task Joint Framework for Real-time Person Search
- arxiv url: http://arxiv.org/abs/2012.06418v1
- Date: Fri, 11 Dec 2020 15:21:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 02:58:46.696024
- Title: A Multi-task Joint Framework for Real-time Person Search
- Title(参考訳): リアルタイム人物検索のためのマルチタスク統合フレームワーク
- Authors: Ye Li, Kangning Yin, Jie Liang, Chunyu Wang, Guangqiang Yin
- Abstract要約: MJF (Multi-task Joint Framework for Real-time Person Search) を提案する。
人検出モジュールとして,人物データセットをトレーニングしたYOLOv5-GSモデルを提案する。
特徴抽出モジュールでは、人数に応じて異なるネットワークを選択することができるモデル適応アーキテクチャ(MAA)を設計する。
- 参考スコア(独自算出の注目度): 21.11138392681009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person search generally involves three important parts: person detection,
feature extraction and identity comparison. However, person search integrating
detection, extraction and comparison has the following drawbacks. Firstly, the
accuracy of detection will affect the accuracy of comparison. Secondly, it is
difficult to achieve real-time in real-world applications. To solve these
problems, we propose a Multi-task Joint Framework for real-time person search
(MJF), which optimizes the person detection, feature extraction and identity
comparison respectively. For the person detection module, we proposed the
YOLOv5-GS model, which is trained with person dataset. It combines the
advantages of the Ghostnet and the Squeeze-and-Excitation (SE) block, and
improves the speed and accuracy. For the feature extraction module, we design
the Model Adaptation Architecture (MAA), which could select different network
according to the number of people. It could balance the relationship between
accuracy and speed. For identity comparison, we propose a Three Dimension (3D)
Pooled Table and a matching strategy to improve identification accuracy. On the
condition of 1920*1080 resolution video and 500 IDs table, the identification
rate (IR) and frames per second (FPS) achieved by our method could reach 93.6%
and 25.7,
- Abstract(参考訳): パーソナライズ検索は一般的に3つの重要な部分を含む:パーソナライズ検出、特徴抽出、アイデンティティ比較。
しかし, 検出, 抽出, 比較を統合した人物探索には, 以下の欠点がある。
まず、検出の精度が比較の精度に影響を与える。
第2に,リアルタイムアプリケーションの実現は困難である。
そこで本研究では,人物検出,特徴抽出,同一性比較をそれぞれ最適化したリアルタイム人物検索のためのマルチタスク統合フレームワークを提案する。
人検出モジュールとして,人物データセットをトレーニングしたYOLOv5-GSモデルを提案する。
ghostnetとswish-and-excitation (se)ブロックの利点を組み合わせることで、スピードと精度を向上させる。
特徴抽出モジュールでは、人数に応じて異なるネットワークを選択することができるモデル適応アーキテクチャ(MAA)を設計する。
精度と速度の関係をバランスさせることができます。
同一性比較のために,3次元(3次元)プーリングテーブルとマッチング戦略を提案し,識別精度を向上させる。
1920*1080の解像度ビデオと500のIDテーブルの条件で、我々の方法で達成された識別率(IR)とフレーム/秒(FPS)は93.6%と25.7に達した。
関連論文リスト
- Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
マルチオブジェクトトラッキング(MOT)タスクにおいて,JDEトラッカーは優れた性能を示した。
オブジェクトの時間的情報を取得するために,クロスコリレーションを用いた新しい学習手法を提案する。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - Comparison of Data Representations and Machine Learning Architectures
for User Identification on Arbitrary Motion Sequences [8.967985264567217]
本稿では,頭部と手の動きの任意のシーケンスに基づいて,異なる機械学習手法を用いてユーザを識別する。
すべてのコードを公開して、将来の作業のベースラインを提供しています。
このモデルは、150秒以内の精度で、34人の被験者のどれかを正確に識別する。
論文 参考訳(メタデータ) (2022-10-02T14:12:10Z) - End-to-end Person Search Sequentially Trained on Aggregated Dataset [1.9766522384767227]
本稿では,検出と特徴抽出を共同で計算するエンド・ツー・エンドのモデルを提案する。
コストのかかるIDアノテーションを使わずに、より多くの歩行者検出データセットを集約することで、共有機能マップがより汎用的であることを示す。
論文 参考訳(メタデータ) (2022-01-24T11:22:15Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。