論文の概要: Efficient Person Search: An Anchor-Free Approach
- arxiv url: http://arxiv.org/abs/2109.00211v1
- Date: Wed, 1 Sep 2021 07:01:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-02 14:21:46.406747
- Title: Efficient Person Search: An Anchor-Free Approach
- Title(参考訳): 効率的な人物検索:アンカーフリーアプローチ
- Authors: Yichao Yan, Jinpeng Li, Jie Qin, Shengcai Liao, Xiaokang Yang
- Abstract要約: パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
- 参考スコア(独自算出の注目度): 86.45858994806471
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person search aims to simultaneously localize and identify a query person
from realistic, uncropped images. To achieve this goal, state-of-the-art models
typically add a re-id branch upon two-stage detectors like Faster R-CNN. Owing
to the ROI-Align operation, this pipeline yields promising accuracy as re-id
features are explicitly aligned with the corresponding object regions, but in
the meantime, it introduces high computational overhead due to dense object
anchors. In this work, we present an anchor-free approach to efficiently
tackling this challenging task, by introducing the following dedicated designs.
First, we select an anchor-free detector (i.e., FCOS) as the prototype of our
framework. Due to the lack of dense object anchors, it exhibits significantly
higher efficiency compared with existing person search models. Second, when
directly accommodating this anchor-free detector for person search, there exist
several major challenges in learning robust re-id features, which we summarize
as the misalignment issues in different levels (i.e., scale, region, and task).
To address these issues, we propose an aligned feature aggregation module to
generate more discriminative and robust feature embeddings. Accordingly, we
name our model as Feature-Aligned Person Search Network (AlignPS). Third, by
investigating the advantages of both anchor-based and anchor-free models, we
further augment AlignPS with an ROI-Align head, which significantly improves
the robustness of re-id features while still keeping our model highly
efficient. Extensive experiments conducted on two challenging benchmarks (i.e.,
CUHK-SYSU and PRW) demonstrate that our framework achieves state-of-the-art or
competitive performance, while displaying higher efficiency. All the source
codes, data, and trained models are available at:
https://github.com/daodaofr/alignps.
- Abstract(参考訳): パーソンサーチ(person search)は、クエリーの人物を同時にローカライズし、特定することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
ROI-Align演算により、このパイプラインは、re-id機能が対応するオブジェクト領域と明示的に一致しているため、有望な精度が得られるが、一方で、高密度オブジェクトアンカーによる高い計算オーバーヘッドを導入する。
本稿では,この課題を効率的に解決するためのアンカーフリーなアプローチを提案する。
まず、我々のフレームワークのプロトタイプとしてアンカーフリー検出器(FCOS)を選択する。
密度の高いオブジェクトアンカーがないため、既存の人物探索モデルに比べてかなり高い効率を示す。
第二に、このアンカーフリー検出器を人探索のために直接調節する場合、ロバストなre-id特徴の学習にはいくつかの大きな課題があり、これは異なるレベル(スケール、リージョン、タスク)の誤調整問題として要約する。
これらの問題に対処するため,我々は,より識別的でロバストな特徴埋め込みを生成するためのアライメント機能アグリゲーションモジュールを提案する。
そこで我々は,このモデルを機能連携型人物検索ネットワーク(alignps)と呼ぶ。
第3に, アンカーベースモデルとアンカーフリーモデルの両方の利点を調査することにより, ROI-AlignヘッドでAlignPSをさらに強化し, モデルを高効率に保ちながら, 再構成機能の堅牢性を大幅に向上させる。
CUHK-SYSU(英語版)とPRW(英語版)の2つの挑戦的ベンチマークで実施された大規模な実験は、我々のフレームワークが高い効率を示しながら最先端または競争的な性能を達成することを示した。
ソースコード、データ、トレーニングされたモデルはすべて、https://github.com/daodaofr/alignps.comで入手できる。
関連論文リスト
- Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Correlation-Aware Deep Tracking [83.51092789908677]
本稿では,自己/横断的意図に着想を得た,新たなターゲット依存型特徴ネットワークを提案する。
我々のネットワークは機能ネットワークの複数の層にクロスイメージの特徴相関を深く埋め込んでいる。
我々のモデルは、豊富な未ペア画像に対して柔軟に事前訓練が可能であり、既存の手法よりも顕著に高速な収束をもたらす。
論文 参考訳(メタデータ) (2022-03-03T11:53:54Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Enhancing Object Detection for Autonomous Driving by Optimizing Anchor
Generation and Addressing Class Imbalance [0.0]
本研究では,より高速なR-CNNに基づく拡張型2次元物体検出器を提案する。
より高速なr-cnnに対する修正は計算コストを増加させず、他のアンカーベースの検出フレームワークを最適化するために容易に拡張できる。
論文 参考訳(メタデータ) (2021-04-08T16:58:31Z) - Anchor-Free Person Search [127.88668724345195]
パーソンサーチ(person search)は、クエリーの人物を同時にローカライズし、特定することを目的としている。
既存の作品の多くはfaster-rcnnのような2段検出器を採用しており、精度は高いが計算オーバーヘッドは高い。
この課題に効率的に取り組む最初のアンカーフリーフレームワークであるFeature-Aligned Person Search Network(AlignPS)を紹介します。
論文 参考訳(メタデータ) (2021-03-22T07:04:29Z) - Sequential End-to-end Network for Efficient Person Search [7.3658840620058115]
人物検出と人物再識別(re-ID)を共同で解決することを目的とした人物探索
既存の研究は、Faster R-CNNに基づくエンドツーエンドネットワークを設計している。
優れた特徴を抽出するためのシーケンシャルエンドツーエンドネットワーク(SeqNet)を提案する。
論文 参考訳(メタデータ) (2021-03-18T10:28:24Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。