論文の概要: Head and Body: Unified Detector and Graph Network for Person Search in
Media
- arxiv url: http://arxiv.org/abs/2111.13888v1
- Date: Sat, 27 Nov 2021 13:09:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 17:11:03.192925
- Title: Head and Body: Unified Detector and Graph Network for Person Search in
Media
- Title(参考訳): 頭と体:メディアにおける人物検索のための統一検出器とグラフネットワーク
- Authors: Xiujun Shu, Yusheng Tao, Ruizhi Qiao, Bo Ke, Wei Wen, Bo Ren
- Abstract要約: 本稿では,メディアにおける人物検索のための統一検出器とグラフネットワーク(UDGNet)を提案する。
UDGNetは人体と頭部を同時に検出し再識別する最初の人体検索フレームワークである。
本稿では,メディアにおける人物検索のための大規模データセット(PSM)について述べる。
- 参考スコア(独自算出の注目度): 14.117417384037969
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person search in media has seen increasing potential in Internet
applications, such as video clipping and character collection. This task is
common but overlooked by previous person search works which focus on
surveillance scenes. The media scenarios have some different challenges from
surveillance scenes. For example, a person may change his clothes frequently.
To alleviate this issue, this paper proposes a Unified Detector and Graph
Network (UDGNet) for person search in media. UDGNet is the first person search
framework to detect and re-identify the human body and head simultaneously.
Specifically, it first builds two branches based on a unified network to detect
the human body and head, then the detected body and head are used for
re-identification. This dual-task approach can significantly enhance
discriminative learning. To tackle the cloth-changing issue, UDGNet builds two
graphs to explore reliable links among cloth-changing samples and utilizes a
graph network to learn better embeddings. This design effectively enhances the
robustness of person search to cloth-changing challenges. Besides, we
demonstrate that UDGNet can be implemented with both anchor-based and
anchor-free person search frameworks and further achieve performance
improvement. This paper also contributes a large-scale dataset for Person
Search in Media (PSM), which provides both body and head annotations. It is by
far the largest dataset for person search in media. Experiments show that
UDGNet improves the anchor-free model AlignPS by 12.1% in mAP. Meanwhile, it
shows good generalization across surveillance and longterm scenarios. The
dataset and code will be available at: https://github.com/shuxjweb/PSM.git.
- Abstract(参考訳): メディアにおける人物検索は、ビデオクリップやキャラクタコレクションなど、インターネットアプリケーションでポテンシャルが高まっている。
このタスクは一般的だが、監視シーンに焦点を当てた以前の人物検索作業では見過ごされている。
メディアのシナリオには、監視シーンといくつかの異なる課題がある。
例えば、服を頻繁に着替えることがある。
この問題を軽減するために,メディア内の人物検索のための統一検出器とグラフネットワーク(UDGNet)を提案する。
UDGNetは人体と頭部を同時に検出し再識別する最初の人体検索フレームワークである。
具体的には、まず、人間の体と頭を検出する統一ネットワークに基づいて2つの枝を作り、その後、検出された体と頭が再同定に使用される。
このデュアルタスクアプローチは、差別学習を著しく向上させることができる。
布交換問題に対処するため、udgnetは布交換サンプル間の信頼できるリンクを調べるために2つのグラフを構築し、グラフネットワークを利用してより優れた埋め込みを学ぶ。
このデザインは、人物探索の頑健さを布の変形問題に効果的に向上させる。
さらに、UDGNetはアンカーベースとアンカーフリーの両方の人物検索フレームワークで実装でき、さらに性能改善が達成できることを示した。
本稿では,メディアにおける人物検索のための大規模データセット(psm)も提供し,ボディアノテーションとヘッドアノテーションの両方を提供する。
これは、メディアにおける人物検索の最大のデータセットである。
実験の結果、UDGNetはアンカーフリーモデルのAlignPSをmAPで12.1%改善した。
一方、監視と長期シナリオにまたがる優れた一般化を示す。
データセットとコードは、https://github.com/shuxjweb/psm.gitで入手できる。
関連論文リスト
- Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Subgraph Matching via Query-Conditioned Subgraph Matching Neural
Networks and Bi-Level Tree Search [33.9052190473029]
サブグラフマッチングは、グラフデータベース検索、バイオメディカル分析、ソーシャルグループ検索などにおける中核的な操作である。
本稿では,クエリと対象グラフのマッチング情報を動的に計算する,新しいエンコーダ・デコーダニューラルネットワークアーキテクチャを提案する。
5つの大きな実世界のターゲットグラフの実験により、N-BLSはサブグラフマッチング性能を大幅に改善できることが示された。
論文 参考訳(メタデータ) (2022-07-21T04:47:21Z) - Global-Local Context Network for Person Search [125.51080862575326]
パーソンサーチは、自然に切り刻まれた画像からクエリーを共同でローカライズし、識別することを目的としている。
我々は,対象人物を取り巻く環境情報を多様かつ局所的に利用し,それぞれがシーンとグループコンテキストを参照する。
本稿では,機能強化を目的としたグローバル・ローカル・コンテキスト・ネットワーク(GLCNet)を提案する。
論文 参考訳(メタデータ) (2021-12-05T07:38:53Z) - A Variational Graph Autoencoder for Manipulation Action Recognition and
Prediction [1.1816942730023883]
シンボルシーングラフから操作タスクの認識と予測を共同で学習するディープグラフオートエンコーダを提案する。
我々のネットワークは2つの分岐を持つ変分オートエンコーダ構造を持ち、1つは入力グラフタイプを識別し、もう1つは将来のグラフを予測する。
提案手法は,MANIACとMSRC-9の2つの異なるデータセット上で異なる最先端手法に対してベンチマークを行い,提案手法がより優れた性能を実現することを示す。
論文 参考訳(メタデータ) (2021-10-25T21:40:42Z) - Exploring Visual Context for Weakly Supervised Person Search [155.46727990750227]
人探索は、歩行者の検出と人物の再識別を共同で扱う、困難なタスクとして最近登場した。
既存のアプローチは、バウンディングボックスとIDアノテーションの両方が利用可能な完全に教師付き設定に従っている。
本稿では,ボックスアノテーションのみを用いた弱教師付き人物検索について実験的に考察する。
論文 参考訳(メタデータ) (2021-06-19T14:47:13Z) - Anchor-Free Person Search [127.88668724345195]
パーソンサーチ(person search)は、クエリーの人物を同時にローカライズし、特定することを目的としている。
既存の作品の多くはfaster-rcnnのような2段検出器を採用しており、精度は高いが計算オーバーヘッドは高い。
この課題に効率的に取り組む最初のアンカーフリーフレームワークであるFeature-Aligned Person Search Network(AlignPS)を紹介します。
論文 参考訳(メタデータ) (2021-03-22T07:04:29Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - GPS-Net: Graph Property Sensing Network for Scene Graph Generation [91.60326359082408]
シーングラフ生成(SGG)は、画像内のオブジェクトとそれらのペア関係を検出することを目的としている。
GPS-Netは、エッジ方向情報、ノード間の優先度の差、長期にわたる関係の分布という、SGGの3つの特性を網羅している。
GPS-Netは、VG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定とメトリクスで大幅に向上させる。
論文 参考訳(メタデータ) (2020-03-29T07:22:31Z) - FMT:Fusing Multi-task Convolutional Neural Network for Person Search [33.91664470686695]
本稿では,検出と再同定の相関性と不均一性に対処するために,FMT-CNN(Fusing Multi-task Convolutional Neural Network)を提案する。
CUHK-SYSU Person Searchデータセットの実験結果から,提案手法の性能は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-01T05:20:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。