論文の概要: Swap Path Network for Robust Person Search Pre-training
- arxiv url: http://arxiv.org/abs/2412.05433v1
- Date: Fri, 06 Dec 2024 21:35:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:55:30.275286
- Title: Swap Path Network for Robust Person Search Pre-training
- Title(参考訳): ロバストな人物探索のためのスワップパスネットワーク
- Authors: Lucas Jaffe, Avideh Zakhor,
- Abstract要約: 我々は、エンドツーエンドの人物探索のための最初のフレームワークを提示する。
提案手法は,近年のバックボーンのみによる事前学習方法よりも,より効果的で,効率的で,かつ頑健であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In person search, we detect and rank matches to a query person image within a set of gallery scenes. Most person search models make use of a feature extraction backbone, followed by separate heads for detection and re-identification. While pre-training methods for vision backbones are well-established, pre-training additional modules for the person search task has not been previously examined. In this work, we present the first framework for end-to-end person search pre-training. Our framework splits person search into object-centric and query-centric methodologies, and we show that the query-centric framing is robust to label noise, and trainable using only weakly-labeled person bounding boxes. Further, we provide a novel model dubbed Swap Path Net (SPNet) which implements both query-centric and object-centric training objectives, and can swap between the two while using the same weights. Using SPNet, we show that query-centric pre-training, followed by object-centric fine-tuning, achieves state-of-the-art results on the standard PRW and CUHK-SYSU person search benchmarks, with 96.4% mAP on CUHK-SYSU and 61.2% mAP on PRW. In addition, we show that our method is more effective, efficient, and robust for person search pre-training than recent backbone-only pre-training alternatives.
- Abstract(参考訳): 個人検索では,ギャラリーシーン内の質問人画像との一致を検知し,ランク付けする。
ほとんどの人物検索モデルは、特徴抽出バックボーンを使用し、その後、検出と再識別のために別個のヘッドが続く。
視線バックボーンの事前学習手法は確立されているが,人探索作業のための事前学習モジュールについては,これまで検討されていない。
本研究では,エンド・ツー・エンドの人が事前学習を行うための最初のフレームワークを提案する。
本フレームワークでは,検索対象をオブジェクト中心およびクエリ中心の方法論に分割し,クエリ中心のフレーミングがノイズのラベル付けに頑健であり,弱いラベル付き人境界ボックスのみを用いてトレーニング可能であることを示す。
さらに、クエリ中心とオブジェクト中心のトレーニング目的の両方を実装し、同じ重みを使ってこの2つを交換できるSPNetと呼ばれる新しいモデルを提供する。
SPNetを用いて,従来のPRWとCUHK-SYSUの個人検索ベンチマークにおいて,クエリ中心の事前学習,続いてオブジェクト中心の微調整を行い,96.4%がCUHK-SYSUで,61.2%がPRWで得られた。
さらに,本手法は,近年のバックボーンのみの事前学習方法よりも,人による事前学習に有効で,効率的で堅牢であることを示す。
関連論文リスト
- CLEAR: Cross-Transformers with Pre-trained Language Model is All you need for Person Attribute Recognition and Retrieval [0.18749305679160366]
属性認識と属性ベースの検索は、人間中心の2つのコアタスクである。
個人属性認識のための頑健なクロストランスフォーマーネットワークを導入する。
また、アダプタのいくつかの追加パラメータのみをトレーニングするための効果的なトレーニング戦略も導入しています。
CLEARは、両方のタスクに対して最先端のパフォーマンスまたは競合的な結果を達成する。
論文 参考訳(メタデータ) (2024-03-10T07:31:06Z) - Learning to Retrieve for Job Matching [22.007634436648427]
本稿では、LinkedInの求人・推薦システムを強化するための学習検索技術の適用について論じる。
確認された雇用データを利用して求職者の求職資格を評価するグラフを構築し、学習したリンクを検索に活用する。
従来の逆インデックスに基づく解に加えて、KNNと項マッチングの両方を効率的にサポートできるon-GPUソリューションを開発した。
論文 参考訳(メタデータ) (2024-02-21T00:05:25Z) - Divide and Conquer: Hybrid Pre-training for Person Search [40.13016375392472]
本研究では,サブタスクデータのみを用いた人物検索のためのハイブリッド事前学習フレームワークを提案する。
我々のモデルは、人物探索法、微調整データ、事前学習データ、モデルバックボーンなど、多様なプロトコルで大幅に改善できる。
私たちのコードと事前訓練されたモデルは、人検索コミュニティにプラグイン・アンド・プレイの使用のためにリリースされます。
論文 参考訳(メタデータ) (2023-12-13T08:33:50Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Generalizable Person Search on Open-world User-Generated Video Content [93.72028298712118]
人物の検索は、大量の露骨なシーン画像から個人を検索する、困難な作業である。
既存の人検索アプリケーションは、ほとんどトレーニングされ、同じシナリオにデプロイされます。
本稿では,任意のシナリオにおける下流タスクを容易にするために,特徴レベルとデータレベルの両方の一般化可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-16T04:59:50Z) - PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - Global-Local Context Network for Person Search [125.51080862575326]
パーソンサーチは、自然に切り刻まれた画像からクエリーを共同でローカライズし、識別することを目的としている。
我々は,対象人物を取り巻く環境情報を多様かつ局所的に利用し,それぞれがシーンとグループコンテキストを参照する。
本稿では,機能強化を目的としたグローバル・ローカル・コンテキスト・ネットワーク(GLCNet)を提案する。
論文 参考訳(メタデータ) (2021-12-05T07:38:53Z) - Exploring Visual Context for Weakly Supervised Person Search [155.46727990750227]
人探索は、歩行者の検出と人物の再識別を共同で扱う、困難なタスクとして最近登場した。
既存のアプローチは、バウンディングボックスとIDアノテーションの両方が利用可能な完全に教師付き設定に従っている。
本稿では,ボックスアノテーションのみを用いた弱教師付き人物検索について実験的に考察する。
論文 参考訳(メタデータ) (2021-06-19T14:47:13Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。