論文の概要: Towards Fully Decoupled End-to-End Person Search
- arxiv url: http://arxiv.org/abs/2309.04967v3
- Date: Sun, 10 Mar 2024 14:00:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 16:30:39.973683
- Title: Towards Fully Decoupled End-to-End Person Search
- Title(参考訳): 完全分離型エンドツーエンド検索を目指して
- Authors: Pengcheng Zhang, Xiao Bai, Jin Zheng, Xin Ning
- Abstract要約: エンド・ツー・エンドの人物探索は、原シーン画像中の対象人物を統一モデルで共同で検出し、再同定することを目的としている。
検出タスクは、re-idタスクが異なるアイデンティティを識別している間に、すべての人を統一する。
既存の手法は、部分的に分離されたモデルのため、サブタスクの1つまたは2つの部分最適である。
タスクインクリメンタルな人探索ネットワークを提案し, タスク検出とリIDサブタスクのためのエンド・ツー・エンド・モデルを構築した。
- 参考スコア(独自算出の注目度): 15.126269826140247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end person search aims to jointly detect and re-identify a target
person in raw scene images with a unified model. The detection task unifies all
persons while the re-id task discriminates different identities, resulting in
conflict optimal objectives. Existing works proposed to decouple end-to-end
person search to alleviate such conflict. Yet these methods are still
sub-optimal on one or two of the sub-tasks due to their partially decoupled
models, which limits the overall person search performance. In this paper, we
propose to fully decouple person search towards optimal person search. A
task-incremental person search network is proposed to incrementally construct
an end-to-end model for the detection and re-id sub-task, which decouples the
model architecture for the two sub-tasks. The proposed task-incremental network
allows task-incremental training for the two conflicting tasks. This enables
independent learning for different objectives thus fully decoupled the model
for persons earch. Comprehensive experimental evaluations demonstrate the
effectiveness of the proposed fully decoupled models for end-to-end person
search.
- Abstract(参考訳): エンド・ツー・エンドの人物探索は、原シーン画像中の対象者を統一モデルで共同で検出し、再同定することを目的としている。
検出タスクは、re-idタスクが異なるアイデンティティを識別している間に、すべての人を統一する。
このような対立を緩和するために、エンドツーエンドの検索を分離する既存の作業が提案されている。
しかし、これらの手法は部分的に分離されたモデルであるため、サブタスクの1つか2つの部分最適である。
本稿では,最適な人物探索に向けた人物探索を完全に分離することを提案する。
2つのサブタスクのモデルアーキテクチャを分離する、検出および再識別するサブタスクのエンドツーエンドモデルを構築するために、タスクインクリメンタルなパーソンサーチネットワークを提案する。
提案するtask-incremental networkは、2つの競合するタスクのtask-incrementalトレーニングを可能にする。
これにより、異なる目的に対して独立した学習が可能となり、それによって、人的階層のモデルを完全に分離する。
包括的実験評価により,完全分離モデルの有効性が実証された。
関連論文リスト
- PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - Grouped Adaptive Loss Weighting for Person Search [44.713344415358414]
個人探索は、特にエンドツーエンドで解決された場合、典型的なマルチタスク学習問題である。
本稿では,各タスクの重みを自動的に動的に調整するグループ適応損失重み付け法を提案する。
論文 参考訳(メタデータ) (2022-09-23T09:32:54Z) - Suspected Object Matters: Rethinking Model's Prediction for One-stage
Visual Grounding [93.82542533426766]
疑似オブジェクト間の対象オブジェクト選択を促進するため,疑似オブジェクト変換機構(SOT)を提案する。
SOTは既存のCNNとTransformerベースのワンステージ視覚グラウンドにシームレスに統合できる。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-10T06:41:07Z) - Subtask-dominated Transfer Learning for Long-tail Person Search [12.311100923753449]
人物探索は、パノラマギャラリー画像から質問者を見つけるために、人物検出と人物再識別(Re-ID)を統一する。
1つの大きな課題は、不均衡なロングテールの個人識別分布である。
本稿では,この問題を解決するために,Subtask-dominated Transfer Learning (STL)法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:34:48Z) - Making Person Search Enjoy the Merits of Person Re-identification [12.311100923753449]
我々はTDN(Teacher-guided Disentangling Networks)という,より高速で強力な人物検索フレームワークを提案する。
提案したTDNは、高度な人物Re-ID知識を人物検索モデルに転送することにより、人物検索性能を大幅に向上させることができる。
また,Re-IDモデルとワンステップ人物探索モデルとの間の入力形式の違いによるスケールギャップを橋渡しする知識伝達ブリッジモジュールを提案する。
論文 参考訳(メタデータ) (2021-08-24T06:00:13Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - Tasks Integrated Networks: Joint Detection and Retrieval for Image
Search [99.49021025124405]
多くの現実世界の探索シナリオ(例えばビデオ監視)では、オブジェクトは正確に検出または注釈付けされることはめったにない。
まず、エンド・ツー・エンド統合ネット(I-Net)を紹介します。
さらに,2つの新しいコントリビューションを行うDC-I-Netという改良されたI-Netを提案する。
論文 参考訳(メタデータ) (2020-09-03T03:57:50Z) - DRG: Dual Relation Graph for Human-Object Interaction Detection [65.50707710054141]
人-物間相互作用(HOI)検出の課題に対処する。
既存の方法は、人間と物体の対の相互作用を独立に認識するか、複雑な外観に基づく共同推論を行う。
本稿では,抽象的空間意味表現を活用して,各対象対を記述し,二重関係グラフを用いてシーンの文脈情報を集約する。
論文 参考訳(メタデータ) (2020-08-26T17:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。