論文の概要: PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement
- arxiv url: http://arxiv.org/abs/2309.11125v1
- Date: Wed, 20 Sep 2023 08:16:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-21 17:05:12.721985
- Title: PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement
- Title(参考訳): PSDiff:反復的・協調的リファインメントを用いた人物探索のための拡散モデル
- Authors: Chengyou Jia, Minnan Luo, Zhuohang Dang, Guang Dai, Xiaojun Chang,
Jingdong Wang, and Qinghua Zheng
- Abstract要約: 本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
PSDiff はパラメータが少なく, 弾力性のある計算オーバヘッドで, 最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 72.60659983573
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Dominant Person Search methods aim to localize and recognize query persons in
a unified network, which jointly optimizes two sub-tasks, \ie, detection and
Re-IDentification (ReID). Despite significant progress, two major challenges
remain: 1) Detection-prior modules in previous methods are suboptimal for the
ReID task. 2) The collaboration between two sub-tasks is ignored. To alleviate
these issues, we present a novel Person Search framework based on the Diffusion
model, PSDiff. PSDiff formulates the person search as a dual denoising process
from noisy boxes and ReID embeddings to ground truths. Unlike existing methods
that follow the Detection-to-ReID paradigm, our denoising paradigm eliminates
detection-prior modules to avoid the local-optimum of the ReID task. Following
the new paradigm, we further design a new Collaborative Denoising Layer (CDL)
to optimize detection and ReID sub-tasks in an iterative and collaborative way,
which makes two sub-tasks mutually beneficial. Extensive experiments on the
standard benchmarks show that PSDiff achieves state-of-the-art performance with
fewer parameters and elastic computing overhead.
- Abstract(参考訳): 支配的人物探索法は,2つのサブタスクである \ie, detection, Re-IDentification (ReID) を共同で最適化する統合ネットワークにおいて,クエリ対象をローカライズし,認識することを目的としている。
大きな進歩にもかかわらず、2つの大きな課題が残る。
1) 以前の手法における検出優先モジュールは、reidタスクに準最適である。
2)2つのサブタスク間の協調は無視される。
これらの問題を緩和するために,Diffusionモデルに基づく新しいPerson SearchフレームワークであるPSDiffを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
検出から参照へのパラダイムに従う既存の手法と異なり、提案手法では、reidタスクの局所最適化を避けるために検出優先モジュールを除外する。
新たなパラダイムに従って,2つのサブタスクが相互に有益になるような,反復的かつ協調的な方法でサブタスクの検出と修正を最適化する,新たなcdl(collaborative denoising layer)を更に設計する。
標準ベンチマークでの大規模な実験により、PSDiffはより少ないパラメータと弾力性のある計算オーバーヘッドで最先端のパフォーマンスを達成することが示された。
関連論文リスト
- OIMNet++: Prototypical Normalization and Localization-aware Learning for
Person Search [34.460973847554364]
我々は,人物検索,すなわち,生のシーン画像から人物をローカライズし,再同定するタスクに対処する。
近年のアプローチは、人探索の先駆的な研究であるOIMNetに基づいて構築され、共同人物表現を学習し、検出と人の再識別の両方を行う。
ProtoNormと呼ばれる新しい正規化レイヤを導入し、人身認証の長期分布を考慮しつつ、歩行者の提案から特徴を校正する。
論文 参考訳(メタデータ) (2022-07-21T06:34:03Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Subtask-dominated Transfer Learning for Long-tail Person Search [12.311100923753449]
人物探索は、パノラマギャラリー画像から質問者を見つけるために、人物検出と人物再識別(Re-ID)を統一する。
1つの大きな課題は、不均衡なロングテールの個人識別分布である。
本稿では,この問題を解決するために,Subtask-dominated Transfer Learning (STL)法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:34:48Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Multi-object Tracking with a Hierarchical Single-branch Network [31.680667324595557]
階層的な単一ブランチネットワークに基づくオンライン多目的追跡フレームワークを提案する。
新たなiHOIM損失関数は,2つのサブタスクの目的を統一し,より優れた検出性能を実現する。
MOT16とMOT20データセットの実験結果から,最先端のトラッキング性能が達成できた。
論文 参考訳(メタデータ) (2021-01-06T12:14:58Z) - Ensemble and Random Collaborative Representation-Based Anomaly Detector
for Hyperspectral Imagery [133.83048723991462]
ハイパースペクトル異常検出(HAD)のための新しいアンサンブルおよびランダム共同表現型検出器(ERCRD)を提案する。
4つの実超スペクトルデータセットを用いた実験により,提案手法の精度と効率を10段階法と比較した。
論文 参考訳(メタデータ) (2021-01-06T11:23:51Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。