論文の概要: PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement
- arxiv url: http://arxiv.org/abs/2309.11125v2
- Date: Wed, 13 Mar 2024 12:04:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 18:27:45.087218
- Title: PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement
- Title(参考訳): PSDiff:反復的・反復的人物探索のための拡散モデル
コラボレーティブリファインメント
- Authors: Chengyou Jia, Minnan Luo, Zhuohang Dang, Guang Dai, Xiaojun Chang, and
Jingdong Wang
- Abstract要約: 本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
- 参考スコア(独自算出の注目度): 59.6260680005195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dominant Person Search methods aim to localize and recognize query persons in
a unified network, which jointly optimizes two sub-tasks, \ie, pedestrian
detection and Re-IDentification (ReID). Despite significant progress, current
methods face two primary challenges: 1) the pedestrian candidates learned
within detectors are suboptimal for the ReID task. 2) the potential for
collaboration between two sub-tasks is overlooked. To address these issues, we
present a novel Person Search framework based on the Diffusion model, PSDiff.
PSDiff formulates the person search as a dual denoising process from noisy
boxes and ReID embeddings to ground truths. Distinct from the conventional
Detection-to-ReID approach, our denoising paradigm discards prior pedestrian
candidates generated by detectors, thereby avoiding the local optimum problem
of the ReID task. Following the new paradigm, we further design a new
Collaborative Denoising Layer (CDL) to optimize detection and ReID sub-tasks in
an iterative and collaborative way, which makes two sub-tasks mutually
beneficial. Extensive experiments on the standard benchmarks show that PSDiff
achieves state-of-the-art performance with fewer parameters and elastic
computing overhead.
- Abstract(参考訳): 支配的人物探索法は,2つのサブタスク,シャイ,歩行者検出,再識別(Re-IDentification, ReID)を共同で最適化する統合ネットワークにおいて,クエリ対象をローカライズし,認識することを目的としている。
著しい進歩にもかかわらず、現在の手法は2つの大きな課題に直面している。
1) 検出器内で学習した歩行者候補は, ReIDタスクに最適である。
2)2つのサブタスク間のコラボレーションの可能性は見落としている。
これらの問題に対処するために,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアル・デノナイズ・プロセスとして検索する人を定式化する。
従来の検出からReIDへのアプローチとは対照的に,本手法では,検知器によって生成された先行歩行者候補を排除し,ReIDタスクの局所的最適問題を回避している。
新しいパラダイムに続き、我々はさらに2つのサブタスクを相互に有益にする、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
標準ベンチマークでの大規模な実験により、PSDiffはより少ないパラメータと弾力性のある計算オーバーヘッドで最先端のパフォーマンスを達成することが示された。
関連論文リスト
- OIMNet++: Prototypical Normalization and Localization-aware Learning for
Person Search [34.460973847554364]
我々は,人物検索,すなわち,生のシーン画像から人物をローカライズし,再同定するタスクに対処する。
近年のアプローチは、人探索の先駆的な研究であるOIMNetに基づいて構築され、共同人物表現を学習し、検出と人の再識別の両方を行う。
ProtoNormと呼ばれる新しい正規化レイヤを導入し、人身認証の長期分布を考慮しつつ、歩行者の提案から特徴を校正する。
論文 参考訳(メタデータ) (2022-07-21T06:34:03Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Subtask-dominated Transfer Learning for Long-tail Person Search [12.311100923753449]
人物探索は、パノラマギャラリー画像から質問者を見つけるために、人物検出と人物再識別(Re-ID)を統一する。
1つの大きな課題は、不均衡なロングテールの個人識別分布である。
本稿では,この問題を解決するために,Subtask-dominated Transfer Learning (STL)法を提案する。
論文 参考訳(メタデータ) (2021-12-01T14:34:48Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Multi-object Tracking with a Hierarchical Single-branch Network [31.680667324595557]
階層的な単一ブランチネットワークに基づくオンライン多目的追跡フレームワークを提案する。
新たなiHOIM損失関数は,2つのサブタスクの目的を統一し,より優れた検出性能を実現する。
MOT16とMOT20データセットの実験結果から,最先端のトラッキング性能が達成できた。
論文 参考訳(メタデータ) (2021-01-06T12:14:58Z) - Ensemble and Random Collaborative Representation-Based Anomaly Detector
for Hyperspectral Imagery [133.83048723991462]
ハイパースペクトル異常検出(HAD)のための新しいアンサンブルおよびランダム共同表現型検出器(ERCRD)を提案する。
4つの実超スペクトルデータセットを用いた実験により,提案手法の精度と効率を10段階法と比較した。
論文 参考訳(メタデータ) (2021-01-06T11:23:51Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。