論文の概要: Leveraging Prior Knowledge of Diffusion Model for Person Search
- arxiv url: http://arxiv.org/abs/2510.01841v1
- Date: Thu, 02 Oct 2025 09:36:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.079655
- Title: Leveraging Prior Knowledge of Diffusion Model for Person Search
- Title(参考訳): 人探索における拡散モデルの事前知識の活用
- Authors: Giyeol Kim, Sooyoung Yang, Jihyong Oh, Myungjoo Kang, Chanho Eom,
- Abstract要約: 人物探索は,人物検出と再同定を共同で行うことを目的とする。
既存の手法は主にImageNetで事前訓練されたバックボーンを使用し、複雑な空間コンテキストをキャプチャするのに最適である。
本稿では,2つのサブタスク間の最適化競合を解消しつつ,事前学習した拡散モデルを活用する新しいフレームワークDiffPSを提案する。
- 参考スコア(独自算出の注目度): 21.72593483340187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Person search aims to jointly perform person detection and re-identification by localizing and identifying a query person within a gallery of uncropped scene images. Existing methods predominantly utilize ImageNet pre-trained backbones, which may be suboptimal for capturing the complex spatial context and fine-grained identity cues necessary for person search. Moreover, they rely on a shared backbone feature for both person detection and re-identification, leading to suboptimal features due to conflicting optimization objectives. In this paper, we propose DiffPS (Diffusion Prior Knowledge for Person Search), a novel framework that leverages a pre-trained diffusion model while eliminating the optimization conflict between two sub-tasks. We analyze key properties of diffusion priors and propose three specialized modules: (i) Diffusion-Guided Region Proposal Network (DGRPN) for enhanced person localization, (ii) Multi-Scale Frequency Refinement Network (MSFRN) to mitigate shape bias, and (iii) Semantic-Adaptive Feature Aggregation Network (SFAN) to leverage text-aligned diffusion features. DiffPS sets a new state-of-the-art on CUHK-SYSU and PRW.
- Abstract(参考訳): 人物探索は,人物検出と再同定を共同で行うことを目的とする。
既存の手法は主にImageNetで事前訓練されたバックボーンを用いており、これは複雑な空間コンテキストと人物探索に必要なきめ細かなアイデンティティーキューを捉えるのに最適である。
さらに、それらは人の検出と再識別の両方に共有バックボーン機能に依存しており、矛盾する最適化の目的のために、最適な機能に繋がる。
本稿では,DiffPS(Diffusion Prior Knowledge for Person Search, Diffusion Prior Knowledge for Person Search)を提案する。
拡散前の鍵となる性質を解析し、3つの特別な加群を提案する。
(i)拡散誘導型地域提案ネットワーク(DGRPN)
(二)形状バイアスを緩和するマルチスケール周波数リファインメントネットワーク(MSFRN)
3) テキスト・アダプティブ・フィーチャー・アグリゲーション・ネットワーク(SFAN)は,テキスト・アダプティブな拡散機能を利用する。
DiffPSはCUHK-SYSUとPRWに新しい最先端を設定できる。
関連論文リスト
- Background Matters Too: A Language-Enhanced Adversarial Framework for Person Re-Identification [1.409283414986451]
背景セマンティクスはReIDのフォアグラウンドセマンティクスと同じくらい重要であると我々は主張する。
本稿では,フォアグラウンドと背景情報を協調的にモデル化するエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-03T05:38:22Z) - Towards Robust and Realistic Human Pose Estimation via WiFi Signals [85.60557095666934]
WiFiベースの人間のポーズ推定は、離散的で微妙なWiFi信号を人間の骨格にブリッジする難しいタスクである。
本論文は,本問題を再検討し,(1)ドメイン間ギャップ,(2)ソース・ターゲット領域のポーズ分布の顕著な変化,(2)骨格のポーズが歪んだトポロジーを示す構造的フィデリティギャップ,の2つの重要な問題を明らかにする。
本稿では,タスクをDT-Poseと呼ばれる新しい2段階のフレームワークに書き換えることで,これらのギャップを埋める:ドメイン一貫性表現学習とトポロジ制約ポスデコーディング。
論文 参考訳(メタデータ) (2025-01-16T09:38:22Z) - Unity in Diversity: Multi-expert Knowledge Confrontation and Collaboration for Generalizable Vehicle Re-identification [60.20318058777603]
一般化可能な車両再識別(ReID)は、微調整や再訓練を必要とせず、未知のターゲットドメインに適応可能なモデルの開発を目指している。
これまでの研究は主に、ソースドメイン間のデータ分散を調整することで、ドメイン不変の機能の抽出に重点を置いてきた。
そこで本研究では,この問題を解決するために,2段階のMulti-expert Knowledge Confrontation and Collaboration(MiKeCoCo)手法を提案する。
論文 参考訳(メタデータ) (2024-07-10T04:06:39Z) - PSDiff: Diffusion Model for Person Search with Iterative and Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - An Interactively Reinforced Paradigm for Joint Infrared-Visible Image
Fusion and Saliency Object Detection [59.02821429555375]
この研究は、野生の隠れた物体の発見と位置決めに焦点をあて、無人のシステムに役立てる。
経験的分析により、赤外線と可視画像融合(IVIF)は、難しい物体の発見を可能にする。
マルチモーダル・サリエント・オブジェクト検出(SOD)は、画像内の物体の正確な空間的位置を正確に記述する。
論文 参考訳(メタデータ) (2023-05-17T06:48:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。