論文の概要: Prompting Continual Person Search
- arxiv url: http://arxiv.org/abs/2410.19239v1
- Date: Fri, 25 Oct 2024 01:19:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:36:37.427123
- Title: Prompting Continual Person Search
- Title(参考訳): 連続した人物探索のプロンプト
- Authors: Pengcheng Zhang, Xiaohan Yu, Xiao Bai, Jin Zheng, Xin Ning,
- Abstract要約: 既存の人物検索モデルには、現実世界のデータの増加から継続的に学習する能力がない。
本研究は,複数のドメインで連続的に学習し,すべてのドメインで人物検索を行う連続的な人物探索タスクを導入する。
- 参考スコア(独自算出の注目度): 13.655442878334396
- License:
- Abstract: The development of person search techniques has been greatly promoted in recent years for its superior practicality and challenging goals. Despite their significant progress, existing person search models still lack the ability to continually learn from increaseing real-world data and adaptively process input from different domains. To this end, this work introduces the continual person search task that sequentially learns on multiple domains and then performs person search on all seen domains. This requires balancing the stability and plasticity of the model to continually learn new knowledge without catastrophic forgetting. For this, we propose a Prompt-based Continual Person Search (PoPS) model in this paper. First, we design a compositional person search transformer to construct an effective pre-trained transformer without exhaustive pre-training from scratch on large-scale person search data. This serves as the fundamental for prompt-based continual learning. On top of that, we design a domain incremental prompt pool with a diverse attribute matching module. For each domain, we independently learn a set of prompts to encode the domain-oriented knowledge. Meanwhile, we jointly learn a group of diverse attribute projections and prototype embeddings to capture discriminative domain attributes. By matching an input image with the learned attributes across domains, the learned prompts can be properly selected for model inference. Extensive experiments are conducted to validate the proposed method for continual person search. The source code is available at https://github.com/PatrickZad/PoPS.
- Abstract(参考訳): 近年,人探し技術の発展は,その優れた実践性と挑戦的目標のために大きく推進されている。
その大きな進歩にもかかわらず、既存の人物検索モデルには、現実世界のデータの増加から継続的に学び、異なるドメインからの入力を適応的に処理する能力がない。
この目的のために、複数のドメインで逐次学習し、すべてのドメインで人物検索を行う連続的な人物探索タスクを導入する。
これは、破滅的な忘れ物なしに新しい知識を継続的に学習するためにモデルの安定性と可塑性のバランスをとる必要がある。
そこで本稿では, Prompt-based Continual Person Search (PoPS) モデルを提案する。
まず,大規模人物探索データを用いて,スクラッチから徹底的に事前学習することなく,効果的な事前学習型変圧器を構築するための構成的人物探索変圧器を設計する。
これは、プロンプトベースの継続的学習の基礎となる。
それに加えて、多様な属性マッチングモジュールを備えたドメインインクリメンタルプロンプトプールを設計する。
各ドメインについて、私たちは独立してドメイン指向の知識を符号化する一連のプロンプトを学びます。
一方、異なるドメイン属性をキャプチャするために、多様な属性プロジェクションとプロトタイプの埋め込みのグループを共同で学習する。
入力画像とドメイン間の学習属性とをマッチングすることにより、モデル推論のために学習したプロンプトを適切に選択することができる。
連続した人物探索のための提案手法を検証するために,広範囲な実験を行った。
ソースコードはhttps://github.com/PatrickZad/PoPS.comで入手できる。
関連論文リスト
- Query-oriented Data Augmentation for Session Search [71.84678750612754]
本稿では,検索ログの強化とモデリングの強化を目的としたクエリ指向データ拡張を提案する。
検索コンテキストの最も重要な部分を変更することで補足的なトレーニングペアを生成する。
我々は、現在のクエリを変更するためのいくつかの戦略を開発し、その結果、様々な難易度で新しいトレーニングデータを得る。
論文 参考訳(メタデータ) (2024-07-04T08:08:33Z) - Premonition: Using Generative Models to Preempt Future Data Changes in
Continual Learning [63.850451635362425]
継続的な学習には、データ分散の継続的な変化に対応するためのモデルが必要である。
本稿では,大規模言語モデルと画像生成モデルの組み合わせが有用であることを示す。
トレーニング済みネットワークのバックボーンは、下流の連続学習問題に有用な表現を学習できることがわかった。
論文 参考訳(メタデータ) (2024-03-12T06:29:54Z) - Divide and Conquer: Hybrid Pre-training for Person Search [40.13016375392472]
本研究では,サブタスクデータのみを用いた人物検索のためのハイブリッド事前学習フレームワークを提案する。
我々のモデルは、人物探索法、微調整データ、事前学習データ、モデルバックボーンなど、多様なプロトコルで大幅に改善できる。
私たちのコードと事前訓練されたモデルは、人検索コミュニティにプラグイン・アンド・プレイの使用のためにリリースされます。
論文 参考訳(メタデータ) (2023-12-13T08:33:50Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - S-Prompts Learning with Pre-trained Transformers: An Occam's Razor for
Domain Incremental Learning [47.35363657976161]
最先端のディープニューラルネットワークは、継続的な学習における破滅的な忘れの問題にまだ対処できていない。
そこで本研究では,S-Prompting(S-Prompting)と呼ばれる単純なパラダイムと,忘れる度合いを高く抑えるための2つの具体的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-07-26T11:30:47Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Lifelong Person Re-Identification via Adaptive Knowledge Accumulation [18.4671957106297]
LReID(Lifelong person re-identification)は、複数のドメインにわたって継続的に学習することができる。
知識表現と知識操作という2つの重要な能力を備えた適応的知識蓄積フレームワークを設計する。
本手法は見かけのドメインの破滅的な忘れることを軽減し,未知のドメインに一般化する能力を示す。
論文 参考訳(メタデータ) (2021-03-23T11:30:38Z) - PADA: A Prompt-based Autoregressive Approach for Adaptation to Unseen
Domains [19.682729518136142]
PADA: T5モデルに基づいた、PromptベースのAutoregressive Domain Adaptationアルゴリズム。
本稿では,T5 モデルに基づく Prompt-based Autoregressive Domain Adaptation アルゴリズムを提案する。
2つのタスクの実験では、PADAは最先端のアプローチと強力なベースラインを強く上回ります。
論文 参考訳(メタデータ) (2021-02-24T11:02:29Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。