論文の概要: Image-Text-Image Knowledge Transferring for Lifelong Person Re-Identification with Hybrid Clothing States
- arxiv url: http://arxiv.org/abs/2405.16600v1
- Date: Sun, 26 May 2024 15:25:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-28 20:19:32.293734
- Title: Image-Text-Image Knowledge Transferring for Lifelong Person Re-Identification with Hybrid Clothing States
- Title(参考訳): ハイブリッド衣服状態を用いた生涯人物再同定のための画像-テキスト-画像知識伝達
- Authors: Qizao Wang, Xuelin Qian, Bin Li, Yanwei Fu, Xiangyang Xue,
- Abstract要約: より実践的な課題,すなわち,ハイブリッド衣料状態での生涯的人物識別を提案する。
我々は、生涯学習中に、一連の布変化ドメインと布一貫性ドメインを考慮に入れた。
我々は、"画像-テキスト-画像"閉ループで知識を効果的に調整し、転送し、蓄積するための、$Teata$と呼ばれる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 78.52704557647438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the continuous expansion of intelligent surveillance networks, lifelong person re-identification (LReID) has received widespread attention, pursuing the need of self-evolution across different domains. However, existing LReID studies accumulate knowledge with the assumption that people would not change their clothes. In this paper, we propose a more practical task, namely lifelong person re-identification with hybrid clothing states (LReID-Hybrid), which takes a series of cloth-changing and cloth-consistent domains into account during lifelong learning. To tackle the challenges of knowledge granularity mismatch and knowledge presentation mismatch that occurred in LReID-Hybrid, we take advantage of the consistency and generalization of the text space, and propose a novel framework, dubbed $Teata$, to effectively align, transfer and accumulate knowledge in an "image-text-image" closed loop. Concretely, to achieve effective knowledge transfer, we design a Structured Semantic Prompt (SSP) learning to decompose the text prompt into several structured pairs to distill knowledge from the image space with a unified granularity of text description. Then, we introduce a Knowledge Adaptation and Projection strategy (KAP), which tunes text knowledge via a slow-paced learner to adapt to different tasks without catastrophic forgetting. Extensive experiments demonstrate the superiority of our proposed $Teata$ for LReID-Hybrid as well as on conventional LReID benchmarks over advanced methods.
- Abstract(参考訳): 知的監視ネットワークの継続的な拡張により、生涯にわたる人物再識別(LReID)が広く注目され、異なる領域にまたがる自己進化の必要性が追求されている。
しかし、既存のLReID研究は、人々が服を変えないという仮定で知識を蓄積している。
本稿では, 生涯学習において, 布地や布地との整合性を考慮に入れた, ハイブリッド衣料状態 (LReID-Hybrid) による生涯的人物識別の実践的課題を提案する。
LReID-Hybridで発生した知識粒度ミスマッチと知識提示ミスマッチの課題に対処するため、テキスト空間の一貫性と一般化を活用し、"画像-テキスト-画像"閉ループで知識を効果的に調整し、伝達し、蓄積する「Teata$」と呼ばれる新しいフレームワークを提案する。
具体的には、効率的な知識伝達を実現するために、テキストプロンプトを複数の構造化されたペアに分解し、画像空間からの知識をテキスト記述の統一的な粒度で抽出するために、構造化セマンティック・プロンプト(SSP)学習を設計する。
そこで我々は,学習者によるテキスト知識の調整を行うKAP(Knowledge Adaptation and Projection Strategy)を導入する。
LReID-Hybrid に対して提案した $Teata$ と,従来の LReID ベンチマークの先進的手法に対する優位性を実証した。
関連論文リスト
- Dynamic Textual Prompt For Rehearsal-free Lifelong Person Re-identification [30.782126710974165]
生涯にわたる人物の再識別は、カメラを越えて人々を認識し、継続的なデータストリームから新たな知識を統合する。
主な課題は、パラメータの更新とドメインシフトに起因する破滅的な忘れに対処することである。
本稿では,テキスト記述をガイダンスとして用いて,サンプルを保持せずにドメイン間の不変性を学習するReIDモデルを提案する。
論文 参考訳(メタデータ) (2024-11-09T00:57:19Z) - Towards Unified Multimodal Editing with Enhanced Knowledge Collaboration [107.31481207855835]
内在的知識の編集や外部知識の活用といった現在の手法は、それぞれに長所と短所がある。
固有知識編集と外部知識を活用した統一的な視点を確立するための,新しいマルチモーダル編集手法UniKEを提案する。
論文 参考訳(メタデータ) (2024-09-30T02:13:53Z) - Revolutionizing Text-to-Image Retrieval as Autoregressive Token-to-Voken Generation [90.71613903956451]
テキスト・ツー・イメージ検索はマルチメディア処理における基本的な課題である。
本稿では,AVGという自己回帰ボウケン生成手法を提案する。
AVGは有効性と有効性の両方において優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2024-07-24T13:39:51Z) - Auto-selected Knowledge Adapters for Lifelong Person Re-identification [54.42307214981537]
Lifelong Person Re-Identificationは、異なる時間と場所にわたる重複しないデータセットから継続的に学習するシステムを必要とする。
リハーサルのない、あるいはリハーサルベースの既存のアプローチは、依然として破滅的な忘れ込みの問題に悩まされている。
本稿では,知識アダプタを採用した新しいフレームワークであるAdalReIDと,生涯学習のためのパラメータフリー自動選択機構を提案する。
論文 参考訳(メタデータ) (2024-05-29T11:42:02Z) - Adaptive Prompt Learning with Distilled Connective Knowledge for
Implicit Discourse Relation Recognition [18.42715011594281]
暗黙的談話関係認識(IDRR)は、明示的な接続性のない2つのテキストセグメント間の談話関係の認識を目的としている。
本稿では,連続的なプロンプトを通して手作業による設計作業を減らすために,アダプティブ・プロンプト(AdaptPrompt)と呼ばれる接続型知識蒸留とともに,プロンプト学習の継続的バージョンを提案する。
また、回答空間としていくつかの仮想回答を生成するために、回答関連マッピングルールを設計する。
論文 参考訳(メタデータ) (2023-09-14T09:44:46Z) - Combo of Thinking and Observing for Outside-Knowledge VQA [13.838435454270014]
外部知識の視覚的質問応答は、買収とオープンエンドの現実世界の知識の使用の両方を必要とする難しいタスクである。
本稿では,モダリティ空間を自然言語空間と同じ空間に制約することに着想を得た。
本稿では,マルチモーダルエンコーダ,テキストエンコーダ,応答デコーダからなる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-10T18:32:32Z) - Learning Knowledge Representation with Meta Knowledge Distillation for
Single Image Super-Resolution [82.89021683451432]
単一画像超解像課題に対する教師/学生アーキテクチャに基づくモデルに依存しないメタ知識蒸留法を提案する。
種々の単一画像超解像データセットを用いた実験により,提案手法は既存の知識表現関連蒸留法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-18T02:41:04Z) - Uncertainty-Aware Multi-Shot Knowledge Distillation for Image-Based
Object Re-Identification [93.39253443415392]
各画像の特徴学習を指導するために,同一のアイデンティティのマルチショットを活用することを提案する。
それは、同一物体の複数の画像から包括的特徴を学習する教師ネットワーク(T-net)と、1つの画像を入力として取る学生ネットワーク(S-net)から構成される。
提案手法の有効性を,一般的な車種と個人用車種に検証した。
論文 参考訳(メタデータ) (2020-01-15T09:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。