論文の概要: Occlusion-Guided Feature Purification Learning via Reinforced Knowledge Distillation for Occluded Person Re-Identification
- arxiv url: http://arxiv.org/abs/2507.08520v1
- Date: Fri, 11 Jul 2025 12:05:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-14 18:03:54.346632
- Title: Occlusion-Guided Feature Purification Learning via Reinforced Knowledge Distillation for Occluded Person Re-Identification
- Title(参考訳): 隠蔽者再同定のための強化知識蒸留による咬合誘導型特徴浄化学習
- Authors: Yufei Zheng, Wenjun Wang, Wenjun Gan, Jiawei Liu,
- Abstract要約: 被占領者の再識別は、被占領者に基づいて全体像を検索することを目的としている。
既存の方法は、しばしば目に見える身体の部分の整列、排他的拡張の適用、または欠落した意味論を補完することに依存する。
我々は,強化知識蒸留による咬合誘導型特徴浄化学習を提案する。
- 参考スコア(独自算出の注目度): 5.193166724401499
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occluded person re-identification aims to retrieve holistic images based on occluded ones. Existing methods often rely on aligning visible body parts, applying occlusion augmentation, or complementing missing semantics using holistic images. However, they face challenges in handling diverse occlusion scenarios not seen during training and the issue of feature contamination from holistic images. To address these limitations, we propose Occlusion-Guided Feature Purification Learning via Reinforced Knowledge Distillation (OGFR), which simultaneously mitigates these challenges. OGFR adopts a teacher-student distillation architecture that effectively incorporates diverse occlusion patterns into feature representation while transferring the purified discriminative holistic knowledge from the holistic to the occluded branch through reinforced knowledge distillation. Specifically, an Occlusion-Aware Vision Transformer is designed to leverage learnable occlusion pattern embeddings to explicitly model such diverse occlusion types, thereby guiding occlusion-aware robust feature representation. Moreover, we devise a Feature Erasing and Purification Module within the holistic branch, in which an agent is employed to identify low-quality patch tokens of holistic images that contain noisy negative information via deep reinforcement learning, and substitute these patch tokens with learnable embedding tokens to avoid feature contamination and further excavate identity-related discriminative clues. Afterward, with the assistance of knowledge distillation, the student branch effectively absorbs the purified holistic knowledge to precisely learn robust representation regardless of the interference of occlusions.
- Abstract(参考訳): 被占領者の再識別は、被占領者に基づいて全体像を検索することを目的としている。
既存の方法は、しばしば目に見える身体部分の整列、排他的拡張の適用、あるいは全体像を用いた欠落した意味論の補足に頼っている。
しかし、訓練中に見えない多様な閉塞シナリオの処理や、全体像からの特徴汚染の問題に直面する。
これらの制約に対処するため,OGFR(Occlusion-Guided Feature Purification Learning)を提案する。
OGFRは、多種多様なオクルージョンパターンを特徴表現に効果的に組み入れ、精製された識別的包括的知識を、強化された知識蒸留を通じて包括的ブランチから包括的ブランチに伝達する。
具体的には、Occlusion-Aware Vision Transformerは、学習可能なOcclusionパターンの埋め込みを利用して、このような多様なOcclusion型を明示的にモデル化し、Occlusion-Awareの堅牢な特徴表現を導くように設計されている。
さらに,本システムでは, エージェントが高次強化学習によるノイズの多い負の情報を含む全体像の低品質パッチトークンを識別し, これらのパッチトークンを学習可能な埋め込みトークンに置き換え, 特徴の汚染を回避し, さらに識別関連識別手がかりを抽出する機能消去・浄化モジュールを設計する。
その後、学生は、知識蒸留の助けを借りて、浄化された全体的知識を効果的に吸収し、閉塞の干渉にかかわらず、堅牢な表現を正確に学習する。
関連論文リスト
- Mind the Gap: Bridging Occlusion in Gait Recognition via Residual Gap Correction [57.75544235445363]
RG-Gaitを提案する。これは、総体的保持を伴う閉塞歩行認識のための残差補正法である。
提案するネットワークは学習した残差を適応的に統合し,閉鎖歩行系列の性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-07-15T04:45:14Z) - Improving Apple Object Detection with Occlusion-Enhanced Distillation [1.0049237739132246]
自然環境で成長するリンゴは、しばしば葉や枝から激しい視覚障害に直面する。
OED(Occlusion-Enhanced Distillation)と呼ばれる手法を導入し、隠蔽データセット上の意味的に整合した特徴の学習を規則化する。
提案手法は, 広範囲な比較実験により, 最先端技術よりも優れていた。
論文 参考訳(メタデータ) (2024-09-03T03:11:48Z) - You Can Run but not Hide: Improving Gait Recognition with Intrinsic
Occlusion Type Awareness [48.151855620080134]
蓄積された身体部分は、制御されていない屋外シーケンスの歩行認識に影響を及ぼす可能性がある。
現在のほとんどの方法は、歩行特徴を抽出しながら、完全な身体情報が得られると仮定している。
そこで,本研究では,内在性咬合認知を任意の最先端歩行認識手法にモデル化することのできる咬合認知歩行認識手法を提案する。
論文 参考訳(メタデータ) (2023-12-04T19:11:40Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Feature Completion Transformer for Occluded Person Re-identification [25.159974510754992]
咬合者の再同定(Re-ID)は,咬合者の破壊による課題である。
特徴空間に隠された部分の意味情報を暗黙的に補完する特徴補完変換器(FCFormer)を提案する。
FCFormerは優れたパフォーマンスを実現し、隠蔽されたデータセットに対してかなりのマージンで最先端の手法を上回ります。
論文 参考訳(メタデータ) (2023-03-03T01:12:57Z) - Towards Intrinsic Common Discriminative Features Learning for Face
Forgery Detection using Adversarial Learning [59.548960057358435]
本稿では, 対人学習を利用して, 異なる偽造法と顔の同一性による負の効果を除去する手法を提案する。
我々の顔偽造検出モデルは、偽造法や顔の同一性の影響を排除し、共通の識別的特徴を抽出することを学ぶ。
論文 参考訳(メタデータ) (2022-07-08T09:23:59Z) - Open-set Adversarial Defense with Clean-Adversarial Mutual Learning [93.25058425356694]
本稿では, オープンセット認識システムは, 対向サンプルに対して脆弱であることを示す。
これらの観測により,我々はオープンセット・ディフェンス(OSAD)機構の必要性を強調した。
本稿では,OSAD問題に対する解決策として,OSDN-CAML(Create-Adversarial Mutual Learning)を用いたオープンセット防衛ネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-12T02:13:55Z) - Pose-Guided Feature Learning with Knowledge Distillation for Occluded
Person Re-Identification [137.8810152620818]
PGFL-KD (Pose-Guided Feature Learning with Knowledge Distillation) というネットワークを提案する。
PGFL-KDは、メインブランチ(MB)と2つのポーズ誘導ブランチ(ieno)、フォアグラウンド強化ブランチ(FEB)、ボディ部分セマンティクス整列ブランチ(SAB)から構成される。
閉鎖型,部分的,包括型 ReID タスクの実験は,提案したネットワークの有効性を示す。
論文 参考訳(メタデータ) (2021-07-31T03:34:27Z) - Locality-aware Channel-wise Dropout for Occluded Face Recognition [116.2355331029041]
顔認識は、特に顔が部分的に隠されている場合、制約のないシナリオでは難しいタスクである。
そこで本研究では,ニューロン群の活性化を,精巧に選択されたチャネルに落とすことによって,新しい,エレガントなオクルージョン・シミュレート法を提案する。
種々のベンチマーク実験により,提案手法は最先端の手法よりも優れた性能を示し,性能が向上した。
論文 参考訳(メタデータ) (2021-07-20T05:53:14Z) - Transformer with Peak Suppression and Knowledge Guidance for
Fine-grained Image Recognition [24.02553270481428]
本稿では,ピーク抑圧モジュールと知識誘導モジュールを備えたトランスフォーマーアーキテクチャを提案する。
ピーク抑制モジュールは、特徴学習プロセスにおいて最も識別性の高い部分に注意を向ける。
知識誘導モジュールは、ピーク抑圧モジュールから生成された画像ベース表現と学習可能な知識埋め込みセットを比較して、知識応答係数を求める。
論文 参考訳(メタデータ) (2021-07-14T08:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。