論文の概要: Coarse Attribute Prediction with Task Agnostic Distillation for Real World Clothes Changing ReID
- arxiv url: http://arxiv.org/abs/2505.12580v1
- Date: Mon, 19 May 2025 00:03:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.320503
- Title: Coarse Attribute Prediction with Task Agnostic Distillation for Real World Clothes Changing ReID
- Title(参考訳): ReIDを変える現実世界の衣服に対するタスク非依存蒸留による粗属性予測
- Authors: Priyank Pathak, Yogesh S Rawat,
- Abstract要約: 本研究は,現実世界における衣服変更再識別(CC-ReID)に焦点を当てる。
既存の作品は高品質(HQ)のイメージではよく機能するが、低品質(LQ)では苦労する。
実世界のデータにおけるCC-ReIDモデルを改善するために,ロバストネス対低品質(RLQ)を提案する。
- 参考スコア(独自算出の注目度): 15.002913263469285
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work focuses on Clothes Changing Re-IDentification (CC-ReID) for the real world. Existing works perform well with high-quality (HQ) images, but struggle with low-quality (LQ) where we can have artifacts like pixelation, out-of-focus blur, and motion blur. These artifacts introduce noise to not only external biometric attributes (e.g. pose, body shape, etc.) but also corrupt the model's internal feature representation. Models usually cluster LQ image features together, making it difficult to distinguish between them, leading to incorrect matches. We propose a novel framework Robustness against Low-Quality (RLQ) to improve CC-ReID model on real-world data. RLQ relies on Coarse Attributes Prediction (CAP) and Task Agnostic Distillation (TAD) operating in alternate steps in a novel training mechanism. CAP enriches the model with external fine-grained attributes via coarse predictions, thereby reducing the effect of noisy inputs. On the other hand, TAD enhances the model's internal feature representation by bridging the gap between HQ and LQ features, via an external dataset through task-agnostic self-supervision and distillation. RLQ outperforms the existing approaches by 1.6%-2.9% Top-1 on real-world datasets like LaST, and DeepChange, while showing consistent improvement of 5.3%-6% Top-1 on PRCC with competitive performance on LTCC. *The code will be made public soon.*
- Abstract(参考訳): 本研究は,現実世界における衣服変更再識別(CC-ReID)に焦点を当てる。
既存の作品は高品質(HQ)の画像ではうまく機能しますが、ピクセル化、アウト・オブ・フォーカスのぼかし、モーションのぼかしといったアーティファクトを持てるような、低品質(LQ)で苦労しています。
これらのアーティファクトは、外部の生体特性(例えば、ポーズ、体形など)だけでなく、モデルの内部的特徴表現も損なう。
モデルは通常、LQイメージの特徴をまとめてクラスタ化する。
実世界のデータにおけるCC-ReIDモデルを改善するために,ロバストネス対低品質(RLQ)を提案する。
RLQは、新しいトレーニングメカニズムにおいて異なるステップで動作している粗属性予測(CAP)とタスク非依存蒸留(TAD)に依存している。
CAPは、粗い予測によって外部のきめ細かい属性でモデルを強化し、ノイズのある入力の効果を減らす。
一方、TADはタスクに依存しない自己監督と蒸留を通じて外部データセットを介してHQとLQのギャップを埋めることで、モデルの内部特徴表現を強化する。
RLQは、LaSTやDeepChangeのような現実世界のデータセットで1.6%-2.9%のTop-1を上回り、PRCCでは5.3%-6%のTop-1を、LTCCでは競争力のあるパフォーマンスで一貫して改善している。
※コードはまもなく公開される。
※
関連論文リスト
- IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond [56.99331967165238]
Blind Face Restoration (BFR)は、劣化した低品質(LQ)の顔画像を高品質(HQ)の出力に再構成する課題に対処する。
本研究では,非参照画像品質評価(NR-IQA)モデルから得られた画像品質優先(IQP)を組み込んだ新しいフレームワークを提案する。
提案手法は,複数のベンチマークにおいて最先端技術より優れている。
論文 参考訳(メタデータ) (2025-03-12T11:39:51Z) - Enabling Small Models for Zero-Shot Selection and Reuse through Model Label Learning [50.68074833512999]
モデルと機能の間のギャップを埋める新しいパラダイムであるモデルラベル学習(MLL)を導入する。
7つの実世界のデータセットの実験により、MLLの有効性と効率が検証された。
論文 参考訳(メタデータ) (2024-08-21T09:08:26Z) - Boosting Visual Recognition in Real-world Degradations via Unsupervised Feature Enhancement Module with Deep Channel Prior [22.323789227447755]
霧、低照度、動きのぼかしは画像の品質を低下させ、自動運転の安全性を脅かす。
本研究は、劣化した視覚認識のための新しいDeep Channel Prior (DCP)を提案する。
これに基づいて、教師なし特徴補正を実現するために、新しいプラグアンドプレイunsupervised Feature Enhancement Module (UFEM)を提案する。
論文 参考訳(メタデータ) (2024-04-02T07:16:56Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - Dual Associated Encoder for Face Restoration [68.49568459672076]
低品質(LQ)画像から顔の詳細を復元するために,DAEFRという新しいデュアルブランチフレームワークを提案する。
提案手法では,LQ入力から重要な情報を抽出する補助的なLQ分岐を導入する。
合成と実世界の両方のデータセットに対するDAEFRの有効性を評価する。
論文 参考訳(メタデータ) (2023-08-14T17:58:33Z) - Data-Efficient Image Quality Assessment with Attention-Panel Decoder [19.987556370430806]
ブラインド画像品質評価(BIQA)はコンピュータビジョンの基本課題であり、複雑な歪み条件と多様な画像内容のために未解決のままである。
本稿では,トランスフォーマーアーキテクチャに基づく新しいBIQAパイプラインを提案する。
論文 参考訳(メタデータ) (2023-04-11T03:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。