論文の概要: DC-Former: Diverse and Compact Transformer for Person Re-Identification
- arxiv url: http://arxiv.org/abs/2302.14335v1
- Date: Tue, 28 Feb 2023 06:03:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 17:56:56.733574
- Title: DC-Former: Diverse and Compact Transformer for Person Re-Identification
- Title(参考訳): dc-former : 個人再識別のための多様でコンパクトな変圧器
- Authors: Wen Li, Cheng Zou, Meng Wang, Furong Xu, Jianan Zhao, Ruobing Zheng,
Yuan Cheng, Wei Chu
- Abstract要約: 個人再識別(re-ID)タスクでは,データ不足のため,深層学習による識別表現の学習が依然として困難である。
埋め込み空間を複数の部分空間に分割することで、同様の効果を発揮できるDiverse and Compact Transformer (DC-Former)を提案する。
- 参考スコア(独自算出の注目度): 38.12558570608426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In person re-identification (re-ID) task, it is still challenging to learn
discriminative representation by deep learning, due to limited data. Generally
speaking, the model will get better performance when increasing the amount of
data. The addition of similar classes strengthens the ability of the classifier
to identify similar identities, thereby improving the discrimination of
representation. In this paper, we propose a Diverse and Compact Transformer
(DC-Former) that can achieve a similar effect by splitting embedding space into
multiple diverse and compact subspaces. Compact embedding subspace helps model
learn more robust and discriminative embedding to identify similar classes. And
the fusion of these diverse embeddings containing more fine-grained information
can further improve the effect of re-ID. Specifically, multiple class tokens
are used in vision transformer to represent multiple embedding spaces. Then, a
self-diverse constraint (SDC) is applied to these spaces to push them away from
each other, which makes each embedding space diverse and compact. Further, a
dynamic weight controller(DWC) is further designed for balancing the relative
importance among them during training. The experimental results of our method
are promising, which surpass previous state-of-the-art methods on several
commonly used person re-ID benchmarks.
- Abstract(参考訳): 個人再識別(re-ID)タスクでは,データ不足のため,ディープラーニングによる識別表現の学習が依然として難しい。
一般的に言えば、データ量を増やすとモデルのパフォーマンスが向上します。
類似クラスの追加は、分類器が類似したアイデンティティを識別する能力を強化し、表現の識別を改善する。
本稿では,埋め込み空間を多様かつコンパクトな部分空間に分割することにより,同様の効果を得られる多様でコンパクトな変圧器(dc-former)を提案する。
compact embedded subspaceはモデルがより堅牢で差別的な埋め込みを学習し、類似したクラスを識別するのに役立つ。
そして、よりきめ細かい情報を含むこれらの多様な埋め込みの融合により、re-IDの効果はさらに向上する。
具体的には、複数のクラストークンがvision transformerで複数の埋め込み空間を表現するために使用される。
次に、これらの空間に自己多元制約(SDC)を適用し、それらを互いに引き離し、各埋め込み空間を多様かつコンパクトにする。
さらに、トレーニング中の相対的重要性のバランスをとるために、動的重み制御器(DWC)が設計されている。
提案手法の実験結果は有望であり,従来の手法を上回っている。
関連論文リスト
- Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification [64.36210786350568]
マルチモーダルオブジェクトReIDのための視覚変換器から多様なトークンを選択するための,textbfEDITORという新しい学習フレームワークを提案する。
我々のフレームワークはマルチモーダルオブジェクトReIDに対してより差別的な機能を生成することができる。
論文 参考訳(メタデータ) (2024-03-15T12:44:35Z) - Contributing Dimension Structure of Deep Feature for Coreset Selection [26.759457501199822]
Coreset selectionは、効率的な学習のための重要なトレーニングサンプルのサブセットを選択することを目指している。
サンプル選択は、パフォーマンス向上におけるサンプルの表現と、オーバーフィッティングを回避するためのサンプルの多様性の役割である。
既存の手法は典型的には類似度の測定値に基づいてデータの表現と多様性を計測する。
論文 参考訳(メタデータ) (2024-01-29T14:47:26Z) - Detail Reinforcement Diffusion Model: Augmentation Fine-Grained Visual Categorization in Few-Shot Conditions [11.121652649243119]
拡散モデルは、データ生成において顕著な多様性のため、データ拡張において広く採用されている。
詳細強化拡散モデル(DRDM)と呼ばれる新しい手法を提案する。
大規模モデルの豊富な知識を微粒化に活用し、識別的意味的組換え(DSR)と空間的知識参照(SKR)の2つの重要な構成要素を含む。
論文 参考訳(メタデータ) (2023-09-15T01:28:59Z) - Rethinking Person Re-identification from a Projection-on-Prototypes
Perspective [84.24742313520811]
検索タスクとしてのPerson Re-IDentification(Re-ID)は,過去10年間で大きな発展を遂げてきた。
本稿では,新しいベースライン ProNet を提案する。
4つのベンチマークの実験では、提案したProNetは単純だが有効であり、以前のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2023-08-21T13:38:10Z) - Exploring Fine-Grained Representation and Recomposition for Cloth-Changing Person Re-Identification [78.52704557647438]
補助的なアノテーションやデータなしに両方の制約に対処するために,新しいFIne-fine Representation and Recomposition (FIRe$2$) フレームワークを提案する。
FIRe$2$は、広く使われている5つのRe-IDベンチマークで最先端のパフォーマンスを実現することができる。
論文 参考訳(メタデータ) (2023-08-21T12:59:48Z) - Generalizable Low-Resource Activity Recognition with Diverse and
Discriminative Representation Learning [24.36351102003414]
HAR(Human Activity Recognition)は、人間のセンサーの読み取りから動作パターンを特定することに焦点を当てた時系列分類タスクである。
一般化可能な低リソースHARのためのDDLearn(Diverse and Discriminative Expression Learning)という新しい手法を提案する。
平均精度は9.5%向上した。
論文 参考訳(メタデータ) (2023-05-25T08:24:22Z) - Bi-directional Feature Reconstruction Network for Fine-Grained Few-Shot
Image Classification [61.411869453639845]
クラス間およびクラス内変動を同時に対応できるバイコンストラクション機構を導入する。
この設計は、モデルがより微妙で差別的な特徴を探索するのに役立つ。
広範に使用されている3つのきめ細かな画像分類データセットに対する実験結果は、一貫して大幅に改善されている。
論文 参考訳(メタデータ) (2022-11-30T16:55:14Z) - Improving Deep Metric Learning by Divide and Conquer [11.380358587116683]
ディープ・メトリック・ラーニング(DML)は多くのコンピュータ・ビジョン・アプリケーションの基盤となっている。
入力ドメインから埋め込み空間へのマッピングを学習することを目的としている。
埋め込み空間とデータを階層的に小さな部分に分割することで、より表現力のある表現を構築することを提案する。
論文 参考訳(メタデータ) (2021-09-09T02:57:34Z) - MCL-GAN: Generative Adversarial Networks with Multiple Specialized Discriminators [47.19216713803009]
本稿では,複数の識別器を用いた生成対向ネットワークの枠組みを提案する。
データ全体のサブセットに専門知識を持つように、各差別者を指導します。
複数の識別器を使用するにもかかわらず、バックボーンネットワークは識別器間で共有される。
論文 参考訳(メタデータ) (2021-07-15T11:35:08Z) - Camera-aware Proxies for Unsupervised Person Re-Identification [60.26031011794513]
本稿では、アノテーションを必要としない純粋に教師なしの人物識別(Re-ID)問題に取り組む。
各クラスタを複数のプロキシに分割し、それぞれのプロキシが同じカメラからのインスタンスを表すことを提案する。
カメラ認識プロキシに基づいて、カメラ内およびカメラ間コントラスト学習コンポーネントをre-idモデル用に設計する。
論文 参考訳(メタデータ) (2020-12-19T12:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。