論文の概要: Learning Diverse Features with Part-Level Resolution for Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2001.07442v1
- Date: Tue, 21 Jan 2020 11:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 23:45:30.953240
- Title: Learning Diverse Features with Part-Level Resolution for Person
Re-Identification
- Title(参考訳): 人物再同定のための部分分解能を用いた多様な特徴の学習
- Authors: Ben Xie, Xiaofu Wu, Suofei Zhang, Shiliang Zhao, Ming Li
- Abstract要約: 本稿では,PLR-OSNetと呼ばれる軽量ネットワークアーキテクチャを構築することを提案する。
Omni-Scale Network(OSNet)上のPart-Level機能解決(Part-Level feature Resolution)というアイデアに基づいて、機能多様性を実現する。
Market1501、DukeMTMC-reID、CUHK03など、人気のある人物Re-IDデータセットの最先端のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 10.940478376944133
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning diverse features is key to the success of person re-identification.
Various part-based methods have been extensively proposed for learning local
representations, which, however, are still inferior to the best-performing
methods for person re-identification. This paper proposes to construct a strong
lightweight network architecture, termed PLR-OSNet, based on the idea of
Part-Level feature Resolution over the Omni-Scale Network (OSNet) for achieving
feature diversity. The proposed PLR-OSNet has two branches, one branch for
global feature representation and the other branch for local feature
representation. The local branch employs a uniform partition strategy for
part-level feature resolution but produces only a single identity-prediction
loss, which is in sharp contrast to the existing part-based methods. Empirical
evidence demonstrates that the proposed PLR-OSNet achieves state-of-the-art
performance on popular person Re-ID datasets, including Market1501,
DukeMTMC-reID and CUHK03, despite its small model size.
- Abstract(参考訳): 多様な特徴を学ぶことが、人物の再識別の成功の鍵となる。
局所表現を学習するために様々な部分ベース手法が提案されているが、個人再同定のための最善の手法にはまだ劣っている。
本稿では,Omni-Scale Network(OSNet)上でのパートレベル機能解決の考え方に基づいて,PLR-OSNetと呼ばれる軽量ネットワークアーキテクチャを構築することを提案する。
提案したPLR-OSNetには,グローバルな特徴表現のためのブランチと,ローカルな特徴表現のためのブランチの2つのブランチがある。
ローカルブランチは、部分レベルの特徴解決のために一様分割戦略を採用しているが、既存の部分ベースの方法とは対照的な単一のアイデンティティ予測損失しか発生しない。
PLR-OSNetは、モデルサイズが小さいにもかかわらず、Market1501、DukeMTMC-reID、CUHK03などの人気人物のRe-IDデータセットに対して、最先端のパフォーマンスを実現するという実証的な証拠がある。
関連論文リスト
- A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
また,モーザイクアーティファクトを緩和するのには単純だが有効であるHR特徴量に対して,きめ細かな近傍選択戦略を開発した。
提案するReSFUフレームワークは,異なるセグメンテーションアプリケーション上での良好な性能を一貫して達成する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - Learning Unified Representations for Multi-Resolution Face Recognition [0.7378853859331619]
Branch-to-Trunk Network (BTNet) はマルチ解像度顔認識のための表現学習手法である。
本実験は,マルチレゾリューション・アイデンティティマッチングと特徴集約の両面において,顔認識ベンチマークにおいて高い性能を示す。
論文 参考訳(メタデータ) (2023-10-14T11:26:43Z) - A Task-aware Dual Similarity Network for Fine-grained Few-shot Learning [19.90385022248391]
TDSNet(Task-aware Dual similarity Network)は,グローバルな不変機能と識別的局所的詳細を探索する手法である。
TDSNetは、他の最先端アルゴリズムと比較することで、競争性能を達成する。
論文 参考訳(メタデータ) (2022-10-22T04:24:55Z) - Cross-modal Local Shortest Path and Global Enhancement for
Visible-Thermal Person Re-Identification [2.294635424666456]
本稿では,局所的特徴とグローバル的特徴の同時学習に基づく2ストリームネットワークであるCM-LSP-GE(Cross-modal Local Shortest Path and Global Enhancement)モジュールを提案する。
2つの典型的なデータセットの実験結果は、我々のモデルは明らかに最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T10:27:22Z) - LoGG3D-Net: Locally Guided Global Descriptor Learning for 3D Place
Recognition [31.105598103211825]
追加のトレーニング信号(局所的整合性損失)が、リビジョン間で一貫性のある局所的特徴の学習にネットワークを導くことができることを示す。
私たちは、LoGG3D-Netと呼ばれるエンドツーエンドのトレーニング可能なアーキテクチャでアプローチを定式化します。
論文 参考訳(メタデータ) (2021-09-17T03:32:43Z) - Spatio-Temporal Representation Factorization for Video-based Person
Re-Identification [55.01276167336187]
本稿では、re-IDのための時空間表現分解モジュール(STRF)を提案する。
STRFはフレキシブルな新しい計算ユニットであり、re-IDのための既存のほとんどの3D畳み込みニューラルネットワークアーキテクチャと併用することができる。
実験により、STRFは様々なベースラインアーキテクチャの性能を向上し、新しい最先端の成果を示す。
論文 参考訳(メタデータ) (2021-07-25T19:29:37Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - ReMarNet: Conjoint Relation and Margin Learning for Small-Sample Image
Classification [49.87503122462432]
ReMarNet(Relation-and-Margin Learning Network)と呼ばれるニューラルネットワークを導入する。
本手法は,上記2つの分類機構の双方において優れた性能を発揮する特徴を学習するために,異なるバックボーンの2つのネットワークを組み立てる。
4つの画像データセットを用いた実験により,本手法はラベル付きサンプルの小さな集合から識別的特徴を学習するのに有効であることが示された。
論文 参考訳(メタデータ) (2020-06-27T13:50:20Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。