論文の概要: FPB: Feature Pyramid Branch for Person Re-Identification
- arxiv url: http://arxiv.org/abs/2108.01901v1
- Date: Wed, 4 Aug 2021 08:21:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-05 13:19:08.382004
- Title: FPB: Feature Pyramid Branch for Person Re-Identification
- Title(参考訳): FPB: 人物再同定のための特徴ピラミッドブランチ
- Authors: Suofei Zhang, Zirui Yin, Xiofu Wu, Kun Wang, Quan Zhou, Bin Kang
- Abstract要約: ネットワークの異なる層から特徴を抽出し,それらを双方向のピラミッド構造に集約する軽量な特徴ピラミッドブランチ(FPB)を提案する。
FPBは1.5万以上の余分なパラメータを導入するだけでバックボーンネットワークの性能を著しく向上させる。
これは、関連するブランチとしてのピラミッドネットワークが、関連する特徴埋め込みモデルにおける潜在的構造であることを実証的に証明した、個人Re-IDタスクにおける同様の構造の最初の成功例である。
- 参考スコア(独自算出の注目度): 12.178324494736922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High performance person Re-Identification (Re-ID) requires the model to focus
on both global silhouette and local details of pedestrian. To extract such more
representative features, an effective way is to exploit deep models with
multiple branches. However, most multi-branch based methods implemented by
duplication of part backbone structure normally lead to severe increase of
computational cost. In this paper, we propose a lightweight Feature Pyramid
Branch (FPB) to extract features from different layers of networks and
aggregate them in a bidirectional pyramid structure. Cooperated by attention
modules and our proposed cross orthogonality regularization, FPB significantly
prompts the performance of backbone network by only introducing less than 1.5M
extra parameters. Extensive experimental results on standard benchmark datasets
demonstrate that our proposed FPB based model outperforms state-of-the-art
methods with obvious margin as well as much less model complexity. FPB borrows
the idea of the Feature Pyramid Network (FPN) from prevailing object detection
methods. To our best knowledge, it is the first successful application of
similar structure in person Re-ID tasks, which empirically proves that pyramid
network as affiliated branch could be a potential structure in related feature
embedding models. The source code is publicly available at
https://github.com/anocodetest1/FPB.git.
- Abstract(参考訳): ハイパフォーマンスな人物再識別(Re-ID)は、世界的シルエットと歩行者の詳細の両方に焦点を合わせる必要がある。
このような代表的特徴を抽出するための効果的な方法は、複数の分岐を持つ深いモデルを活用することである。
しかしながら、バックボーン構造の重複によって実装されるほとんどのマルチブランチベースの手法は、通常、計算コストが大幅に増加する。
本稿では,異なる階層のネットワークから特徴を抽出し,それらを双方向のピラミッド構造に集約する,軽量な特徴ピラミッドブランチ(FPB)を提案する。
注意モジュールと我々の提案した直交正規化により,FPBは1.5M未満の余剰パラメータのみを導入し,バックボーンネットワークの性能を著しく向上させる。
標準ベンチマークデータセットの大規模な実験結果から,提案したFPBベースモデルは,明らかなマージンとモデル複雑性の低減とともに,最先端の手法よりも優れていることが示された。
FPBは、一般的な物体検出手法から特徴ピラミッドネットワーク(FPN)の概念を借用している。
我々の知る限り、これはRe-IDタスクにおける類似構造の最初の成功であり、関連するブランチとしてのピラミッドネットワークが関連する機能埋め込みモデルにおける潜在的構造であることを実証的に証明している。
ソースコードはhttps://github.com/anocodetest1/FPB.gitで公開されている。
関連論文リスト
- A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - S$^2$-FPN: Scale-ware Strip Attention Guided Feature Pyramid Network for Real-time Semantic Segmentation [6.744210626403423]
本稿では,リアルタイム道路シーンセマンティックセグメンテーションにおける精度/速度のトレードオフを実現するための新しいモデルを提案する。
具体的には、スケール対応ストリップ注意誘導特徴ピラミッドネットワーク(S$2-FPN)という軽量モデルを提案する。
我々のネットワークは,アテンションピラミッドフュージョン(APF)モジュール,スケール対応ストリップアテンションモジュール(SSAM)モジュール,グローバルフィーチャーアップサンプル(GFU)モジュールの3つの主要モジュールで構成されている。
論文 参考訳(メタデータ) (2022-06-15T05:02:49Z) - RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object
Detection [10.847953426161924]
本稿では,RevFP(Reverse Feature Pyramid)とCSN(Cross-scale Shift Network)で構成されるRCNetを提案する。
RevFPは、局所的な双方向特徴融合を利用して、双方向ピラミッド推論パイプラインを簡素化する。
CSNは、隣接レベルと非隣接レベルの両方に直接表現を伝播し、より相関性の高いマルチスケール機能を実現する。
論文 参考訳(メタデータ) (2021-10-23T04:00:25Z) - HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。
作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文 参考訳(メタデータ) (2021-07-13T09:34:54Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - Efficient Human Pose Estimation by Learning Deeply Aggregated
Representations [67.24496300046255]
深く集約された表現を学習することで、効率的な人間ポーズ推定ネットワーク(DANet)を提案する。
私たちのネットワークは、より小さなモデルの複雑さで、同等またはより良い精度を達成できます。
論文 参考訳(メタデータ) (2020-12-13T10:58:07Z) - Feature Pyramid Grids [140.11116687047058]
本稿では,深い多経路特徴ピラミッドであるFeature Pyramid Grids (FPG)を提案する。
FPGは、同様の計算コストで性能を大幅に向上させることで、シングルパスの特徴ピラミッドネットワークを改善することができる。
論文 参考訳(メタデータ) (2020-04-07T17:59:52Z) - Multi-organ Segmentation over Partially Labeled Datasets with
Multi-scale Feature Abstraction [14.92032083210668]
完全な注釈付きデータセットの短縮は、ディープラーニングベースのイメージセグメンテーションアルゴリズムを開発する上で、制限要因となっている。
本稿では,新しいマルチスケールディープニューラルネットワークを複数の部分ラベル付きデータセット上でトレーニング可能な統合トレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-01-01T13:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。