論文の概要: Hierarchical Bi-Directional Feature Perception Network for Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2008.03509v1
- Date: Sat, 8 Aug 2020 12:33:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 12:06:26.090095
- Title: Hierarchical Bi-Directional Feature Perception Network for Person
Re-Identification
- Title(参考訳): 人物再識別のための階層的双方向特徴知覚ネットワーク
- Authors: Zhipu Liu, Lei Zhang, Yang Yang
- Abstract要約: 過去の人物再同定(Re-ID)モデルは、画像の最も識別性の高い領域に焦点を当てることを目的としている。
本稿では,階層型双方向特徴知覚ネットワーク (HBFP-Net) という新しいモデルを提案する。
Market-1501, CUHK03, DukeMTMC-ReIDデータセットなどの主要な評価実験により, 提案手法が最近のSOTA Re-IDモデルより優れていることが示された。
- 参考スコア(独自算出の注目度): 12.259747100939078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous Person Re-Identification (Re-ID) models aim to focus on the most
discriminative region of an image, while its performance may be compromised
when that region is missing caused by camera viewpoint changes or occlusion. To
solve this issue, we propose a novel model named Hierarchical Bi-directional
Feature Perception Network (HBFP-Net) to correlate multi-level information and
reinforce each other. First, the correlation maps of cross-level feature-pairs
are modeled via low-rank bilinear pooling. Then, based on the correlation maps,
Bi-directional Feature Perception (BFP) module is employed to enrich the
attention regions of high-level feature, and to learn abstract and specific
information in low-level feature. And then, we propose a novel end-to-end
hierarchical network which integrates multi-level augmented features and inputs
the augmented low- and middle-level features to following layers to retrain a
new powerful network. What's more, we propose a novel trainable generalized
pooling, which can dynamically select any value of all locations in feature
maps to be activated. Extensive experiments implemented on the mainstream
evaluation datasets including Market-1501, CUHK03 and DukeMTMC-ReID show that
our method outperforms the recent SOTA Re-ID models.
- Abstract(参考訳): 以前の人物再同定(Re-ID)モデルは、画像の最も識別性の高い領域に焦点を当てることを目的としており、その領域がカメラ視点の変化や閉塞によって欠落している場合には、その性能が損なわれる可能性がある。
この問題を解決するために,階層型双方向特徴知覚ネットワーク (HBFP-Net) という新しいモデルを提案する。
まず、クロスレベル特徴対の相関マップを低ランク双線形プールを用いてモデル化する。
そして、相関マップに基づいて、双方向特徴知覚(BFP)モジュールを用いて、高レベルの特徴の注目領域を強化し、低レベルの特徴の抽象的・特定的な情報を学習する。
そこで我々は,多層化機能を統合し,低層化機能と中層化機能を付加した新しいエンドツーエンド階層型ネットワークを提案する。
さらに,機能マップ内のすべての位置の任意の値を動的に選択可能な,トレーニング可能な一般化プールを提案する。
市場-1501, CUHK03, DukeMTMC-ReID などの主要な評価データセット上で実施した大規模な実験により, 提案手法が最近のSOTA Re-IDモデルより優れていることが示された。
関連論文リスト
- Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - LC3Net: Ladder context correlation complementary network for salient
object detection [0.32116198597240836]
我々は,新しいラグコンテキスト相関補完ネットワーク (LC3Net) を提案する。
FCBはフィルタリング可能な畳み込みブロックであり、初期特徴の多様性に関する情報の自動収集を支援する。
DCMは、異なるレベルの特徴の密集を促進するための密接なクロスモジュールである。
BCDは双方向圧縮デコーダであり、マルチスケール機能の段階的縮小を支援する。
論文 参考訳(メタデータ) (2021-10-21T03:12:32Z) - Feedback Pyramid Attention Networks for Single Image Super-Resolution [37.58180059860872]
特徴の相互依存を完全に活用するためのフィードバックピラミッドアテンションネットワーク(FPAN)を提案する。
本手法では,第1段階の各レイヤの出力を次の状態の対応するレイヤの入力として使用し,以前の低レベルフィルタを再更新する。
本研究では,グローバルな文脈情報を異なるスケールでモデル化するピラミッド非局所構造を導入し,ネットワークの識別表現を改善する。
論文 参考訳(メタデータ) (2021-06-13T11:32:53Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z) - Weakly Supervised Attention Pyramid Convolutional Neural Network for
Fine-Grained Visual Classification [71.96618723152487]
注意ピラミッド畳み込みニューラルネットワーク(AP-CNN)について紹介する。
AP-CNNは高レベルのセマンティックと低レベルの詳細な特徴表現の両方を学ぶ。
追加のバウンディングボックス/パートアノテーションを必要とせずに、エンドツーエンドでトレーニングすることができる。
論文 参考訳(メタデータ) (2020-02-09T12:33:23Z) - Selective Segmentation Networks Using Top-Down Attention [1.0152838128195465]
畳み込みニューラルネットワークは、入力された知覚データのネットワーク階層の下部から視覚階層の上部のセマンティック情報への変換をモデル化する。
本稿では,Top-Down 選択ネットワークで Bottom-Up convnets を拡張可能な,オブジェクトセグメンテーションのための統合された2パスフレームワークを提案する。
セマンティックセグメンテーションのためのベンチマークデータセット上で提案したネットワークを評価し,トップダウン選択機能を持つネットワークがベースラインモデルより優れていることを示す。
論文 参考訳(メタデータ) (2020-02-04T04:47:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。