論文の概要: Hybrid-Attention Guided Network with Multiple Resolution Features for
Person Re-Identification
- arxiv url: http://arxiv.org/abs/2009.07536v2
- Date: Sun, 6 Jun 2021 03:05:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 00:22:17.595577
- Title: Hybrid-Attention Guided Network with Multiple Resolution Features for
Person Re-Identification
- Title(参考訳): 人物再同定のための多重解像度特徴を持つハイブリッド注意誘導ネットワーク
- Authors: Guoqing Zhang, Junchuan Yang, Yuhui Zheng, Yi Wu, Shengyong Chen
- Abstract要約: 本稿では,ハイレベルな特徴を学習する際の情報損失を低減するために,ハイレベルな埋め込みと低レベルな埋め込みを融合した新しい人物再IDモデルを提案する。
また,対象物に関するより識別的な特徴を抽出することを目的とした,空間的およびチャネル的注意機構をモデルに導入する。
- 参考スコア(独自算出の注目度): 30.285126447140254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting effective and discriminative features is very important for
addressing the challenging person re-identification (re-ID) task. Prevailing
deep convolutional neural networks (CNNs) usually use high-level features for
identifying pedestrian. However, some essential spatial information resided in
low-level features such as shape, texture and color will be lost when learning
the high-level features, due to extensive padding and pooling operations in the
training stage. In addition, most existing person re-ID methods are mainly
based on hand-craft bounding boxes where images are precisely aligned. It is
unrealistic in practical applications, since the exploited object detection
algorithms often produce inaccurate bounding boxes. This will inevitably
degrade the performance of existing algorithms. To address these problems, we
put forward a novel person re-ID model that fuses high- and low-level
embeddings to reduce the information loss caused in learning high-level
features. Then we divide the fused embedding into several parts and reconnect
them to obtain the global feature and more significant local features, so as to
alleviate the affect caused by the inaccurate bounding boxes. In addition, we
also introduce the spatial and channel attention mechanisms in our model, which
aims to mine more discriminative features related to the target. Finally, we
reconstruct the feature extractor to ensure that our model can obtain more
richer and robust features. Extensive experiments display the superiority of
our approach compared with existing approaches. Our code is available at
https://github.com/libraflower/MutipleFeature-for-PRID.
- Abstract(参考訳): 効果的かつ判別的な特徴の抽出は、挑戦的な人物再識別(re-id)タスクに取り組む上で非常に重要である。
一般的な深層畳み込みニューラルネットワーク(CNN)は通常、歩行者を特定するために高レベルな特徴を使用する。
しかし,訓練段階におけるパディングやプール操作などにより,高レベルな特徴を学ぶ際に,形状やテクスチャ,色彩といった低レベルな特徴に存在する重要な空間情報は失われる。
また、既存のリID手法のほとんどは、画像が正確に整列された手作業バウンディングボックスに基づいている。
悪用されたオブジェクト検出アルゴリズムは、しばしば不正確なバウンディングボックスを生成するため、実用用途では非現実的である。
これは必然的に既存のアルゴリズムのパフォーマンスを低下させる。
これらの問題に対処するため,我々は,高次特徴学習に伴う情報損失を低減するために,高次・低次埋め込みを融合した新しい人物再IDモデルを提案する。
そして,複数の部分に分けて再接続し,グローバルな特徴とより重要な局所的な特徴を得ることにより,不正確な境界ボックスによる影響を軽減する。
また,本モデルでは,対象に関するより識別的な特徴をマイニングすることを目的とした,空間的およびチャネル的注意機構についても紹介する。
最後に,モデルがよりリッチでロバストな機能を得ることができるように,特徴抽出器を再構築する。
大規模な実験は、既存のアプローチと比較して、我々のアプローチの優位性を示している。
私たちのコードはhttps://github.com/libraflower/MutipleFeature-for-PRIDで利用可能です。
関連論文リスト
- Enhancing Fine-Grained Visual Recognition in the Low-Data Regime Through Feature Magnitude Regularization [23.78498670529746]
抽出した特徴量の均等分布を保証するために正規化手法を導入する。
その明らかな単純さにもかかわらず、我々の手法は様々な細粒度視覚認識データセットに対して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-03T07:32:46Z) - High-Order Structure Based Middle-Feature Learning for Visible-Infrared
Person Re-Identification [37.954344873390106]
Visible-Infrared person re-identification (VI-ReID) は、可視光(VIS)と赤外線(IR)カメラで捉えた人物の画像を取得することを目的としている。
既存のVI-ReID法では,特徴の高次構造情報を無視すると同時に,適切な共通特徴空間の学習が比較的困難である。
実効的なVI-ReIDのための新しい高次構造に基づく中高次学習ネットワーク(HOS-Net)を提案する。
論文 参考訳(メタデータ) (2023-12-13T02:48:03Z) - Video Infringement Detection via Feature Disentanglement and Mutual
Information Maximization [51.206398602941405]
本稿では,元の高次元特徴を複数のサブ機能に分解することを提案する。
歪んだサブ機能の上に,サブ機能を強化する補助的特徴を学習する。
提案手法は,大規模SVDデータセット上で90.1%のTOP-100 mAPを達成し,VCSLベンチマークデータセット上で新たな最先端を設定できる。
論文 参考訳(メタデータ) (2023-09-13T10:53:12Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Multi-attentional Deepfake Detection [79.80308897734491]
ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
論文 参考訳(メタデータ) (2021-03-03T13:56:14Z) - Accurate RGB-D Salient Object Detection via Collaborative Learning [101.82654054191443]
RGB-Dサリエンシ検出は、いくつかの課題シナリオにおいて素晴らしい能力を示している。
本稿では,エッジ,深度,塩分濃度をより効率的に活用する新しい協調学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T04:33:36Z) - DFNet: Discriminative feature extraction and integration network for
salient object detection [6.959742268104327]
畳み込みニューラルネットワークを用いた唾液度検出における課題の2つの側面に焦点をあてる。
第一に、様々な大きさに有能な物体が現れるため、単一スケールの畳み込みは適切な大きさを捉えない。
第二に、マルチレベル機能の使用は、モデルがローカルコンテキストとグローバルコンテキストの両方を使用するのに役立つ。
論文 参考訳(メタデータ) (2020-04-03T13:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。