論文の概要: Local-Aware Global Attention Network for Person Re-Identification
- arxiv url: http://arxiv.org/abs/2209.04821v1
- Date: Sun, 11 Sep 2022 09:43:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 13:13:06.349799
- Title: Local-Aware Global Attention Network for Person Re-Identification
- Title(参考訳): 人物再同定のための地域意識グローバルアテンションネットワーク
- Authors: Nathanael L. Baisa
- Abstract要約: 本稿では,身体画像と手動画像の両面から,人物Re-Idに対するエンドツーエンドの識別的深層特徴学習のための複合的アプローチを提案する。
提案手法は既存の最先端手法よりも一貫して優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning representative, robust and discriminative information from images is
essential for effective person re-identification (Re-Id). In this paper, we
propose a compound approach for end-to-end discriminative deep feature learning
for person Re-Id based on both body and hand images. We carefully design the
Local-Aware Global Attention Network (LAGA-Net), a multi-branch deep network
architecture consisting of one branch for spatial attention, one branch for
channel attention, one branch for global feature representations and another
branch for local feature representations. The attention branches focus on the
relevant features of the image while suppressing the irrelevant backgrounds. In
order to overcome the weakness of the attention mechanisms, equivariant to
pixel shuffling, we integrate relative positional encodings into the spatial
attention module to capture the spatial positions of pixels. The global branch
intends to preserve the global context or structural information. For the the
local branch, which intends to capture the fine-grained information, we perform
uniform partitioning to generate stripes on the conv-layer horizontally. We
retrieve the parts by conducting a soft partition without explicitly
partitioning the images or requiring external cues such as pose estimation. A
set of ablation study shows that each component contributes to the increased
performance of the LAGA-Net. Extensive evaluations on four popular body-based
person Re-Id benchmarks and two publicly available hand datasets demonstrate
that our proposed method consistently outperforms existing state-of-the-art
methods.
- Abstract(参考訳): 効果的な人物再識別(re-id)には,画像からのロバストかつ判別情報の学習が不可欠である。
本稿では,身体画像と手動画像の両面から,人物Re-Idに対するエンドツーエンドの識別的特徴学習のための複合的アプローチを提案する。
局所認識型グローバルアテンションネットワーク (LAGA-Net) は,空間的注意のための1つのブランチ,チャネル的注意のための1つのブランチ,グローバルな特徴表現のための1つのブランチ,局所的特徴表現のためのもう1つのブランチからなる多分岐深層ネットワークアーキテクチャである。
注意枝は、無関係な背景を抑えながら、画像の関連する特徴に焦点を当てる。
画素シャッフルと等価なアテンション機構の弱点を克服するため,相対的な位置エンコーディングを空間アテンションモジュールに統合し,画素の空間位置を捉える。
グローバルブランチは、グローバルコンテキストや構造情報の保存を目的としている。
細粒度情報をキャプチャするローカルブランチでは,conv層上に水平にストライプを生成するために,均一なパーティショニングを行う。
画像のパーティショニングやポーズ推定などの外部の手がかりを必要とすることなく,ソフトパーティショニングを行うことで,部品の検索を行う。
一連のアブレーション研究は、各コンポーネントがLAGA-Netの性能向上に寄与していることを示している。
4つの一般的なボディベースパーソンリidベンチマークと2つの公開ハンドデータセットの広範な評価結果から,提案手法が既存の最先端手法を一貫して上回っていることが判明した。
関連論文リスト
- Holistic Prototype Attention Network for Few-Shot VOS [74.25124421163542]
FSVOS(Few-shot Video Object segmentation)は、少数のサポートイメージに頼って、目に見えないクラスの動的オブジェクトをセグメントすることを目的としている。
本稿では,FSVOS を前進させるための総合プロトタイプアテンションネットワーク (HPAN) を提案する。
論文 参考訳(メタデータ) (2023-07-16T03:48:57Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - PGGANet: Pose Guided Graph Attention Network for Person
Re-identification [0.0]
人物再識別(ReID)は、異なるカメラで撮影された画像から人物を回収することを目的としている。
局所的な特徴と人像のグローバルな特徴を併用することで、人物の検索に堅牢な特徴表現を与えることができることが証明されている。
本研究では,ポーズガイド付きグラフアテンションネットワーク,グローバル機能のための1つのブランチ,中粒体機能のための1つのブランチ,粒状キーポイント機能のための1つのブランチからなるマルチブランチアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-29T09:47:39Z) - Multi-Branch with Attention Network for Hand-Based Person Recognition [5.162308830328819]
本稿では,犯罪捜査を目的とした手動人物認識手法を提案する。
提案手法は,マルチブランチ・アテンション・ネットワーク (MBA-Net) で,チャネル・アテンション・モジュールと空間アテンション・モジュールを併用する。
提案手法は,既存の手動識別手法を超越して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T18:25:08Z) - All the attention you need: Global-local, spatial-channel attention for
image retrieval [11.150896867058902]
大規模インスタンスレベルの画像検索のための表現学習に対処する。
バックボーンネットワークの端に付加されるグローバルローカルアテンションモジュール(GLAM)について述べる。
我々は,特徴テンソルを新たに獲得し,空間プーリングにより画像検索のための強力な埋め込みを学習する。
論文 参考訳(メタデータ) (2021-07-16T16:39:13Z) - Hand-Based Person Identification using Global and Part-Aware Deep
Feature Representation Learning [6.144554939661599]
グローバル特徴表現とローカル特徴表現の両方を学習し,手指による人物識別を提案する。
提案手法であるGlobal and Part-Aware Network (GPA-Net) は,conv層上のグローバルおよびローカルブランチを生成する。
提案手法が競合するアプローチを著しく上回っていることを示すため,2つの大規模マルチエスニックデータセットと公開ハンドデータセットについて広範な評価を行った。
論文 参考訳(メタデータ) (2021-01-13T18:47:47Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。