論文の概要: Global-Local Dynamic Feature Alignment Network for Person
Re-Identification
- arxiv url: http://arxiv.org/abs/2109.05759v1
- Date: Mon, 13 Sep 2021 07:53:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 07:50:21.726289
- Title: Global-Local Dynamic Feature Alignment Network for Person
Re-Identification
- Title(参考訳): 人物再同定のためのグローバルローカル動的特徴アライメントネットワーク
- Authors: Zhangqiang Ming and Yong Yang and Xiaoyong Wei and Jianrong Yan and
Xiangkun Wang and Fengjie Wang and Min Zhu
- Abstract要約: 本研究では,歩行者の局所ストライプにスライド窓を設置することにより,2つの画像の局所的特徴を動的に整列させる,シンプルで効率的な局所スライディングアライメント(LSA)戦略を提案する。
LSAは空間的不整合を効果的に抑制することができ、追加の監視情報を導入する必要はない。
GLDFA-NetのローカルブランチにLSAを導入し、距離メトリクスの計算をガイドし、テストフェーズの精度をさらに向上させる。
- 参考スコア(独自算出の注目度): 5.202841879001503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The misalignment of human images caused by pedestrian detection bounding box
errors or partial occlusions is one of the main challenges in person
Re-Identification (Re-ID) tasks. Previous local-based methods mainly focus on
learning local features in predefined semantic regions of pedestrians, usually
use local hard alignment methods or introduce auxiliary information such as key
human pose points to match local features. These methods are often not
applicable when large scene differences are encountered. Targeting to solve
these problems, we propose a simple and efficient Local Sliding Alignment (LSA)
strategy to dynamically align the local features of two images by setting a
sliding window on the local stripes of the pedestrian. LSA can effectively
suppress spatial misalignment and does not need to introduce extra supervision
information. Then, we design a Global-Local Dynamic Feature Alignment Network
(GLDFA-Net) framework, which contains both global and local branches. We
introduce LSA into the local branch of GLDFA-Net to guide the computation of
distance metrics, which can further improve the accuracy of the testing phase.
Evaluation experiments on several mainstream evaluation datasets including
Market-1501, DukeMTMC-reID, and CUHK03 show that our method has competitive
accuracy over the several state-of-the-art person Re-ID methods. Additionally,
it achieves 86.1% mAP and 94.8% Rank-1 accuracy on Market1501.
- Abstract(参考訳): 歩行者検出による人間の画像の誤認や、境界ボックスの誤りや部分的オクルージョンは、人物再識別(re-id)作業における主な課題の一つである。
従来の局所的手法は主に歩行者の事前定義された意味領域における局所的特徴の学習に焦点を当てており、通常は局所的ハードアライメント法や、局所的特徴にマッチする重要な人間のポーズポイントなどの補助情報を導入している。
これらの方法は、大きなシーンの違いに遭遇しても適用できないことが多い。
そこで,本稿では,歩行者の局所ストライプにスライディングウインドウを設定し,2つの画像の局所的特徴を動的に整列する,簡便で効率的な局所スライディングアライメント(lsa)戦略を提案する。
LSAは空間的不整合を効果的に抑制することができ、追加の監視情報を導入する必要はない。
次に,グローバルブランチとローカルブランチの両方を含むグローバルローカル動的機能アライメントネットワーク(gldfa-net)フレームワークを設計する。
GLDFA-NetのローカルブランチにLSAを導入し、距離メトリクスの計算をガイドし、テストフェーズの精度をさらに向上させる。
Market-1501, DukeMTMC-reID, CUHK03などの主要な評価データセットを用いた評価実験により, 提案手法は, 最先端のRe-ID手法と比較して, 競争精度が高いことが示された。
さらに、マーケット1501では86.1%のmAPと94.8%のランク-1の精度を達成した。
関連論文リスト
- GlocalCLIP: Object-agnostic Global-Local Prompt Learning for Zero-shot Anomaly Detection [5.530212768657544]
本研究では,グローバルおよびローカルなプロンプトの学習を改善するために,局所的なコントラスト学習を導入し,各領域の異常パターンを効果的に検出する。
The generalization performance of GlocalCLIP in ZSAD were demonstrated on 15 real-world datasets from the industrial and medical domain。
論文 参考訳(メタデータ) (2024-11-09T05:22:13Z) - From Global to Local: Multi-scale Out-of-distribution Detection [129.37607313927458]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)トレーニングプロセス中にラベルが見られない未知のデータを検出することを目的としている。
近年の表現学習の進歩により,距離に基づくOOD検出がもたらされる。
グローバルな視覚情報と局所的な情報の両方を活用する第1のフレームワークであるマルチスケールOOD検出(MODE)を提案する。
論文 参考訳(メタデータ) (2023-08-20T11:56:25Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Spatial-Aware Token for Weakly Supervised Object Localization [137.0570026552845]
タスク固有の空間認識トークンを,弱教師付き方式で条件定位に提案する。
実験の結果、SATはCUB-200とImageNetの両方で、98.45%と73.13%のGT-known Locで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-03-18T15:38:17Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Object-Guided Day-Night Visual Localization in Urban Scenes [2.4493299476776778]
提案手法はまず意味オブジェクトを検出し,画像間の対応性を確立する。
標準的な都市局所化データセットの実験により,OGuLはSIFTと同様の簡易な局所的特徴を持つ局所化結果を大幅に改善することが示された。
論文 参考訳(メタデータ) (2022-02-09T13:21:30Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。