論文の概要: Gait Recognition via Effective Global-Local Feature Representation and
Local Temporal Aggregation
- arxiv url: http://arxiv.org/abs/2011.01461v2
- Date: Sat, 14 Aug 2021 07:53:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 05:10:03.930847
- Title: Gait Recognition via Effective Global-Local Feature Representation and
Local Temporal Aggregation
- Title(参考訳): 効率的なグローバルローカル特徴表現と局所時間集約による歩行認識
- Authors: Beibei Lin, Shunli Zhang and Xin Yu
- Abstract要約: 歩行認識は最も重要な生体計測技術の一つであり、多くの分野で応用されている。
近年の歩行認識フレームワークは、人間のグローバルな外観または地域から抽出された記述子によって各歩行フレームを表現している。
歩行認識のための識別的特徴表現を実現するための新しい特徴抽出・融合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 28.721376937882958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gait recognition is one of the most important biometric technologies and has
been applied in many fields. Recent gait recognition frameworks represent each
gait frame by descriptors extracted from either global appearances or local
regions of humans. However, the representations based on global information
often neglect the details of the gait frame, while local region based
descriptors cannot capture the relations among neighboring regions, thus
reducing their discriminativeness. In this paper, we propose a novel feature
extraction and fusion framework to achieve discriminative feature
representations for gait recognition. Towards this goal, we take advantage of
both global visual information and local region details and develop a Global
and Local Feature Extractor (GLFE). Specifically, our GLFE module is composed
of our newly designed multiple global and local convolutional layers (GLConv)
to ensemble global and local features in a principle manner. Furthermore, we
present a novel operation, namely Local Temporal Aggregation (LTA), to further
preserve the spatial information by reducing the temporal resolution to obtain
higher spatial resolution. With the help of our GLFE and LTA, our method
significantly improves the discriminativeness of our visual features, thus
improving the gait recognition performance. Extensive experiments demonstrate
that our proposed method outperforms state-of-the-art gait recognition methods
on two popular datasets.
- Abstract(参考訳): 歩行認識は最も重要な生体計測技術の1つであり、多くの分野で応用されている。
最近の歩行認識フレームワークは、人間のグローバル外観または地域から抽出された記述子によって、それぞれの歩行フレームを表現する。
しかし、グローバル情報に基づく表現はしばしば歩行フレームの詳細を無視するが、地域ベースの記述子は近隣地域の関係を捉えることができないため、識別性が低下する。
本稿では,歩行認識のための識別的特徴表現を実現するための特徴抽出・融合フレームワークを提案する。
この目標に向けて、グローバルビジュアル情報とローカル領域の詳細の両方を利用し、グローバル・ローカル機能抽出器(glfe)を開発します。
特に、当社のglfeモジュールは、新たに設計された複数のグローバルおよびローカル畳み込み層(glconv)で構成され、グローバルおよびローカル機能を原則的にアンサンブルします。
さらに,時間分解能を低減し,より高い空間分解能を得るために,空間情報をさらに保存するための新しい操作である局所時間凝集(lta)を提案する。
glfeとltaの助けを借りて,視覚特徴の判別性を大幅に改善し,歩行認識性能を向上した。
大規模実験により,提案手法が2つの一般的なデータセットにおける最先端の歩行認識法を上回っていることを示す。
関連論文リスト
- Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - Other Tokens Matter: Exploring Global and Local Features of Vision Transformers for Object Re-Identification [63.147482497821166]
我々はまず,ViTのグローバルおよびローカルな特徴の影響を探求し,高性能オブジェクトRe-IDのための新しいグローバルローカ変換器(GLTrans)を提案する。
提案手法は,4つのオブジェクトRe-IDベンチマークにおいて優れた性能を実現する。
論文 参考訳(メタデータ) (2024-04-23T12:42:07Z) - LoDisc: Learning Global-Local Discriminative Features for
Self-Supervised Fine-Grained Visual Recognition [18.442966979622717]
本稿では,微妙な局所的きめ細かい特徴学習をグローバルな自己教師付きコントラスト学習に取り入れる。
局所的識別(LoDisc)と呼ばれる新しいプリテキストタスクは、局所的な中心領域に対する自己教師付きモデルの焦点を明示的に監督するために提案される。
そこで本稿では, 局所識別課題が重要な地域において, きめ細かな手掛かりを効果的に強化し, 画像のきめ細かな特徴表現をさらに洗練させることを実証する。
論文 参考訳(メタデータ) (2024-03-06T21:36:38Z) - Global Meets Local: Effective Multi-Label Image Classification via
Category-Aware Weak Supervision [37.761378069277676]
本稿では,効果的雑音・確率抑圧を実現するための統一的な枠組みを構築した。
我々はグローバルな特徴とローカルな特徴の相補的な情報を探るため、粒度横断型アテンションモジュールを開発した。
我々のフレームワークは最先端の手法よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2022-11-23T05:39:17Z) - RING++: Roto-translation Invariant Gram for Global Localization on a
Sparse Scan Map [20.276334172402763]
本稿では、位置認識のためのロト変換不変表現と、回転と翻訳の両方のグローバル収束を持つRing++を提案する。
理論的保証により、RING++はスパーススキャン付き軽量マップを使用して、大きな視点差に対処することができる。
これはスパーススキャンマップにおけるグローバルローカライゼーションのすべてのサブタスクに対処する初めての学習不要フレームワークである。
論文 参考訳(メタデータ) (2022-10-12T07:49:24Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - GaitGL: Learning Discriminative Global-Local Feature Representations for
Gait Recognition [29.128348655227416]
GaitGLはグローバルローカルな歩行認識ネットワークである。
GLCLは、GFR抽出器とマスクベースのLFR抽出器からなる二重分岐構造である。
実験により、GaitGLは最先端の歩行認識方法よりも優れた性能を達成することが示された。
論文 参考訳(メタデータ) (2022-08-02T11:50:21Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - Video Salient Object Detection via Adaptive Local-Global Refinement [7.723369608197167]
ビデオ・サリエント・オブジェクト検出(VSOD)は多くの視覚アプリケーションにおいて重要な課題である。
vsodのための適応型局所的グローバルリファインメントフレームワークを提案する。
重み付け手法は特徴相関を更に活用し,ネットワークにより識別的な特徴表現を学習させることができることを示す。
論文 参考訳(メタデータ) (2021-04-29T14:14:11Z) - Watching You: Global-guided Reciprocal Learning for Video-based Person
Re-identification [82.6971648465279]
映像に基づくRe-IDのための新しいグローバルガイド相互学習フレームワークを提案する。
我々のアプローチは他の最先端のアプローチよりも優れたパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2021-03-07T12:27:42Z) - Adversarial Graph Representation Adaptation for Cross-Domain Facial
Expression Recognition [86.25926461936412]
本稿では,グラフ表現の伝播と逆学習を両立させる新しいAdrialversa Graph Representation Adaptation (AGRA) フレームワークを提案する。
提案するAGRAフレームワークは,従来の最先端手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-08-03T13:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。