論文の概要: GaitMPL: Gait Recognition with Memory-Augmented Progressive Learning
- arxiv url: http://arxiv.org/abs/2306.04650v1
- Date: Tue, 6 Jun 2023 07:24:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-06-09 18:33:41.007093
- Title: GaitMPL: Gait Recognition with Memory-Augmented Progressive Learning
- Title(参考訳): GaitMPL: メモリ拡張プログレッシブラーニングによる歩行認識
- Authors: Huanzhang Dou, Pengyi Zhang, Yuhan Zhao, Lin Dong, Zequn Qin, Xi Li
- Abstract要約: 歩行認識は、歩行パターンによって歩行者を遠くに識別することを目的としている。
本研究では,メモリ拡張プログレッシブラーニングネットワーク(GaitMPL)によるハードサンプル問題の解決を提案する。
具体的には、DRPLは、ハードサンプルの学習難度を、容易にハードプログレッシブな学習によって低減する。
さらにGSAMはDRPLを構造整列メモリ機構で拡張し、各IDの特徴分布を維持し、モデル化する。
- 参考スコア(独自算出の注目度): 10.427640929715668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gait recognition aims at identifying the pedestrians at a long distance by
their biometric gait patterns. It is inherently challenging due to the various
covariates and the properties of silhouettes (textureless and colorless), which
result in two kinds of pair-wise hard samples: the same pedestrian could have
distinct silhouettes (intra-class diversity) and different pedestrians could
have similar silhouettes (inter-class similarity). In this work, we propose to
solve the hard sample issue with a Memory-augmented Progressive Learning
network (GaitMPL), including Dynamic Reweighting Progressive Learning module
(DRPL) and Global Structure-Aligned Memory bank (GSAM). Specifically, DRPL
reduces the learning difficulty of hard samples by easy-to-hard progressive
learning. GSAM further augments DRPL with a structure-aligned memory mechanism,
which maintains and models the feature distribution of each ID. Experiments on
two commonly used datasets, CASIA-B and OU-MVLP, demonstrate the effectiveness
of GaitMPL. On CASIA-B, we achieve the state-of-the-art performance, i.e.,
88.0% on the most challenging condition (Clothing) and 93.3% on the average
condition, which outperforms the other methods by at least 3.8% and 1.4%,
respectively.
- Abstract(参考訳): 歩行認識は、歩行パターンによって歩行者を遠くに識別することを目的としている。
様々な共変量とシルエットの性質(無テクスチャーと無色)により本質的に困難であり、結果として2種類の硬いサンプルが生じる:同じ歩行者は異なるシルエット(クラス内多様性)を持ち、異なる歩行者は類似したシルエット(クラス間類似性)を持つ。
本稿では,dpl(dynamic reweighting progressive learning module)とgsam(global structure-aligned memory bank)を含む,メモリ提示型プログレッシブ学習ネットワーク(gaitmpl)を用いて,ハードサンプル問題を解くことを提案する。
具体的には、DRPLは、ハードサンプルの学習難度を、容易にハードプログレッシブな学習によって低減する。
さらにGSAMはDRPLを構造整列メモリ機構で拡張し、各IDの特徴分布を維持し、モデル化する。
CASIA-BとOU-MVLPという2つの一般的なデータセットの実験は、GaitMPLの有効性を実証している。
CASIA-Bでは、最も難易度の高い条件(クロッシング)では88.0%、平均条件では93.3%の最先端性能を達成し、それぞれ3.8%と1.4%で他の手法を上回った。
関連論文リスト
- Memory Consistency Guided Divide-and-Conquer Learning for Generalized
Category Discovery [56.172872410834664]
一般カテゴリー発見(GCD)は、半教師付き学習のより現実的で挑戦的な設定に対処することを目的としている。
メモリ一貫性を誘導する分枝・分枝学習フレームワーク(MCDL)を提案する。
本手法は,画像認識の目に見えるクラスと見えないクラスの両方において,最先端のモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-24T09:39:45Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - TriGait: Aligning and Fusing Skeleton and Silhouette Gait Data via a
Tri-Branch Network [4.699718818019937]
歩行認識は、非侵襲性と長距離性のため、識別のための有望な生体認証技術である。
服装の変化や視点の違いなどの外的変化は、歩行認識に重大な課題をもたらす。
本稿では,新しい三脚歩行認識フレームワークTriGaitを提案する。
論文 参考訳(メタデータ) (2023-08-25T12:19:51Z) - Hallucination Improves the Performance of Unsupervised Visual
Representation Learning [9.504503675097137]
本研究では,さらにコントラストを増すために,効率よく追加の正のサンプルを生成できるHalucinatorを提案する。
Hallucinatorは識別可能で、機能領域で新しいデータを生成する。
顕著なことに,提案した幻覚器が様々な対照的な学習モデルによく当てはまることを実証的に証明する。
論文 参考訳(メタデータ) (2023-07-22T21:15:56Z) - MetaGait: Learning to Learn an Omni Sample Adaptive Representation for
Gait Recognition [16.26377062742576]
そこで我々は,Omniサンプル適応表現を学習するMetaGaitを開発した。
プロセス全体にわたってメタ知識を活用し、メタトリプルアテンションとメタテンポラルプールを提示します。
大規模な実験によって提案されたMetaGaitの最先端性能が実証された。
論文 参考訳(メタデータ) (2023-06-06T06:53:05Z) - Modality-Aware Triplet Hard Mining for Zero-shot Sketch-Based Image
Retrieval [51.42470171051007]
本稿では,ZES-SBIR(Zero-Shot Sketch-Based Image Retrieval)問題に,クロスモダリティメトリック学習の観点から取り組む。
DMLにおける2つの基本的な学習手法、例えば分類訓練とペアトレーニングを組み合わせることで、ZS-SBIRの強力なベースラインを構築した。
モータリティ・アウェア・トリプルト・ハード・マイニング(MATHM)は3種類のペア・ラーニングによってベースラインを向上することを示す。
論文 参考訳(メタデータ) (2021-12-15T08:36:44Z) - Consensus Synergizes with Memory: A Simple Approach for Anomaly
Segmentation in Urban Scenes [132.16748656557013]
異常セグメンテーション(Anomaly segmentation)は、都市部における自律運転のような安全クリティカルなアプリケーションにとって重要な課題である。
本稿では,この課題に対処するため,Consensus Synergizes with Memory (CosMe) という新しいシンプルなアプローチを提案する。
いくつかの都市景観異常セグメンテーションデータセットの実験結果から、CosMeは従来のアプローチよりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2021-11-24T10:01:20Z) - Adaptive Hierarchical Similarity Metric Learning with Noisy Labels [138.41576366096137]
適応的階層的類似度メトリック学習法を提案する。
ノイズに敏感な2つの情報、すなわち、クラスワイドのばらつきとサンプルワイドの一貫性を考える。
提案手法は,現在の深層学習手法と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-10-29T02:12:18Z) - Learning Rich Features for Gait Recognition by Integrating Skeletons and
Silhouettes [20.766540020533803]
本稿では,骨格とシルエットの相補的な手がかりをマイニングし,歩行識別のためのリッチな特徴を学習する,単純で効果的なバイモーダル融合ネットワークを提案する。
CASIA-B上を歩行する最も困難な条件下では, ランク1の精度は92.1%である。
論文 参考訳(メタデータ) (2021-10-26T04:42:24Z) - View-Invariant Gait Recognition with Attentive Recurrent Learning of
Partial Representations [27.33579145744285]
本稿では,まず,フレームレベルの畳み込み特徴から歩行畳み込みエネルギーマップ(GCEM)を抽出するネットワークを提案する。
次に、GCEMの分割されたビンから学ぶために双方向ニューラルネットワークを採用し、学習された部分的リカレント表現の関係を利用する。
提案手法は2つの大規模CASIA-BとOU-Mの歩行データセットで広範囲に検証されている。
論文 参考訳(メタデータ) (2020-10-18T20:20:43Z) - Learning and Memorizing Representative Prototypes for 3D Point Cloud
Semantic and Instance Segmentation [117.29799759864127]
3Dポイントクラウドセマンティクスとインスタンスセグメンテーションは、3Dシーン理解にとって不可欠で基本である。
深層ネットワークは、学習過程における非支配的なケースを忘れやすく、不満足なパフォーマンスをもたらす。
本稿では,多様なサンプルを普遍的にカバーする代表プロトタイプを学習し,記憶するメモリ拡張ネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-06T01:07:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。