論文の概要: Spatial Transformer Network on Skeleton-based Gait Recognition
- arxiv url: http://arxiv.org/abs/2204.03873v1
- Date: Fri, 8 Apr 2022 06:53:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-11 13:09:53.577008
- Title: Spatial Transformer Network on Skeleton-based Gait Recognition
- Title(参考訳): 骨格に基づく歩行認識における空間変換器ネットワーク
- Authors: Cun Zhang, Xing-Peng Chen, Guo-Qiang Han, Xiang-Jie Liu
- Abstract要約: Gait-TRは、空間トランスフォーマーフレームワークと時間畳み込みネットワークに基づく頑健な骨格に基づく歩行認識モデルである。
歩行-TRは、よく知られた歩行データセットCASIA-Bの精度とロバスト性を向上し、他の骨格ベースの歩行モデルよりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 19.747638780327257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Skeleton-based gait recognition models usually suffer from the robustness
problem, as the Rank-1 accuracy varies from 90\% in normal walking cases to
70\% in walking with coats cases. In this work, we propose a state-of-the-art
robust skeleton-based gait recognition model called Gait-TR, which is based on
the combination of spatial transformer frameworks and temporal convolutional
networks. Gait-TR achieves substantial improvements over other skeleton-based
gait models with higher accuracy and better robustness on the well-known gait
dataset CASIA-B. Particularly in walking with coats cases, Gait-TR get a 90\%
Rank-1 gait recognition accuracy rate, which is higher than the best result of
silhouette-based models, which usually have higher accuracy than the
silhouette-based gait recognition models. Moreover, our experiment on CASIA-B
shows that the spatial transformer can extract gait features from the human
skeleton better than the widely used graph convolutional network.
- Abstract(参考訳): スケルトンベースの歩行認識モデルは通常ロバスト性の問題に苦しむが、rank-1の精度は通常の歩行症例で90\%からコートケースで歩く場合で70\%に変化する。
本研究では,空間トランスフォーマフレームワークと時間畳み込みネットワークを組み合わせた,最先端の頑健な骨格型歩行認識モデルGait-TRを提案する。
歩行-TRは、よく知られた歩行データセットCASIA-Bの精度と堅牢性を向上し、他の骨格ベースの歩行モデルよりも大幅に改善されている。
特にコートを用いた歩行では、Gait-TRは90%のランク-1歩行認識精度が得られ、これはシルエットベースの歩行認識モデルよりも高い精度でシルエットベースの歩行認識モデルよりも高い結果である。
さらに,casia-bを用いた実験では,広く用いられているグラフ畳み込みネットワークよりも,人間の骨格から歩行の特徴を抽出できることを示した。
関連論文リスト
- Self-DenseMobileNet: A Robust Framework for Lung Nodule Classification using Self-ONN and Stacking-based Meta-Classifier [1.2300841481611335]
Self-DenseMobileNetは胸部X線写真(CXR)における結節と非結節の分類を強化するように設計されている
我々のフレームワークは、入力品質を最適化するために高度な画像標準化と拡張技術を統合している。
外部データセットでテストすると、このフレームワークは89.40%の精度で強力な一般化性を維持した。
論文 参考訳(メタデータ) (2024-10-16T14:04:06Z) - GaitPT: Skeletons Are All You Need For Gait Recognition [4.089889918897877]
我々は、Gait Pyramid Transformer (GaitPT) と呼ばれる新しい歩行認識アーキテクチャを提案する。
GaitPTはポーズ推定スケルトンを使用して、外観情報に頼ることなく、ユニークな歩行パターンをキャプチャする。
以上の結果から,GaitPTは,他の骨格に基づく歩行認識技術と比較して最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-08-21T10:47:52Z) - One-Shot Action Recognition via Multi-Scale Spatial-Temporal Skeleton
Matching [77.6989219290789]
ワンショットスケルトン行動認識は、単一のトレーニングサンプルでスケルトン行動認識モデルを学ぶことを目的としている。
本稿では,マルチスケールな時空間特徴マッチングによる骨格行動認識を行う新しい一発骨格行動認識手法を提案する。
論文 参考訳(メタデータ) (2023-07-14T11:52:10Z) - Pretraining Without Attention [114.99187017618408]
本研究では、状態空間モデル(SSM)に基づくシーケンスルーティングの最近の進歩を利用して、注意を払わずに事前学習を探索する。
BiGS は GLUE 上で BERT の事前トレーニング精度と一致し、近似なしで 4096 トークンの長期事前トレーニングに拡張できる。
論文 参考訳(メタデータ) (2022-12-20T18:50:08Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - Towards a Deeper Understanding of Skeleton-based Gait Recognition [4.812321790984493]
近年、ほとんどの歩行認識法は、人のシルエットを使って歩行の特徴を抽出している。
モデルに基づく手法はこれらの問題に悩まされず、身体関節の時間運動を表現することができる。
本研究では,高次入力と残差ネットワークを組み合わせたグラフ畳み込みネットワーク(GCN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-16T18:23:37Z) - Learning Rich Features for Gait Recognition by Integrating Skeletons and
Silhouettes [20.766540020533803]
本稿では,骨格とシルエットの相補的な手がかりをマイニングし,歩行識別のためのリッチな特徴を学習する,単純で効果的なバイモーダル融合ネットワークを提案する。
CASIA-B上を歩行する最も困難な条件下では, ランク1の精度は92.1%である。
論文 参考訳(メタデータ) (2021-10-26T04:42:24Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - GaitSet: Cross-view Gait Recognition through Utilizing Gait as a Deep
Set [19.017795736485944]
歩行は、距離で認識できるユニークな生体認証機能である。
既存の歩行認識方法は、不要な順序制約を維持する歩行テンプレートまたは歩行シーケンスを利用する。
本稿では,歩行を深層集合として利用する新しい視点について述べる。つまり,一組の歩行フレームがグローバルな局所融合深層ネットワークによって統合されることを意味する。
論文 参考訳(メタデータ) (2021-02-05T15:49:54Z) - From Sound Representation to Model Robustness [82.21746840893658]
本研究では, 環境音の標準的な表現(スペクトログラム)が, 被害者の残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
3つの環境音響データセットの様々な実験から、ResNet-18モデルは、他のディープラーニングアーキテクチャよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-27T17:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。