論文の概要: Multi-view Gait Recognition based on Siamese Vision Transformer
- arxiv url: http://arxiv.org/abs/2210.10421v1
- Date: Wed, 19 Oct 2022 09:38:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 13:35:14.481380
- Title: Multi-view Gait Recognition based on Siamese Vision Transformer
- Title(参考訳): siamese vision transformerを用いた多視点歩行認識
- Authors: Yanchen Yang, Lijun Yun, Ruoyu Li, Feiyan Cheng
- Abstract要約: 本稿では歩行認識のためのSamese Mobile Vision Transformer (SMViT)を提案する。
人間の歩行空間の局所的特徴に着目し、長距離注意関係の特徴を考察する。
CASIA BデータセットにおけるSMViTの平均認識率は96.4%に達した。
- 参考スコア(独自算出の注目度): 2.374304682010305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the Vision Transformer has been used in gait recognition, its
application in multi-view gait recognition is still limited. Different views
significantly affect the extraction and identification accuracy of the
characteristics of gait contour. To address this, this paper proposes a Siamese
Mobile Vision Transformer (SMViT). This model not only focuses on the local
characteristics of the human gait space but also considers the characteristics
of long-distance attention associations, which can extract multi-dimensional
step status characteristics. In addition, it describes how different
perspectives affect gait characteristics and generate reliable perspective
feature relationship factors. The average recognition rate of SMViT on the
CASIA B data set reached 96.4%. The experimental results show that SMViT can
attain state-of-the-art performance compared to advanced step recognition
models such as GaitGAN, Multi_view GAN, Posegait and other gait recognition
models.
- Abstract(参考訳): Vision Transformerは歩行認識に使われているが、マルチビュー歩行認識への応用はまだ限られている。
異なる視点は,歩行輪郭の特徴の抽出と識別精度に大きく影響する。
そこで本研究では,Samese Mobile Vision Transformer (SMViT)を提案する。
このモデルでは,歩行空間の局所的特性に留意するだけでなく,多次元ステップ状態特性を抽出できる長距離注意関係の特性を考察する。
さらに、異なる視点が歩行特性にどのように影響するかを説明し、信頼できる視点特徴関係因子を生成する。
CASIA BデータセットにおけるSMViTの平均認識率は96.4%に達した。
実験の結果,smvitは,gaitgan,multi_view gan,sponsgaitなどの歩容認識モデルと比較して,最先端の歩容性能を達成できることがわかった。
関連論文リスト
- ReViT: Enhancing Vision Transformers Feature Diversity with Attention Residual Connections [8.372189962601077]
視覚変換器(ViT)自己保持機構は、深い層に特徴的崩壊を特徴とする。
本稿では,ViTに基づくアーキテクチャを改良するための新たな注意学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-17T14:44:10Z) - DAT++: Spatially Dynamic Vision Transformer with Deformable Attention [87.41016963608067]
Deformable Attention Transformer (DAT++)を提案する。
DAT++は、85.9%のImageNet精度、54.5および47.0のMS-COCOインスタンスセグメンテーションmAP、51.5のADE20KセマンティックセグメンテーションmIoUで、様々なビジュアル認識ベンチマークで最先端の結果を達成している。
論文 参考訳(メタデータ) (2023-09-04T08:26:47Z) - Multimodal Adaptive Fusion of Face and Gait Features using Keyless
attention based Deep Neural Networks for Human Identification [67.64124512185087]
歩行のような軟式生体認証は、人物認識や再識別といった監視作業において顔に広く使われている。
本稿では,キーレス注意深層ニューラルネットワークを活用することで,歩行と顔のバイオメトリック・キューを動的に組み込むための適応型マルチバイオメトリック・フュージョン戦略を提案する。
論文 参考訳(メタデータ) (2023-03-24T05:28:35Z) - Multi-Modal Human Authentication Using Silhouettes, Gait and RGB [59.46083527510924]
全体認証は、遠隔生体認証のシナリオにおいて有望なアプローチである。
本稿では,RGBデータとシルエットデータを組み合わせたDME(Dual-Modal Ensemble)を提案する。
DME内では、従来の歩行分析に使用される二重ヘリカル歩行パターンにインスパイアされたGaitPatternを提案する。
論文 参考訳(メタデータ) (2022-10-08T15:17:32Z) - Multi-manifold Attention for Vision Transformers [12.862540139118073]
ビジョントランスフォーマーは、いくつかのコンピュータビジョンタスクにおける最先端の性能のために、今日では非常に人気がある。
本研究では, 変圧器のバニラ自己注意の代替として, マルチマニフォールドマルチヘッドアテンションと呼ばれる新しいアテンション機構を提案する。
論文 参考訳(メタデータ) (2022-07-18T12:53:53Z) - Towards a Deeper Understanding of Skeleton-based Gait Recognition [4.812321790984493]
近年、ほとんどの歩行認識法は、人のシルエットを使って歩行の特徴を抽出している。
モデルに基づく手法はこれらの問題に悩まされず、身体関節の時間運動を表現することができる。
本研究では,高次入力と残差ネットワークを組み合わせたグラフ畳み込みネットワーク(GCN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-16T18:23:37Z) - ViTAEv2: Vision Transformer Advanced by Exploring Inductive Bias for
Image Recognition and Beyond [76.35955924137986]
我々は、内在性IBを畳み込み、すなわちViTAEから探索するビジョントランスフォーマーを提案する。
ViTAEはいくつかの空間ピラミッド縮小モジュールを備えており、入力イメージをリッチなマルチスケールコンテキストでトークンに埋め込む。
我々は、ImageNet検証セット上で88.5%のTop-1分類精度と、ImageNet実検証セット上で最高の91.2%のTop-1分類精度を得る。
論文 参考訳(メタデータ) (2022-02-21T10:40:05Z) - Deep Collaborative Multi-Modal Learning for Unsupervised Kinship
Estimation [53.62256887837659]
キンシップ検証は、コンピュータビジョンにおける長年の研究課題である。
本稿では,顔特性に表される基礎情報を統合するために,新しい協調型多モーダル学習(DCML)を提案する。
我々のDCML法は、常に最先端のキンシップ検証法よりも優れている。
論文 参考訳(メタデータ) (2021-09-07T01:34:51Z) - Vision Transformers are Robust Learners [65.91359312429147]
ビジョントランスフォーマー(ViT)の一般的な腐敗や摂動、分布シフト、自然逆転例に対する堅牢性について検討します。
ViTsが実際により堅牢な学習者である理由を説明するために、定量的および定性的な指標を提供する分析を提示します。
論文 参考訳(メタデータ) (2021-05-17T02:39:22Z) - SelfGait: A Spatiotemporal Representation Learning Method for
Self-supervised Gait Recognition [24.156710529672775]
歩行認識は、歩行が距離で認識することができるユニークな生体測定機能であるため、人間の識別に重要な役割を果たします。
既存の歩行認識法は歩行系列から歩行特徴を異なる方法で学習することができるが、歩行認識の性能はラベル付きデータに苦しむ。
本研究では, 事前学習プロセスとして, 多種多様でラベルなしの歩行データを活用した自己監視歩行認識手法であるSelfGaitを提案する。
論文 参考訳(メタデータ) (2021-03-27T05:15:39Z) - Gait Recognition using Multi-Scale Partial Representation Transformation
with Capsules [22.99694601595627]
本稿では,カプセルを用いたマルチスケール部分歩行表現の伝達を学習する,新しいディープネットワークを提案する。
我々のネットワークは、まず最先端のディープ部分特徴抽出器を用いて、マルチスケールな部分表現を得る。
その後、前向きと後向きの部分的特徴間のパターンの相関関係と共起関係を繰り返し学習する。
論文 参考訳(メタデータ) (2020-10-18T19:47:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。