論文の概要: Gait Recognition via Deep Residual Networks and Multi-Branch Feature Fusion
- arxiv url: http://arxiv.org/abs/2604.27353v1
- Date: Thu, 30 Apr 2026 03:09:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.893165
- Title: Gait Recognition via Deep Residual Networks and Multi-Branch Feature Fusion
- Title(参考訳): 深部残差ネットワークとマルチブランチ特徴融合による歩行認識
- Authors: Yabo Luo, Xiaoyun Wang, Cunrong Li,
- Abstract要約: 本稿では,歩行動態を身体形状特性で深く抽出し,融合する高精度歩行認識フレームワークを提案する。
50層のResidual Networkは、階層的にリッチで差別的な表現をキャプチャするために、深い特徴抽出モジュール内で利用される。
クロスビュー多条件CASIA-Bベンチマーク実験により,通常の歩行下でのランク1の精度が94.52%であることが確認された。
- 参考スコア(独自算出の注目度): 5.585970057888865
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Gait recognition has emerged as a compelling biometric modality for surveillance and security applications, offering inherent advantages such as non-intrusiveness, resistance to disguise, and long-range identification capability. However, prevailing approaches struggle to comprehensively capture and exploit the rich biometric cues embedded in human locomotion, particularly under covariate interference including viewpoint variation, clothing change, and carrying conditions. In this paper, we present a high-precision gait recognition framework that deeply extracts and synergistically fuses gait dynamics with body shape characteristics through a multi-branch architecture grounded in deep residual learning. Specifically, we first employ the High-Resolution Network (HRNet) to perform robust skeletal keypoint estimation, preserving fine-grained spatial information even under low-resolution inputs. We then construct three complementary feature branches -- body proportion, gait velocity, and skeletal motion -- from the extracted pose sequences. A 50-layer Residual Network (ResNet-50) backbone is leveraged within a deep feature extraction module to capture hierarchically rich and discriminative representations. To effectively integrate heterogeneous feature streams, we design a Multi-Branch Feature Fusion (MFF) module inspired by channel-wise attention mechanisms, which dynamically allocates contribution weights across branches through learned activation parameters. Extensive experiments on the cross-view multi-condition CASIA-B benchmark demonstrate that our method achieves a Rank-1 accuracy of 94.52\% under normal walking, with the best recognition performance among skeleton-based methods for the coat-wearing condition.
- Abstract(参考訳): 歩行認識は、非侵入性、偽装に対する抵抗、長距離識別能力などの固有の利点を提供する、監視およびセキュリティアプリケーションにとって魅力的な生体認証モダリティとして現れてきた。
しかしながら、一般的なアプローチは、特に視点の変化、衣服の変化、輸送条件を含む共変量干渉の下で、人間の移動に埋め込まれたリッチな生体計測的手がかりを包括的に捉え、活用することに苦慮している。
本稿では,深い残差学習を基礎としたマルチブランチアーキテクチャを用いて,歩行動態と体型特性を深く抽出し,相乗的に融合する高精度歩行認識フレームワークを提案する。
具体的には,まず高分解能ネットワーク(HRNet)を用いて,低分解能入力下においてもきめ細かな空間情報を保存し,ロバストな骨格キーポイント推定を行う。
次に、抽出されたポーズシーケンスから、体比、歩行速度、骨格運動の3つの相補的特徴枝を構築する。
50層のResidual Network (ResNet-50) バックボーンは、階層的にリッチで差別的な表現をキャプチャするために、深い特徴抽出モジュール内で利用される。
ヘテロジニアスな特徴ストリームを効果的に統合するために、チャネルワイドアテンション機構にインスパイアされたマルチブランチ・フィーチャー・フュージョン(MFF)モジュールを設計し、学習されたアクティベーションパラメータを通して、ブランチ間のコントリビューション重みを動的に割り当てる。
クロスビュー多条件CASIA-Bベンチマークにおいて,本手法が正常歩行時のランク1精度94.52\%を達成することを示す。
関連論文リスト
- Image Classification via Random Dilated Convolution with Multi-Branch Feature Extraction and Context Excitation [3.9240527145303123]
RDCNetはResNet-34上に構築された新しいアーキテクチャで、これらの制限に対処するために3つのシナジスティックなイノベーションを統合する。
RDCNetは、最先端の分類精度を一貫して達成し、それぞれ0.02%、1.12%、0.18%、4.73%のマージンで2番目に良い競合手法を上回っている。
論文 参考訳(メタデータ) (2026-04-28T03:49:35Z) - Complementarity-Supervised Spectral-Band Routing for Multimodal Emotion Recognition [60.20529806857076]
マルチモーダル感情認識は、テキスト、ビデオ、音声などの手がかりを融合させ、個人の感情状態を理解する。
従来の手法では、機械的に独立な単調なパフォーマンスに依存することと、感情タスクで要求されるきめ細かい表現と相反する粗粒の融合という2つの主な制限に直面していた。
我々は,マルチスケールバンド分解とエキスパートコラボレーションを通じて,微細な相補的特徴をモデル化するために,Atsukoという名前のComplementarity-Supervised Multi-Band Expert Networkを提案する。
論文 参考訳(メタデータ) (2026-03-07T03:58:48Z) - DNA: Uncovering Universal Latent Forgery Knowledge [39.19379714306656]
フォージェリ検出機能は、すでにトレーニング済みのモデル内にエンコードされている。
DNAフレームワークは粗大な発掘機構を採用している。
Hifi-Genは、最新のモデルの上に構築された高忠実度合成ベンチマークである。
論文 参考訳(メタデータ) (2026-01-30T03:48:30Z) - HAMoBE: Hierarchical and Adaptive Mixture of Biometric Experts for Video-based Person ReID [14.923830228090246]
バイオメトリックエキスパートの階層的・適応的混合(HAMoBE)フレームワークを提案する。
HamoBEは、キーバイオメトリックの特徴を独立してモデル化することで、人間の知覚機構を模倣する。
私たちのアプローチは、大幅なパフォーマンス向上をもたらします。
論文 参考訳(メタデータ) (2025-08-07T05:34:14Z) - GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - GaitMA: Pose-guided Multi-modal Feature Fusion for Gait Recognition [26.721242606715354]
歩行認識は、歩行パターンを通して人間の身元を認識する生体計測技術である。
我々は、Gait Multi-model Aggregation Network (GaitMA)と呼ばれる新しい歩行認識フレームワークを提案する。
まず, 2つのCNN特徴抽出器を用いて, シルエットと骨格の特徴を抽出した。
論文 参考訳(メタデータ) (2024-07-20T09:05:17Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - GaitMAST: Motion-Aware Spatio-Temporal Feature Learning Network for
Cross-View Gait Recognition [32.76653659564304]
動作認識機能の可能性を解き放つGaitMASTを提案する。
GitMASTは個人のユニークなウォーキングパターンをよく保存する。
平均ランク1の精度は98.1%である。
論文 参考訳(メタデータ) (2022-10-21T08:42:00Z) - Learning Multi-Granular Spatio-Temporal Graph Network for Skeleton-based
Action Recognition [49.163326827954656]
骨格に基づく行動分類のための新しい多言語時空間グラフネットワークを提案する。
2つの枝の枝からなるデュアルヘッドグラフネットワークを開発し、少なくとも2つの時間分解能を抽出する。
3つの大規模データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-08-10T09:25:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。