論文の概要: Explicit Time-Frequency Dynamics for Skeleton-Based Gait Recognition
- arxiv url: http://arxiv.org/abs/2604.03002v1
- Date: Fri, 03 Apr 2026 12:32:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.469121
- Title: Explicit Time-Frequency Dynamics for Skeleton-Based Gait Recognition
- Title(参考訳): 骨格に基づく歩行認識のための時間-周波数ダイナミックス
- Authors: Seoyeon Ko, Yeojin Song, Egene Chung, Luca Quagliato, Taeyong Lee, Junhyug Noh,
- Abstract要約: 骨格をベースとした歩行認識器はモデリングに優れるが、外見の変化において重要な明示的な運動力学を過小評価することが多い。
関節速度の時間-周波数ダイナミックスで骨格を増強するプラグイン・アンド・プレイ機能ストリームを導入する。
CASIA-B全体で、提案されたストリームは強い骨格のバックボーンに一貫した利得をもたらす。
- 参考スコア(独自算出の注目度): 2.354172698385588
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skeleton-based gait recognizers excel at modeling spatial configurations but often underuse explicit motion dynamics that are crucial under appearance changes. We introduce a plug-and-play Wavelet Feature Stream that augments any skeleton backbone with time-frequency dynamics of joint velocities. Concretely, per-joint velocity sequences are transformed by the continuous wavelet transform (CWT) into multi-scale scalograms, from which a lightweight multi-scale CNN learns discriminative dynamic cues. The resulting descriptor is fused with the backbone representation for classification, requiring no changes to the backbone architecture or additional supervision. Across CASIA-B, the proposed stream delivers consistent gains on strong skeleton backbones (e.g., GaitMixer, GaitFormer, GaitGraph) and establishes a new skeleton-based state of the art when attached to GaitMixer. The improvements are especially pronounced under covariate shifts such as carrying bags (BG) and wearing coats (CL), highlighting the complementarity of explicit time-frequency modeling and standard spatio-temporal encoders.
- Abstract(参考訳): 骨格をベースとした歩行認識器は空間構成のモデル化に優れるが、外見の変化において重要な明示的な運動力学を過小評価することが多い。
関節速度の時間-周波数ダイナミックスで骨格のバックボーンを増強する,プラグイン・アンド・プレイのWavelet Feature Streamを導入する。
具体的には、連続ウェーブレット変換(CWT)により、結合速度列をマルチスケールのカルグラムに変換し、軽量なマルチスケールCNNが識別動的キューを学習する。
結果として生成されたディスクリプタは、分類のためのバックボーン表現と融合し、バックボーンアーキテクチャの変更や追加の監視を必要としない。
CASIA-B全体で、提案されたストリームは、強い骨格のバックボーン(例えば、GaitMixer、GaitFormer、GaitGraph)に一貫した利益をもたらし、GaitMixerにアタッチされたときに新しい骨格ベースの最先端を確立する。
この改良は、バッグ(BG)やコート(CL)といった共変量シフトの下で特に顕著であり、明示的な時間周波数モデリングと標準時空間エンコーダの相補性を強調している。
関連論文リスト
- KGS-GCN: Enhancing Sparse Skeleton Sensing via Kinematics-Driven Gaussian Splatting and Probabilistic Topology for Action Recognition [20.09080176203823]
KGS-GCNは、キネマティクス駆動のガウススプラッティングと確率的トポロジーを統合するグラフ畳み込みネットワークである。
我々のフレームワークは、低忠実度センサデータを処理するための堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2026-03-16T07:47:33Z) - Towards Arbitrary Motion Completing via Hierarchical Continuous Representation [64.6525112550758]
Inlicit Representations(INR)に基づくNAMEと呼ばれる新しいパラメトリックアクティベーションによる階層的暗黙表現フレームワークを提案する。
本手法では,複数の時間スケールで動作列から特徴を抽出し,複雑な時間パターンを効果的に捕捉する階層的時間符号化機構を提案する。
論文 参考訳(メタデータ) (2025-12-24T14:07:04Z) - TSkel-Mamba: Temporal Dynamic Modeling via State Space Model for Human Skeleton-based Action Recognition [59.99922360648663]
TSkel-Mambaは、空間力学と時間力学の両方を効果的に捉えるハイブリッドトランスフォーマー-Mambaフレームワークである。
MTIモジュールはマルチスケールのCycle演算子を使用して、チャネル間の時間的相互作用をキャプチャする。
論文 参考訳(メタデータ) (2025-12-12T11:55:16Z) - Frequency Guidance Matters: Skeletal Action Recognition by Frequency-Aware Mixed Transformer [18.459822172890473]
骨格の周波数表現を除去するための周波数認識型アテンションモジュールを提案する。
また、周波数特徴を持つ空間特徴を組み込む混合変圧器アーキテクチャも開発している。
FreqMiXFormerは3つの一般的な骨格認識データセットでSOTAを上回っている。
論文 参考訳(メタデータ) (2024-07-17T05:47:27Z) - Multi-Scale Spatial-Temporal Self-Attention Graph Convolutional Networks for Skeleton-based Action Recognition [0.0]
本稿では,マルチスケール空間時間自己注意(MSST)-GCNという自己注意型GCNハイブリッドモデルを提案する。
適応トポロジを持つ空間自己保持モジュールを用いて、異なる身体部分間のフレーム内相互作用を理解するとともに、時間的自己保持モジュールを用いてノードのフレーム間の相関関係を調べる。
論文 参考訳(メタデータ) (2024-04-03T10:25:45Z) - A Poisson-Gamma Dynamic Factor Model with Time-Varying Transition Dynamics [51.147876395589925]
非定常PGDSは、基礎となる遷移行列が時間とともに進化できるように提案されている。
後続シミュレーションを行うために, 完全共役かつ効率的なギブスサンプリング装置を開発した。
実験により,提案した非定常PGDSは,関連するモデルと比較して予測性能が向上することを示した。
論文 参考訳(メタデータ) (2024-02-26T04:39:01Z) - One-Shot Action Recognition via Multi-Scale Spatial-Temporal Skeleton
Matching [77.6989219290789]
ワンショットスケルトン行動認識は、単一のトレーニングサンプルでスケルトン行動認識モデルを学ぶことを目的としている。
本稿では,マルチスケールな時空間特徴マッチングによる骨格行動認識を行う新しい一発骨格行動認識手法を提案する。
論文 参考訳(メタデータ) (2023-07-14T11:52:10Z) - DG-STGCN: Dynamic Spatial-Temporal Modeling for Skeleton-based Action
Recognition [77.87404524458809]
骨格に基づく行動認識のための新しいフレームワーク,すなわち動的グループ時空間GCN(DG-STGCN)を提案する。
DG-GCNとDG-TCNの2つのモジュールで構成される。
DG-STGCNは最先端の手法よりも一貫して優れており、しばしば顕著な差がある。
論文 参考訳(メタデータ) (2022-10-12T03:17:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。