論文の概要: Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition
- arxiv url: http://arxiv.org/abs/2111.03993v1
- Date: Sun, 7 Nov 2021 03:50:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 15:53:08.997569
- Title: Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition
- Title(参考訳): スケルトンに基づく人間行動認識のためのマルチスケールセマンティクス誘導ニューラルネットワーク
- Authors: Pengfei Zhang and Cuiling Lan and Wenjun Zeng and Junliang Xing and
Jianru Xue and Nanning Zheng
- Abstract要約: スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。
MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 140.18376685167857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Skeleton data is of low dimension. However, there is a trend of using very
deep and complicated feedforward neural networks to model the skeleton sequence
without considering the complexity in recent year. In this paper, a simple yet
effective multi-scale semantics-guided neural network (MS-SGN) is proposed for
skeleton-based action recognition. We explicitly introduce the high level
semantics of joints (joint type and frame index) into the network to enhance
the feature representation capability of joints. Moreover, a multi-scale
strategy is proposed to be robust to the temporal scale variations. In
addition, we exploit the relationship of joints hierarchically through two
modules, i.e., a joint-level module for modeling the correlations of joints in
the same frame and a frame-level module for modeling the temporal dependencies
of frames. With an order of magnitude smaller model size than most previous
methods, MSSGN achieves the state-of-the-art performance on the NTU60, NTU120,
and SYSU datasets.
- Abstract(参考訳): スケルトンデータは低次元である。
しかし、近年では複雑さを考慮せずに、非常に深く複雑なフィードフォワードニューラルネットワークを使用して骨格配列をモデル化する傾向にある。
本稿では,スケルトンに基づく行動認識のために,単純なマルチスケールセマンティクス誘導ニューラルネットワーク(MS-SGN)を提案する。
我々は,関節の特徴表現能力を高めるために,関節の高レベル意味論(接合型とフレームインデックス)をネットワークに明示的に導入する。
さらに,時間スケールの変動に対してロバストなマルチスケール戦略を提案する。
さらに,同フレーム内の関節の相関をモデル化するジョイントレベルモジュールと,フレームの時間的依存関係をモデル化するフレームレベルモジュールという,2つのモジュール間の関節関係を階層的に活用する。
MSSGNは、従来の方法よりもモデルサイズが桁違いに小さいため、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
関連論文リスト
- Multi-Scale Spatial-Temporal Self-Attention Graph Convolutional Networks for Skeleton-based Action Recognition [0.0]
本稿では,マルチスケール空間時間自己注意(MSST)-GCNという自己注意型GCNハイブリッドモデルを提案する。
適応トポロジを持つ空間自己保持モジュールを用いて、異なる身体部分間のフレーム内相互作用を理解するとともに、時間的自己保持モジュールを用いてノードのフレーム間の相関関係を調べる。
論文 参考訳(メタデータ) (2024-04-03T10:25:45Z) - SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence
Pre-training [110.55093254677638]
我々はSkeleton Sequence Learning(SSL)という,効率的なスケルトンシーケンス学習フレームワークを提案する。
本論文では,SkeletonMAEという非対称なグラフベースのエンコーダデコーダ事前学習アーキテクチャを構築する。
我々のSSLは、さまざまなデータセットにまたがってうまく一般化し、最先端の自己教師型スケルトンベースのアクション認識手法よりも優れています。
論文 参考訳(メタデータ) (2023-07-17T13:33:11Z) - Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。
NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。
NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文 参考訳(メタデータ) (2022-10-14T18:00:07Z) - DG-STGCN: Dynamic Spatial-Temporal Modeling for Skeleton-based Action
Recognition [77.87404524458809]
骨格に基づく行動認識のための新しいフレームワーク,すなわち動的グループ時空間GCN(DG-STGCN)を提案する。
DG-GCNとDG-TCNの2つのモジュールで構成される。
DG-STGCNは最先端の手法よりも一貫して優れており、しばしば顕著な差がある。
論文 参考訳(メタデータ) (2022-10-12T03:17:37Z) - Pose-Guided Graph Convolutional Networks for Skeleton-Based Action
Recognition [32.07659338674024]
グラフ畳み込みネットワーク(GCN)は、人体骨格を空間的および時間的グラフとしてモデル化することができる。
本研究では,高性能な人行動認識のためのマルチモーダルフレームワークとして,ポーズ誘導型GCN(PG-GCN)を提案する。
このモジュールの中核となる考え方は、トレーニング可能なグラフを使用して、スケルトンストリームから、ポーズストリームの機能を集約することで、より堅牢な機能表現能力を持つネットワークを実現することだ。
論文 参考訳(メタデータ) (2022-10-10T02:08:49Z) - Deep Image Clustering with Contrastive Learning and Multi-scale Graph
Convolutional Networks [58.868899595936476]
コントラスト学習とマルチスケールグラフ畳み込みネットワーク(IcicleGCN)を用いた画像クラスタリング手法を提案する。
複数の画像データセットの実験は、最先端のIcicleGCNよりも優れたクラスタリング性能を示している。
論文 参考訳(メタデータ) (2022-07-14T19:16:56Z) - SpatioTemporal Focus for Skeleton-based Action Recognition [66.8571926307011]
グラフ畳み込みネットワーク(GCN)は骨格に基づく行動認識において広く採用されている。
近年提案されている骨格に基づく行動認識法の性能は以下の要因によって制限されていると論じる。
近年の注目機構に着想を得て,アクション関連関係情報を取得するためのマルチグラインド・コンテキスト集中モジュール MCF を提案する。
論文 参考訳(メタデータ) (2022-03-31T02:45:24Z) - Self-attention based anchor proposal for skeleton-based action
recognition [3.611872164105537]
骨格列は、その軽量でコンパクトな特徴から、行動認識タスクに広く用いられている。
最近のグラフ畳み込みネットワーク(GCN)アプローチは骨格に基づく行動認識において大きな成功を収めている。
本研究では,人体の内部関係を包括的にモデル化する自己注意型骨格アンカー提案モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-17T10:05:57Z) - Relational State-Space Model for Stochastic Multi-Object Systems [24.234120525358456]
本稿では、逐次階層型潜在変数モデルであるリレーショナル状態空間モデル(R-SSM)を紹介する。
R-SSMはグラフニューラルネットワーク(GNN)を用いて、複数の相関オブジェクトの結合状態遷移をシミュレートする。
R-SSMの実用性は、合成および実時間時系列データセットで実証的に評価される。
論文 参考訳(メタデータ) (2020-01-13T03:45:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。