論文の概要: Improving Skeleton-based Action Recognitionwith Robust Spatial and
Temporal Features
- arxiv url: http://arxiv.org/abs/2008.00324v1
- Date: Sat, 1 Aug 2020 19:29:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 00:56:25.381439
- Title: Improving Skeleton-based Action Recognitionwith Robust Spatial and
Temporal Features
- Title(参考訳): ロバストな空間的・時間的特徴を用いたスケルトンに基づく行動認識の改善
- Authors: Zeshi Yang and Kangkang Yin
- Abstract要約: 空間と時間におけるより堅牢な識別的特徴を学習するための新しいメカニズムを提案する。
これらの頑健な特徴を学習し、使用することにより、動作認識精度を向上させることができることを示す。
- 参考スコア(独自算出の注目度): 6.548580592686076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently skeleton-based action recognition has made signif-icant progresses
in the computer vision community. Most state-of-the-art algorithms are based on
Graph Convolutional Networks (GCN), andtarget at improving the network
structure of the backbone GCN lay-ers. In this paper, we propose a novel
mechanism to learn more robustdiscriminative features in space and time. More
specifically, we add aDiscriminative Feature Learning (DFL) branch to the last
layers of thenetwork to extract discriminative spatial and temporal features to
helpregularize the learning. We also formally advocate the use of
Direction-Invariant Features (DIF) as input to the neural networks. We show
thataction recognition accuracy can be improved when these robust featuresare
learned and used. We compare our results with those of ST-GCNand related
methods on four datasets: NTU-RGBD60, NTU-RGBD120,SYSU 3DHOI and
Skeleton-Kinetics.
- Abstract(参考訳): 近年,骨格に基づく行動認識がコンピュータビジョンコミュニティにおいて顕著な進歩を遂げている。
ほとんどの最先端アルゴリズムは、Graph Convolutional Networks (GCN)に基づいており、バックボーンGCNレイアのネットワーク構造を改善する。
本稿では,空間と時間におけるよりロバストな識別的特徴を学ぶための新しいメカニズムを提案する。
より具体的には、ネットワークの最後の層にaDiscriminative Feature Learning (DFL)ブランチを追加し、識別的空間的特徴と時間的特徴を抽出して学習を補助する。
また、ニューラルネットワークへの入力としてDirection-Invariant Features (DIF)の使用を正式に提唱する。
これらのロバストな特徴を学習し使用すると、動作認識精度が向上することを示す。
NTU-RGBD60, NTU-RGBD120, SYSU 3DHOI, Skeleton-Kineticsの4つのデータセットにおけるST-GCNand関連手法との比較を行った。
関連論文リスト
- Signal-SGN: A Spiking Graph Convolutional Network for Skeletal Action Recognition via Learning Temporal-Frequency Dynamics [2.9578022754506605]
骨格に基づく行動認識では、グラフ畳み込みネットワーク(GCN)はその複雑さと高エネルギー消費のために制限に直面している。
本稿では、骨格配列の時間次元をスパイキング時間ステップとして活用するSignal-SGN(Spiking Graph Convolutional Network)を提案する。
実験により,提案モデルが既存のSNN法を精度で上回るだけでなく,学習時の計算記憶コストも低減できることがわかった。
論文 参考訳(メタデータ) (2024-08-03T07:47:16Z) - Enhancing Graph Representation Learning with Attention-Driven Spiking Neural Networks [5.627287101959473]
グラフ学習タスクのための従来のニューラルネットワークに代わる有望な代替手段として、スパイキングニューラルネットワーク(SNN)が登場している。
グラフ表現学習を改善するために,注意機構をSNNと統合した新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-25T12:15:10Z) - Unsupervised Spatial-Temporal Feature Enrichment and Fidelity
Preservation Network for Skeleton based Action Recognition [20.07820929037547]
非教師なし骨格に基づく行動認識は近年顕著な進歩を遂げている。
既存の教師なし学習手法は、過度なオーバーフィッティング問題に悩まされる。
本稿では,高機能化を実現するために,非教師付き時空間特徴強調・忠実度保存フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-25T09:24:07Z) - Graph Neural Networks Provably Benefit from Structural Information: A
Feature Learning Perspective [53.999128831324576]
グラフニューラルネットワーク(GNN)は、グラフ表現学習の先駆けとなった。
本研究では,特徴学習理論の文脈におけるグラフ畳み込みの役割について検討する。
論文 参考訳(メタデータ) (2023-06-24T10:21:11Z) - Language Knowledge-Assisted Representation Learning for Skeleton-Based
Action Recognition [71.35205097460124]
人間が他人の行動を理解して認識する方法は、複雑な神経科学の問題である。
LA-GCNは、大規模言語モデル(LLM)知識アシストを用いたグラフ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-21T08:29:16Z) - Spatial Temporal Graph Convolution with Graph Structure Self-learning
for Early MCI Detection [9.11430195887347]
本稿では,EMCI検出のための新しいグラフ構造自己学習機構を備えた空間時空間グラフ畳み込みネットワークを提案する。
The Alzheimer's Disease Neuroimaging Initiative databaseの結果は、我々の手法が最先端のアプローチより優れていることを示している。
論文 参考訳(メタデータ) (2022-11-11T12:29:00Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - A Self-Supervised Gait Encoding Approach with Locality-Awareness for 3D
Skeleton Based Person Re-Identification [65.18004601366066]
3Dスケルトン配列内の歩行特徴による人物再識別(Re-ID)は、いくつかの利点を持つ新しい話題である。
本稿では、ラベルのない骨格データを利用して人物の歩行表現を学習できる自己教師付き歩行符号化手法を提案する。
論文 参考訳(メタデータ) (2020-09-05T16:06:04Z) - Progressive Tandem Learning for Pattern Recognition with Deep Spiking
Neural Networks [80.15411508088522]
スパイキングニューラルネットワーク(SNN)は、低レイテンシと高い計算効率のために、従来の人工知能ニューラルネットワーク(ANN)よりも優位性を示している。
高速かつ効率的なパターン認識のための新しいANN-to-SNN変換およびレイヤワイズ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-02T15:38:44Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z) - Feedback Graph Convolutional Network for Skeleton-based Action
Recognition [38.782491442635205]
フィードバックグラフ畳み込みネットワーク(FGCN)という新しいネットワークを提案する。
これは、GCNとアクション認識にフィードバックメカニズムを導入する最初の作業である。
3つのデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-03-17T07:20:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。