論文の概要: Temporal Extension Module for Skeleton-Based Action Recognition
- arxiv url: http://arxiv.org/abs/2003.08951v2
- Date: Mon, 19 Oct 2020 02:39:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 04:32:30.008115
- Title: Temporal Extension Module for Skeleton-Based Action Recognition
- Title(参考訳): スケルトンに基づく行動認識のための時間拡張モジュール
- Authors: Yuya Obinata and Takuma Yamamoto
- Abstract要約: 本稿では,グラフ畳み込みネットワーク(GCN)の時間グラフを拡張するモジュールについて述べる。
我々のモジュールは、人間の運動における複数の関節の相関特徴を抽出するための、シンプルで効果的な方法である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a module that extends the temporal graph of a graph convolutional
network (GCN) for action recognition with a sequence of skeletons. Existing
methods attempt to represent a more appropriate spatial graph on an
intra-frame, but disregard optimization of the temporal graph on the
interframe. Concretely, these methods connect between vertices corresponding
only to the same joint on the inter-frame. In this work, we focus on adding
connections to neighboring multiple vertices on the inter-frame and extracting
additional features based on the extended temporal graph. Our module is a
simple yet effective method to extract correlated features of multiple joints
in human movement. Moreover, our module aids in further performance
improvements, along with other GCN methods that optimize only the spatial
graph. We conduct extensive experiments on two large datasets, NTU RGB+D and
Kinetics-Skeleton, and demonstrate that our module is effective for several
existing models and our final model achieves state-of-the-art performance.
- Abstract(参考訳): 本稿では,グラフ畳み込みネットワーク(gcn)の時間グラフを拡張し,スケルトン列を用いた動作認識を行うモジュールを提案する。
既存の手法ではフレーム内でより適切な空間グラフを表現するが、フレーム間の時間グラフの最適化は無視する。
具体的には、これらの方法はフレーム間の同じジョイントのみに対応する頂点間を接続する。
本研究では,フレーム間の隣接する複数の頂点に接続を付加することに集中し,拡張時間グラフに基づく追加特徴を抽出する。
本モジュールは,ヒト運動中の複数の関節の相関特徴を簡易かつ効果的に抽出する手法である。
さらに,このモジュールは,空間グラフのみを最適化する他のGCNメソッドとともに,さらなるパフォーマンス向上を支援する。
我々は,NTU RGB+D と Kinetics-Skeleton の2つの大規模データセットに対して広範な実験を行い,本モジュールがいくつかの既存モデルに有効であること,最終モデルが最先端の性能を達成することを実証した。
関連論文リスト
- Multi-Scale Spatial-Temporal Self-Attention Graph Convolutional Networks for Skeleton-based Action Recognition [0.0]
本稿では,マルチスケール空間時間自己注意(MSST)-GCNという自己注意型GCNハイブリッドモデルを提案する。
適応トポロジを持つ空間自己保持モジュールを用いて、異なる身体部分間のフレーム内相互作用を理解するとともに、時間的自己保持モジュールを用いてノードのフレーム間の相関関係を調べる。
論文 参考訳(メタデータ) (2024-04-03T10:25:45Z) - Multi-Scale Spatial Temporal Graph Convolutional Network for
Skeleton-Based Action Recognition [13.15374205970988]
本稿では,マルチスケール空間グラフ畳み込み (MS-GC) モジュールとマルチスケール時間グラフ畳み込み (MT-GC) モジュールを提案する。
MS-GCおよびMT-GCモジュールは対応する局所グラフ畳み込みをサブグラフ畳み込みの集合に分解し、階層的残差アーキテクチャを形成する。
本稿では,マルチスケールな時空間グラフ畳み込みネットワーク(MST-GCN)を提案する。
論文 参考訳(メタデータ) (2022-06-27T03:17:33Z) - Spatio-Temporal Joint Graph Convolutional Networks for Traffic
Forecasting [75.10017445699532]
近年、時間グラフモデリング問題として交通予測の定式化に焦点が移っている。
本稿では,道路網における交通予測の精度向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-25T08:45:14Z) - Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。
MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-11-07T03:50:50Z) - Learning Multi-Granular Spatio-Temporal Graph Network for Skeleton-based
Action Recognition [49.163326827954656]
骨格に基づく行動分類のための新しい多言語時空間グラフネットワークを提案する。
2つの枝の枝からなるデュアルヘッドグラフネットワークを開発し、少なくとも2つの時間分解能を抽出する。
3つの大規模データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-08-10T09:25:07Z) - Temporal Graph Modeling for Skeleton-based Action Recognition [25.788239844759246]
複雑な時間的ダイナミクスを捉えるための時間拡張グラフ畳み込みネットワーク(TE-GCN)を提案する。
構築された時間関係グラフは、意味的に関連する時間的特徴間の接続を明示的に構築する。
2つの大規模データセットで実験を行う。
論文 参考訳(メタデータ) (2020-12-16T09:02:47Z) - Multi Scale Temporal Graph Networks For Skeleton-based Action
Recognition [5.970574258839858]
グラフ畳み込みネットワーク(GCN)は、関連するノードの特徴を効果的に捉え、モデルの性能を向上させる。
まず、時間的特徴と空間的特徴の整合性を無視し、特徴をノード単位とフレーム単位で抽出する。
本稿では,行動認識のための時間グラフネットワーク(TGN)と呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-05T08:08:25Z) - On the spatial attention in Spatio-Temporal Graph Convolutional Networks
for skeleton-based human action recognition [97.14064057840089]
カルチャーネットワーク(GCN)は、スケルトンをグラフとしてモデル化することで、スケルトンに基づく人間の行動認識の性能を約束する。
最近提案されたG時間に基づく手法のほとんどは、ネットワークの各層におけるグラフ構造を学習することで、性能を向上させる。
論文 参考訳(メタデータ) (2020-11-07T19:03:04Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z) - Disentangling and Unifying Graph Convolutions for Skeleton-Based Action
Recognition [79.33539539956186]
本稿では,マルチスケールグラフ畳み込みと,G3Dという空間時間グラフ畳み込み演算子を結合する簡単な方法を提案する。
これらの提案を結合することにより,MS-G3Dという強力な特徴抽出器を開発し,そのモデルが3つの大規模データセット上で従来の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-31T11:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。