論文の概要: Skeleton-Based Action Segmentation with Multi-Stage Spatial-Temporal
Graph Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2202.01727v1
- Date: Thu, 3 Feb 2022 17:42:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-04 14:25:19.536304
- Title: Skeleton-Based Action Segmentation with Multi-Stage Spatial-Temporal
Graph Convolutional Neural Networks
- Title(参考訳): マルチステージ時空間グラフ畳み込みニューラルネットワークを用いた骨格に基づくアクションセグメンテーション
- Authors: Benjamin Filtjens, Bart Vanrumste, Peter Slaets
- Abstract要約: 最先端のアクションセグメンテーションアプローチは、時間的畳み込みの複数の段階を使用する。
多段階時空間グラフ畳み込みニューラルネットワーク(MS-GCN)を提案する。
時間的畳み込みの初期段階を空間的時間的グラフ畳み込みに置き換え、関節の空間的構成をよりよく活用する。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability to identify and temporally segment fine-grained actions in motion
capture sequences is crucial for applications in human movement analysis.
Motion capture is typically performed with optical or inertial measurement
systems, which encode human movement as a time series of human joint locations
and orientations or their higher-order representations. State-of-the-art action
segmentation approaches use multiple stages of temporal convolutions. The main
idea is to generate an initial prediction with several layers of temporal
convolutions and refine these predictions over multiple stages, also with
temporal convolutions. Although these approaches capture long-term temporal
patterns, the initial predictions do not adequately consider the spatial
hierarchy among the human joints. To address this limitation, we present
multi-stage spatial-temporal graph convolutional neural networks (MS-GCN). Our
framework decouples the architecture of the initial prediction generation stage
from the refinement stages. Specifically, we replace the initial stage of
temporal convolutions with spatial-temporal graph convolutions, which better
exploit the spatial configuration of the joints and their temporal dynamics.
Our framework was compared to four strong baselines on five tasks. Experimental
results demonstrate that our framework achieves state-of-the-art performance.
- Abstract(参考訳): モーションキャプチャシーケンスにおけるきめ細かなアクションを識別し、時間分割する能力は、ヒトの動き分析の応用に不可欠である。
モーションキャプチャは通常、人間の移動を人間の関節の位置と方向の時系列または高次の表現として符号化する光学的または慣性測定システムで実行される。
最先端のアクションセグメンテーションアプローチは、時間的畳み込みの複数の段階を使用する。
主なアイデアは、いくつかの時間的畳み込みの層で初期予測を生成し、これらの予測を複数の段階、また時間的畳み込みで洗練することである。
これらの手法は長期の時間的パターンを捉えるが、初期予測は人間の関節の空間的階層を適切に考慮していない。
この制限に対処するため,多段階空間時間グラフ畳み込みニューラルネットワーク(MS-GCN)を提案する。
我々のフレームワークは初期予測生成段階のアーキテクチャを洗練段階から分離する。
具体的には, 時間的畳み込みの初期段階を空間的-時間的グラフ畳み込みに置き換え, 関節の空間的構成と時間的ダイナミクスをよりよく活用する。
私たちのフレームワークは5つのタスクで4つの強いベースラインと比較されました。
実験により,本フレームワークが最先端の性能を達成することを示す。
関連論文リスト
- Multi-Scale Spatial-Temporal Self-Attention Graph Convolutional Networks for Skeleton-based Action Recognition [0.0]
本稿では,マルチスケール空間時間自己注意(MSST)-GCNという自己注意型GCNハイブリッドモデルを提案する。
適応トポロジを持つ空間自己保持モジュールを用いて、異なる身体部分間のフレーム内相互作用を理解するとともに、時間的自己保持モジュールを用いてノードのフレーム間の相関関係を調べる。
論文 参考訳(メタデータ) (2024-04-03T10:25:45Z) - Multiscale Residual Learning of Graph Convolutional Sequence Chunks for
Human Motion Prediction [23.212848643552395]
時間的および空間的依存関係の学習による人間の動作予測のための新しい手法を提案する。
提案手法は,動作予測のためのシーケンス情報を効果的にモデル化し,他の手法よりも優れ,新しい最先端の手法を設定できる。
論文 参考訳(メタデータ) (2023-08-31T15:23:33Z) - Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.68088298632865]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - Diverse Human Motion Prediction Guided by Multi-Level Spatial-Temporal
Anchors [21.915057426589744]
本稿では,サンプルの精度と多様性を促進するために,ランダムなサンプルコードと,決定論的に学習可能なコンポーネントであるアンカーを分離する,単純かつ効果的なアプローチを提案する。
原則として、時空間アンカーベースサンプリング(STARS)は、異なる動き予測器に適用できる。
論文 参考訳(メタデータ) (2023-02-09T18:58:07Z) - Scalable Spatiotemporal Graph Neural Networks [14.415967477487692]
グラフニューラルネットワーク(GNN)は、しばしば予測アーキテクチャのコアコンポーネントである。
ほとんどの時間前GNNでは、計算複雑性はグラフ内のリンクの回数のシーケンスの長さの2乗係数までスケールする。
本稿では,時間的・空間的両方のダイナミックスを効率的に符号化するスケーラブルなアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-09-14T09:47:38Z) - Learning the Evolutionary and Multi-scale Graph Structure for
Multivariate Time Series Forecasting [50.901984244738806]
時系列の進化的・マルチスケール相互作用をモデル化する方法を示す。
特に、まず、拡張畳み込みと協調して、スケール固有の相関を捉える階層グラフ構造を提供する。
最終的な予測を得るために上記のコンポーネントを統合するために、統合ニューラルネットワークが提供される。
論文 参考訳(メタデータ) (2022-06-28T08:11:12Z) - Multivariate Time Series Forecasting with Dynamic Graph Neural ODEs [65.18780403244178]
動的グラフニューラル正規微分方程式(MTGODE)を用いた多変量時系列予測連続モデルを提案する。
具体的には、まず、時間進化するノードの特徴と未知のグラフ構造を持つ動的グラフに多変量時系列を抽象化する。
そして、欠落したグラフトポロジを補完し、空間的および時間的メッセージパッシングを統一するために、ニューラルODEを設計、解決する。
論文 参考訳(メタデータ) (2022-02-17T02:17:31Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Supporting Optimal Phase Space Reconstructions Using Neural Network
Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。
私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文 参考訳(メタデータ) (2020-06-19T21:04:47Z) - MS-TCN++: Multi-Stage Temporal Convolutional Network for Action
Segmentation [87.16030562892537]
本稿では,時間的行動分割タスクのための多段階アーキテクチャを提案する。
第1段階は、次の段階によって洗練される初期予測を生成する。
我々のモデルは3つのデータセットで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-06-16T14:50:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。