論文の概要: Skeleton-Based Action Recognition with Spatial-Structural Graph Convolution
- arxiv url: http://arxiv.org/abs/2407.21525v1
- Date: Wed, 31 Jul 2024 11:04:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-01 18:02:39.947382
- Title: Skeleton-Based Action Recognition with Spatial-Structural Graph Convolution
- Title(参考訳): 空間構造グラフ畳み込みを用いた骨格に基づく行動認識
- Authors: Jingyao Wang, Emmanuel Bergeret, Issam Falih,
- Abstract要約: グラフ畳み込みネットワーク(GCN)における骨格データの表現とオーバースムース化の問題について検討する。
空間構造GCN(SpSt-GCN)と呼ばれる2ストリームグラフ畳み込み法を提案する。
提案手法は,NTU RGB+DとNTU RGB+D 120の2つの大規模データセットに対して評価を行った。
- 参考スコア(独自算出の注目度): 0.7373617024876725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human Activity Recognition (HAR) is a field of study that focuses on identifying and classifying human activities. Skeleton-based Human Activity Recognition has received much attention in recent years, where Graph Convolutional Network (GCN) based method is widely used and has achieved remarkable results. However, the representation of skeleton data and the issue of over-smoothing in GCN still need to be studied. 1). Compared to central nodes, edge nodes can only aggregate limited neighbor information, and different edge nodes of the human body are always structurally related. However, the information from edge nodes is crucial for fine-grained activity recognition. 2). The Graph Convolutional Network suffers from a significant over-smoothing issue, causing nodes to become increasingly similar as the number of network layers increases. Based on these two ideas, we propose a two-stream graph convolution method called Spatial-Structural GCN (SpSt-GCN). Spatial GCN performs information aggregation based on the topological structure of the human body, and structural GCN performs differentiation based on the similarity of edge node sequences. The spatial connection is fixed, and the human skeleton naturally maintains this topology regardless of the actions performed by humans. However, the structural connection is dynamic and depends on the type of movement the human body is performing. Based on this idea, we also propose an entirely data-driven structural connection, which greatly increases flexibility. We evaluate our method on two large-scale datasets, i.e., NTU RGB+D and NTU RGB+D 120. The proposed method achieves good results while being efficient.
- Abstract(参考訳): HAR(Human Activity Recognition)は、人間の活動の識別と分類に焦点を当てた研究分野である。
近年、スケルトンを基盤としたヒューマンアクティビティ認識が注目されており、グラフ畳み込みネットワーク(GCN)ベースの手法が広く使われ、目覚ましい成果を上げている。
しかし, 骨格データの表現やGCNの過剰な平滑化の問題について検討する必要がある。
1)。
中央ノードと比較して、エッジノードは限られた隣り合う情報のみを集約することができ、人体の異なるエッジノードは常に構造的に関連している。
しかし、エッジノードからの情報は、きめ細かいアクティビティ認識に不可欠である。
2)。
Graph Convolutional Networkは、重大なオーバースムースな問題に悩まされており、ネットワーク層の増加に伴い、ノードがますます類似するようになる。
これら2つのアイデアに基づいて,空間構造GCN (Spatial-Structural GCN) と呼ばれる2ストリームグラフ畳み込み法を提案する。
空間GCNは人体の位相構造に基づいて情報集約を行い、構造GCNはエッジノード配列の類似性に基づいて微分を行う。
空間接続は固定され、人間の骨格はこのトポロジーを人間の行動にかかわらず自然に維持する。
しかし、構造的接続は動的であり、人体が実行している動きの種類に依存する。
この考え方に基づいて、完全にデータ駆動構造接続を提案し、柔軟性を大幅に向上させる。
提案手法は,NTU RGB+DとNTU RGB+D 120の2つの大規模データセットに対して評価を行った。
提案手法は効率的でありながら良好な結果が得られる。
関連論文リスト
- Learning Graph Filters for Structure-Function Coupling based Hub Node Identification [19.7242695744767]
ハブノードは、特定の機能プロセスに対応する異なる脳ユニットをリンクするネットワーク内の特別なノードである。
本稿では,グラフ信号処理(GSP)に基づくハブ検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-22T20:33:16Z) - Language Knowledge-Assisted Representation Learning for Skeleton-Based
Action Recognition [71.35205097460124]
人間が他人の行動を理解して認識する方法は、複雑な神経科学の問題である。
LA-GCNは、大規模言語モデル(LLM)知識アシストを用いたグラフ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-21T08:29:16Z) - Skeletal Human Action Recognition using Hybrid Attention based Graph
Convolutional Network [3.261599248682793]
相対的距離と相対的角度情報に基づいて局所的注意マップをグローバルに拡張する適応型空間的注意層を提案する。
我々は,頭部,手,足を結ぶ新しい初期グラフ隣接行列を設計し,行動認識精度の点で目に見える改善点を示す。
提案モデルは,日常生活における人間活動の分野における大規模かつ挑戦的な2つのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2022-07-12T12:22:21Z) - Reasoning Graph Networks for Kinship Verification: from Star-shaped to
Hierarchical [85.0376670244522]
階層型推論グラフネットワークの学習による顔の親和性検証の問題点について検討する。
より強力で柔軟なキャパシティを利用するために,星型推論グラフネットワーク(S-RGN)を開発した。
また、より強力で柔軟なキャパシティを利用する階層型推論グラフネットワーク(H-RGN)も開発しています。
論文 参考訳(メタデータ) (2021-09-06T03:16:56Z) - Skeleton-based Hand-Gesture Recognition with Lightweight Graph
Convolutional Networks [14.924672048447338]
グラフ畳み込みネットワーク(GCN)は、グラフのような任意の不規則領域にディープラーニングを拡張することを目的としている。
GCN設計の一環として,入力グラフのトポロジを学習する新しい手法を提案する。
骨格をベースとした手の位置認識の課題に対する実験は, 学習したGCNの高効率性を示す。
論文 参考訳(メタデータ) (2021-04-09T09:06:53Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - CatGCN: Graph Convolutional Networks with Categorical Node Features [99.555850712725]
CatGCNはグラフ学習に適したノード機能である。
エンドツーエンドでCatGCNを訓練し、半教師付きノード分類でそれを実証する。
論文 参考訳(メタデータ) (2020-09-11T09:25:17Z) - AM-GCN: Adaptive Multi-channel Graph Convolutional Networks [85.0332394224503]
グラフ畳み込みネットワーク(GCN)は,豊富な情報を持つ複雑なグラフにおいて,ノードの特徴と位相構造を最適に統合できるかどうかを検討する。
半教師付き分類(AM-GCN)のための適応型マルチチャネルグラフ畳み込みネットワークを提案する。
実験の結果,AM-GCNはノードの特徴とトポロジ的構造の両方から最も相関性の高い情報を抽出することがわかった。
論文 参考訳(メタデータ) (2020-07-05T08:16:03Z) - An Uncoupled Training Architecture for Large Graph Learning [20.784230322205232]
グラフデータをグリッドライクなデータに埋め込むための、柔軟なアンカップリングトレーニングフレームワークであるNode2Gridsを紹介します。
各ノードの影響を次々にランク付けすることで、Node2Gridsは最も影響力のある1階と、中央ノードの融合情報を持つ2階の隣人を選択する。
下流タスクの効率をさらに向上するために、単純なCNNベースのニューラルネットワークを使用して、マッピングされたグリッドのようなデータから重要な情報をキャプチャする。
論文 参考訳(メタデータ) (2020-03-21T11:49:16Z) - Unifying Graph Convolutional Neural Networks and Label Propagation [73.82013612939507]
LPAとGCNの関係を特徴・ラベルの平滑化と特徴・ラベルの影響の2点の観点から検討した。
理論解析に基づいて,ノード分類のためのGCNとLCAを統一するエンドツーエンドモデルを提案する。
我々のモデルは、既存の特徴に基づく注目モデルよりもタスク指向のノードラベルに基づく学習注意重みと見なすこともできる。
論文 参考訳(メタデータ) (2020-02-17T03:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。