論文の概要: Dynamic GCN: Context-enriched Topology Learning for Skeleton-based
Action Recognition
- arxiv url: http://arxiv.org/abs/2007.14690v1
- Date: Wed, 29 Jul 2020 09:12:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 20:28:08.353375
- Title: Dynamic GCN: Context-enriched Topology Learning for Skeleton-based
Action Recognition
- Title(参考訳): 動的GCN:骨格に基づく行動認識のための文脈強化トポロジー学習
- Authors: Fanfan Ye and Shiliang Pu and Qiaoyong Zhong and Chao Li and Di Xie
and Huiming Tang
- Abstract要約: 本稿では,新しい畳み込みニューラルネットワークであるContextencoding Network(CeN)を導入し,骨格トポロジを自動的に学習する動的GCNを提案する。
CeNは非常に軽量だが効果的であり、グラフ畳み込み層に埋め込むことができる。
動的GCNは、既存のメソッドよりも2時間$4times$少なめのFLOPでパフォーマンスが向上する。
- 参考スコア(独自算出の注目度): 40.467040910143616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph Convolutional Networks (GCNs) have attracted increasing interests for
the task of skeleton-based action recognition. The key lies in the design of
the graph structure, which encodes skeleton topology information. In this
paper, we propose Dynamic GCN, in which a novel convolutional neural network
named Contextencoding Network (CeN) is introduced to learn skeleton topology
automatically. In particular, when learning the dependency between two joints,
contextual features from the rest joints are incorporated in a global manner.
CeN is extremely lightweight yet effective, and can be embedded into a graph
convolutional layer. By stacking multiple CeN-enabled graph convolutional
layers, we build Dynamic GCN. Notably, as a merit of CeN, dynamic graph
topologies are constructed for different input samples as well as graph
convolutional layers of various depths. Besides, three alternative context
modeling architectures are well explored, which may serve as a guideline for
future research on graph topology learning. CeN brings only ~7% extra FLOPs for
the baseline model, and Dynamic GCN achieves better performance with
$2\times$~$4\times$ fewer FLOPs than existing methods. By further combining
static physical body connections and motion modalities, we achieve
state-of-the-art performance on three large-scale benchmarks, namely NTU-RGB+D,
NTU-RGB+D 120 and Skeleton-Kinetics.
- Abstract(参考訳): グラフ畳み込みネットワーク(GCN)は骨格に基づく行動認識の課題への関心が高まっている。
鍵となるのは、骨格トポロジー情報をエンコードするグラフ構造の設計にある。
本稿では,新しい畳み込みニューラルネットワークであるContextencoding Network(CeN)を導入し,骨格トポロジを自動的に学習する動的GCNを提案する。
特に、2つのジョイント間の依存性を学ぶ場合、他のジョイントからコンテキスト的な特徴がグローバルに組み込まれます。
CeNは非常に軽量だが効果的であり、グラフ畳み込み層に埋め込むことができる。
複数のCeN対応グラフ畳み込み層を積み重ねることで、動的GCNを構築する。
特に、CeNの利点として、異なる入力サンプルと様々な深さのグラフ畳み込み層に対して動的グラフトポロジーが構築される。
さらに、3つの代替コンテキストモデリングアーキテクチャがよく研究されており、グラフトポロジ学習の今後の研究の指針となる可能性がある。
cenはベースラインモデルにわずか7%のフロップをもたらし、dynamic gcnは2\times$~4\times$のフラップを既存のメソッドよりも少ないパフォーマンスで達成する。
NTU-RGB+D, NTU-RGB+D 120, Skeleton-Kineticsの3つの大規模ベンチマークにおいて, 静的な身体接続と運動のモダリティを更に組み合わせることで, 最先端の性能を実現する。
関連論文リスト
- Graph Contrastive Learning for Skeleton-based Action Recognition [85.86820157810213]
骨格に基づく行動認識のためのグラフコントラスト学習フレームワークを提案する。
SkeletonGCLは、グラフをクラス識別に強制することで、シーケンス間のグラフ学習を関連付ける。
SkeletonGCLは新しいトレーニングパラダイムを確立し、現在のグラフ畳み込みネットワークにシームレスに組み込むことができる。
論文 参考訳(メタデータ) (2023-01-26T02:09:16Z) - Dynamic Hypergraph Convolutional Networks for Skeleton-Based Action
Recognition [22.188135882864287]
骨格に基づく行動認識のための動的ハイパーグラフ畳み込みネットワーク(DHGCN)を提案する。
DHGCNはハイパーグラフを使用して骨格構造を表現し、ヒト関節に含まれる運動情報を効果的に活用する。
論文 参考訳(メタデータ) (2021-12-20T14:46:14Z) - Topology-aware Convolutional Neural Network for Efficient Skeleton-based
Action Recognition [15.93566875893684]
本稿では,Topology-Aware CNN (Ta-CNN) という純粋CNNアーキテクチャを提案する。
我々は,マップ-アットエンド-グループ-マップ操作の組み合わせである,新しいクロスチャネル機能拡張モジュールを開発した。
特に,マップ-アットエンド-グループ-マップ操作の組み合わせである,新しいクロスチャネル機能拡張モジュールを開発した。
論文 参考訳(メタデータ) (2021-12-08T09:02:50Z) - Convolutional Neural Network Dynamics: A Graph Perspective [39.81881710355496]
本稿では,NNのグラフ構造と性能の関係について検討する。
NNの動的グラフ表現について、完全連結層と畳み込み層の構造表現について検討する。
解析により, NNの性能を正確に予測するために, グラフ統計の簡単な要約を用いることができることがわかった。
論文 参考訳(メタデータ) (2021-11-09T20:38:48Z) - ACE-HGNN: Adaptive Curvature Exploration Hyperbolic Graph Neural Network [72.16255675586089]
本稿では、入力グラフと下流タスクに基づいて最適な曲率を適応的に学習する適応曲率探索ハイパーボリックグラフニューラルネットワークACE-HGNNを提案する。
複数の実世界のグラフデータセットの実験は、競争性能と優れた一般化能力を備えたモデル品質において、顕著で一貫したパフォーマンス改善を示す。
論文 参考訳(メタデータ) (2021-10-15T07:18:57Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z) - Simple and Deep Graph Convolutional Networks [63.76221532439285]
グラフ畳み込みネットワーク(GCN)は、グラフ構造化データに対する強力なディープラーニングアプローチである。
その成功にもかかわらず、現在のGCNモデルは、エムの過度に滑らかな問題のため、ほとんどが浅くなっている。
本稿では,2つの単純かつ効果的な手法を用いて,バニラGCNモデルを拡張したGCNIIを提案する。
論文 参考訳(メタデータ) (2020-07-04T16:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。