論文の概要: Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition
- arxiv url: http://arxiv.org/abs/2007.15678v2
- Date: Mon, 3 Aug 2020 14:19:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 14:36:02.554905
- Title: Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition
- Title(参考訳): 3次元骨格に基づく行動認識のためのポアンカー{e}形状の混合次元
- Authors: Wei Peng and Jingang Shi and Zhaoqiang Xia and Guoying Zhao
- Abstract要約: グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
- 参考スコア(独自算出の注目度): 57.98278794950759
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Graph Convolutional Networks (GCNs) have already demonstrated their powerful
ability to model the irregular data, e.g., skeletal data in human action
recognition, providing an exciting new way to fuse rich structural information
for nodes residing in different parts of a graph. In human action recognition,
current works introduce a dynamic graph generation mechanism to better capture
the underlying semantic skeleton connections and thus improves the performance.
In this paper, we provide an orthogonal way to explore the underlying
connections. Instead of introducing an expensive dynamic graph generation
paradigm, we build a more efficient GCN on a Riemann manifold, which we think
is a more suitable space to model the graph data, to make the extracted
representations fit the embedding matrix. Specifically, we present a novel
spatial-temporal GCN (ST-GCN) architecture which is defined via the Poincar\'e
geometry such that it is able to better model the latent anatomy of the
structure data. To further explore the optimal projection dimension in the
Riemann space, we mix different dimensions on the manifold and provide an
efficient way to explore the dimension for each ST-GCN layer. With the final
resulted architecture, we evaluate our method on two current largest scale 3D
datasets, i.e., NTU RGB+D and NTU RGB+D 120. The comparison results show that
the model could achieve a superior performance under any given evaluation
metrics with only 40\% model size when compared with the previous best GCN
method, which proves the effectiveness of our model.
- Abstract(参考訳): グラフ畳み込みネットワーク(GCN)は、人間の行動認識における骨格データなどの不規則データをモデル化する強力な能力をすでに示しており、グラフの異なる部分に存在するノードに対して、豊富な構造情報を融合するエキサイティングな新しい方法を提供する。
人間の行動認識において、現在の研究は、基礎となるセマンティックスケルトン接続をよりよく捕捉し、パフォーマンスを向上させるために、動的グラフ生成機構を導入している。
本稿では,基礎となる接続を直交的に探究する方法を提案する。
高価な動的グラフ生成パラダイムを導入する代わりに、私たちはリーマン多様体上のより効率的なgcnを構築します。
具体的には,Poincar\'e幾何を用いて定義された新しい時空間GCN(Spatial-temporal GCN)アーキテクチャを提案する。
リーマン空間における最適射影次元をさらに探求するために、多様体上の異なる次元を混合し、各ST-GCN層の次元を探索する効率的な方法を提供する。
最終結果から,NTU RGB+DとNTU RGB+D 120の2つの大規模3Dデータセットに対して,本手法の評価を行った。
その結果, モデルの有効性を実証したGCN法と比較すると, モデルサイズを40倍に抑えれば, 任意の評価指標よりも優れた性能が得られることがわかった。
関連論文リスト
- Equivariant Neural Operator Learning with Graphon Convolution [12.059797539633506]
本稿では3次元ユークリッド空間における連続関数間の写像を学習するための学習係数スキームと残留演算子層を結合した一般アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-11-17T23:28:22Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Latent Graph Inference using Product Manifolds [0.0]
遅延グラフ学習のための離散微分可能グラフモジュール(dDGM)を一般化する。
我々の新しいアプローチは、幅広いデータセットでテストされ、元のdDGMモデルよりも優れています。
論文 参考訳(メタデータ) (2022-11-26T22:13:06Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - ACE-HGNN: Adaptive Curvature Exploration Hyperbolic Graph Neural Network [72.16255675586089]
本稿では、入力グラフと下流タスクに基づいて最適な曲率を適応的に学習する適応曲率探索ハイパーボリックグラフニューラルネットワークACE-HGNNを提案する。
複数の実世界のグラフデータセットの実験は、競争性能と優れた一般化能力を備えたモデル品質において、顕著で一貫したパフォーマンス改善を示す。
論文 参考訳(メタデータ) (2021-10-15T07:18:57Z) - Dense Graph Convolutional Neural Networks on 3D Meshes for 3D Object
Segmentation and Classification [0.0]
本稿では3次元メッシュ上でのグラフ畳み込みニューラルネットワーク(GCN)の設計について述べる。
メッシュの顔を基本処理単位とし、各ノードが顔に対応するグラフとして3Dメッシュを表現する。
論文 参考訳(メタデータ) (2021-06-30T02:17:16Z) - On the spatial attention in Spatio-Temporal Graph Convolutional Networks
for skeleton-based human action recognition [97.14064057840089]
カルチャーネットワーク(GCN)は、スケルトンをグラフとしてモデル化することで、スケルトンに基づく人間の行動認識の性能を約束する。
最近提案されたG時間に基づく手法のほとんどは、ネットワークの各層におけるグラフ構造を学習することで、性能を向上させる。
論文 参考訳(メタデータ) (2020-11-07T19:03:04Z) - Meta Graph Attention on Heterogeneous Graph with Node-Edge Co-evolution [44.90253939019069]
Coevolved Meta Graph Neural Network (CoMGNN) を提案する。
また,ノードとエッジの時間パターンをモデル化するためのCoMGNN(ST-CoMGNN)を提案する。
論文 参考訳(メタデータ) (2020-10-09T13:19:39Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - Disentangling and Unifying Graph Convolutions for Skeleton-Based Action
Recognition [79.33539539956186]
本稿では,マルチスケールグラフ畳み込みと,G3Dという空間時間グラフ畳み込み演算子を結合する簡単な方法を提案する。
これらの提案を結合することにより,MS-G3Dという強力な特徴抽出器を開発し,そのモデルが3つの大規模データセット上で従来の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-31T11:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。