論文の概要: Ske2Grid: Skeleton-to-Grid Representation Learning for Action
Recognition
- arxiv url: http://arxiv.org/abs/2308.07571v1
- Date: Tue, 15 Aug 2023 04:49:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 14:00:22.936187
- Title: Ske2Grid: Skeleton-to-Grid Representation Learning for Action
Recognition
- Title(参考訳): Ske2Grid:行動認識のための骨格-格子表現学習
- Authors: Dongqi Cai, Yangyuxuan Kang, Anbang Yao, Yurong Chen
- Abstract要約: Ske2Gridは骨格に基づく行動認識を改善するための新しい表現学習フレームワークである。
グラフ畳み込みネットワーク上にネットワークを構築し、6つの主流骨格に基づく行動認識データセットで実験を行う。
- 参考スコア(独自算出の注目度): 15.497054173951584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents Ske2Grid, a new representation learning framework for
improved skeleton-based action recognition. In Ske2Grid, we define a regular
convolution operation upon a novel grid representation of human skeleton, which
is a compact image-like grid patch constructed and learned through three novel
designs. Specifically, we propose a graph-node index transform (GIT) to
construct a regular grid patch through assigning the nodes in the skeleton
graph one by one to the desired grid cells. To ensure that GIT is a bijection
and enrich the expressiveness of the grid representation, an up-sampling
transform (UPT) is learned to interpolate the skeleton graph nodes for filling
the grid patch to the full. To resolve the problem when the one-step UPT is
aggressive and further exploit the representation capability of the grid patch
with increasing spatial size, a progressive learning strategy (PLS) is proposed
which decouples the UPT into multiple steps and aligns them to multiple paired
GITs through a compact cascaded design learned progressively. We construct
networks upon prevailing graph convolution networks and conduct experiments on
six mainstream skeleton-based action recognition datasets. Experiments show
that our Ske2Grid significantly outperforms existing GCN-based solutions under
different benchmark settings, without bells and whistles. Code and models are
available at https://github.com/OSVAI/Ske2Grid
- Abstract(参考訳): 本稿では,スケルトンベース行動認識のための新しい表現学習フレームワークske2gridを提案する。
Ske2Gridでは,3つの新しいデザインによって構築・学習されたコンパクトなイメージライクなグリッドパッチである,人間の骨格の新たなグリッド表現に基づいて,定期的な畳み込み動作を定義する。
具体的には,スケルトングラフのノードを1つずつ所望のグリッドセルに割り当てることで,正規グリッドパッチを構築するグラフノードインデックス変換(git)を提案する。
GITをビジェクションとし、グリッド表現の表現性を高めるために、アップサンプリング変換(UPT)を学び、グリッドパッチをフルに埋めるためにスケルトングラフノードを補間する。
ワンステップuptが攻撃的であり、空間サイズが増大するグリッドパッチの表現能力を更に活用する場合には、uptを複数のステップに分離し、段階的に学習するコンパクトなカスケードデザインにより、複数のペアgitに調整するプログレッシブ・ラーニング・ストラテジー(pls)を提案する。
グラフ畳み込みネットワーク上にネットワークを構築し、6つの主流骨格に基づく行動認識データセットで実験を行う。
実験の結果、Ske2Gridはベンチマーク設定の異なる既存のGCNベースのソリューションをベルやホイッスルなしで大幅に上回っていることがわかった。
コードとモデルはhttps://github.com/OSVAI/Ske2Gridで入手できる。
関連論文リスト
- Degree-based stratification of nodes in Graph Neural Networks [66.17149106033126]
グラフニューラルネットワーク(GNN)アーキテクチャを変更して,各グループのノードに対して,重み行列を個別に学習する。
このシンプルな実装変更により、データセットとGNNメソッドのパフォーマンスが改善されているようだ。
論文 参考訳(メタデータ) (2023-12-16T14:09:23Z) - Discrete Graph Auto-Encoder [52.50288418639075]
離散グラフオートエンコーダ(DGAE)という新しいフレームワークを導入する。
まず、置換同変オートエンコーダを用いてグラフを離散潜在ノード表現の集合に変換する。
2番目のステップでは、離散潜在表現の集合をソートし、特別に設計された自己回帰モデルを用いてそれらの分布を学習する。
論文 参考訳(メタデータ) (2023-06-13T12:40:39Z) - 3D Human Pose Lifting with Grid Convolution [20.60797374692489]
本稿では,画像空間における正規畳み込み操作の知恵を模倣したグリッド畳み込み(GridConv)を提案する。
我々の完全畳み込みグリッドリフトネットワークは、最先端の手法よりも顕著なマージンで優れていることを示す。
論文 参考訳(メタデータ) (2023-02-17T08:52:16Z) - Graph Spectral Embedding using the Geodesic Betweeness Centrality [76.27138343125985]
本稿では、局所的な類似性、接続性、グローバル構造を教師なしで表現するグラフSylvester Embedding (GSE)を紹介する。
GSEはシルヴェスター方程式の解を用いて、ネットワーク構造と近傍の近接を1つの表現で捉える。
論文 参考訳(メタデータ) (2022-05-07T04:11:23Z) - SLGCN: Structure Learning Graph Convolutional Networks for Graphs under
Heterophily [5.619890178124606]
本稿では2つの側面から問題を緩和する構造学習グラフ畳み込みネットワーク(SLGCN)を提案する。
具体的には、全ての類似ノードから特徴表現を効率的に集約するために、アンカーを用いた効率的なスペクトルクラスタリング(ESC-ANCH)を設計する。
幅広いベンチマークデータセットの実験結果は、提案されたSLGCNが、最先端のGNNよりも優れていることを示している。
論文 参考訳(メタデータ) (2021-05-28T13:00:38Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Beyond Fixed Grid: Learning Geometric Image Representation with a
Deformable Grid [70.83353059694531]
本稿では,学習可能なニューラルネットワークモジュールであるemphDeformable Grid DefGridを紹介する。
DefGridは、2次元三角格子の頂点の位置オフセットを予測する。
セマンティックセグメンテーションのための一様グリッド上でCNNを使用する場合と比較して,同じグリッド解像度で有意に改善された結果を示す。
論文 参考訳(メタデータ) (2020-08-21T02:22:06Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z) - An Uncoupled Training Architecture for Large Graph Learning [20.784230322205232]
グラフデータをグリッドライクなデータに埋め込むための、柔軟なアンカップリングトレーニングフレームワークであるNode2Gridsを紹介します。
各ノードの影響を次々にランク付けすることで、Node2Gridsは最も影響力のある1階と、中央ノードの融合情報を持つ2階の隣人を選択する。
下流タスクの効率をさらに向上するために、単純なCNNベースのニューラルネットワークを使用して、マッピングされたグリッドのようなデータから重要な情報をキャプチャする。
論文 参考訳(メタデータ) (2020-03-21T11:49:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。