論文の概要: Topology-aware Convolutional Neural Network for Efficient Skeleton-based
Action Recognition
- arxiv url: http://arxiv.org/abs/2112.04178v2
- Date: Thu, 9 Dec 2021 02:42:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 12:55:27.916911
- Title: Topology-aware Convolutional Neural Network for Efficient Skeleton-based
Action Recognition
- Title(参考訳): スケルトンに基づく効率的な行動認識のためのトポロジー認識畳み込みニューラルネットワーク
- Authors: Kailin Xu, Fanfan Ye, Qiaoyong Zhong, Di Xie
- Abstract要約: 本稿では,Topology-Aware CNN (Ta-CNN) という純粋CNNアーキテクチャを提案する。
我々は,マップ-アットエンド-グループ-マップ操作の組み合わせである,新しいクロスチャネル機能拡張モジュールを開発した。
特に,マップ-アットエンド-グループ-マップ操作の組み合わせである,新しいクロスチャネル機能拡張モジュールを開発した。
- 参考スコア(独自算出の注目度): 15.93566875893684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of skeleton-based action recognition, graph convolutional
networks (GCNs) have been rapidly developed, whereas convolutional neural
networks (CNNs) have received less attention. One reason is that CNNs are
considered poor in modeling the irregular skeleton topology. To alleviate this
limitation, we propose a pure CNN architecture named Topology-aware CNN
(Ta-CNN) in this paper. In particular, we develop a novel cross-channel feature
augmentation module, which is a combo of map-attend-group-map operations. By
applying the module to the coordinate level and the joint level subsequently,
the topology feature is effectively enhanced. Notably, we theoretically prove
that graph convolution is a special case of normal convolution when the joint
dimension is treated as channels. This confirms that the topology modeling
power of GCNs can also be implemented by using a CNN. Moreover, we creatively
design a SkeletonMix strategy which mixes two persons in a unique manner and
further boosts the performance. Extensive experiments are conducted on four
widely used datasets, i.e. N-UCLA, SBU, NTU RGB+D and NTU RGB+D 120 to verify
the effectiveness of Ta-CNN. We surpass existing CNN-based methods
significantly. Compared with leading GCN-based methods, we achieve comparable
performance with much less complexity in terms of the required GFLOPs and
parameters.
- Abstract(参考訳): スケルトンに基づく行動認識では,グラフ畳み込みニューラルネットワーク (gcns) が急速に開発され,畳み込みニューラルネットワーク (cnns) は注目されていない。
1つの理由は、CNNが不規則な骨格トポロジーをモデル化するのに不十分であると考えられるからである。
本稿では,この制限を軽減するために,Topology-Aware CNN (Ta-CNN) という純粋CNNアーキテクチャを提案する。
特に,map-attend-group-map操作を組み合わせた新しいクロスチャネル機能拡張モジュールを開発した。
モジュールを座標レベルおよびジョイントレベルに適用することにより、トポロジの特徴を効果的に強化する。
特に,ジョイント次元をチャネルとして扱う場合,グラフ畳み込みが正規畳み込みの特別な場合であることを理論的に証明する。
これは、GCNのトポロジモデリング能力がCNNを用いて実装可能であることを確認する。
さらに,2人を独特な方法で混合し,パフォーマンスをさらに向上するSkeletonMix戦略を創造的に設計する。
Ta-CNNの有効性を検証するために、N-UCLA、SBU、NTU RGB+D、NTU RGB+D 120の4つの広く使われているデータセットに対して大規模な実験を行った。
我々は既存のCNNベースの手法をはるかに上回っている。
主要なGCNベースの手法と比較して、必要なGFLOPやパラメータに関して、はるかに少ない複雑さで同等のパフォーマンスを達成する。
関連論文リスト
- CNN2GNN: How to Bridge CNN with GNN [59.42117676779735]
蒸留によりCNNとGNNを統一する新しいCNN2GNNフレームワークを提案する。
Mini-ImageNetにおける蒸留ブースターの2層GNNの性能は、ResNet152のような数十層を含むCNNよりもはるかに高い。
論文 参考訳(メタデータ) (2024-04-23T08:19:08Z) - Temporal-Channel Topology Enhanced Network for Skeleton-Based Action
Recognition [26.609509266693077]
骨格に基づく行動認識のための空間的トポロジと時間的トポロジを学習するための新しいCNNアーキテクチャTCTE-Netを提案する。
TCTE-Netは、CNNベースの手法と比較して最先端の性能を示し、GCNベースの手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-02-25T03:09:07Z) - A Gradient Boosting Approach for Training Convolutional and Deep Neural
Networks [0.0]
グラディエントブースティング(GB)に基づく畳み込みニューラルネットワーク(CNN)とディープニューラルネットワークの訓練方法を紹介する。
提案モデルでは,同一アーキテクチャの標準CNNとDeep-NNに対して,分類精度の点で優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-22T12:17:32Z) - What Can Be Learnt With Wide Convolutional Neural Networks? [69.55323565255631]
カーネルシステムにおける無限大の深層CNNについて検討する。
我々は,深部CNNが対象関数の空間スケールに適応していることを証明する。
我々は、別の深部CNNの出力に基づいて訓練された深部CNNの一般化誤差を計算して結論付ける。
論文 参考訳(メタデータ) (2022-08-01T17:19:32Z) - Deep Architecture Connectivity Matters for Its Convergence: A
Fine-Grained Analysis [94.64007376939735]
我々は、勾配降下訓練におけるディープニューラルネットワーク(DNN)の収束に対する接続パターンの影響を理論的に特徴づける。
接続パターンの単純なフィルタリングによって、評価対象のモデルの数を削減できることが示される。
論文 参考訳(メタデータ) (2022-05-11T17:43:54Z) - Channel-wise Topology Refinement Graph Convolution for Skeleton-Based
Action Recognition [40.103229224732196]
本稿では,CTR-GC(Channel-wise Topology Refinement Graph Convolution)を提案する。
本手法では,余分なパラメータをほとんど導入せず,チャネルワイズトポロジのモデル化の難しさを著しく低減する。
我々はCTR-GCNと呼ばれる強力なグラフ畳み込みネットワークを開発し、最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-07-26T13:37:50Z) - Overcoming Catastrophic Forgetting in Graph Neural Networks [50.900153089330175]
破滅的な忘れは、ニューラルネットワークが新しいタスクを学ぶ前に学んだ知識を「忘れる」傾向を指します。
本稿では,この問題を克服し,グラフニューラルネットワーク(GNN)における継続学習を強化するための新しいスキームを提案する。
私たちのアプローチの中心には、トポロジ認識重量保存(TWP)と呼ばれる汎用モジュールがあります。
論文 参考訳(メタデータ) (2020-12-10T22:30:25Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - ACDC: Weight Sharing in Atom-Coefficient Decomposed Convolution [57.635467829558664]
我々は,CNNにおいて,畳み込みカーネル間の構造正則化を導入する。
我々はCNNがパラメータや計算量を劇的に減らして性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-09-04T20:41:47Z) - Dynamic GCN: Context-enriched Topology Learning for Skeleton-based
Action Recognition [40.467040910143616]
本稿では,新しい畳み込みニューラルネットワークであるContextencoding Network(CeN)を導入し,骨格トポロジを自動的に学習する動的GCNを提案する。
CeNは非常に軽量だが効果的であり、グラフ畳み込み層に埋め込むことができる。
動的GCNは、既存のメソッドよりも2時間$4times$少なめのFLOPでパフォーマンスが向上する。
論文 参考訳(メタデータ) (2020-07-29T09:12:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。