論文の概要: Spatio-Temporal Dual Affine Differential Invariant for Skeleton-based
Action Recognition
- arxiv url: http://arxiv.org/abs/2004.09802v1
- Date: Tue, 21 Apr 2020 08:00:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 07:05:52.608518
- Title: Spatio-Temporal Dual Affine Differential Invariant for Skeleton-based
Action Recognition
- Title(参考訳): スケルトンに基づく行動認識のための時空間双対アフィン微分不変量
- Authors: Qi Li, Hanlin Mo, Jinghan Zhao, Hongxiang Hao and Hua Li
- Abstract要約: 本稿では,2次時変不変時変変換(STDADI)と呼ばれる新しい特徴を提案する。
ニューラルネットワークの性能向上のために,チャネル拡張法を提案する。
大規模行動認識データセットであるNTU-RGB+Dと、その拡張版であるNTU-RGB+D 120では、従来の最先端手法よりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 9.18394914993589
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The dynamics of human skeletons have significant information for the task of
action recognition. The similarity between trajectories of corresponding joints
is an indicating feature of the same action, while this similarity may subject
to some distortions that can be modeled as the combination of spatial and
temporal affine transformations. In this work, we propose a novel feature
called spatio-temporal dual affine differential invariant (STDADI).
Furthermore, in order to improve the generalization ability of neural networks,
a channel augmentation method is proposed. On the large scale action
recognition dataset NTU-RGB+D, and its extended version NTU-RGB+D 120, it
achieves remarkable improvements over previous state-of-the-art methods.
- Abstract(参考訳): 人間の骨格のダイナミクスは、行動認識のタスクに重要な情報を持っている。
対応する関節の軌跡間の類似性は同じ作用を示す特徴であるが、この類似性は空間的アフィン変換と時間的アフィン変換の組み合わせとしてモデル化できるいくつかの歪みを含む可能性がある。
本研究では,時空間双対アフィン微分不変量(stdadi)と呼ばれる新しい特徴を提案する。
さらに,ニューラルネットワークの一般化能力を向上させるために,チャネル拡張法を提案する。
大規模行動認識データセットであるNTU-RGB+Dと、その拡張版であるNTU-RGB+D 120では、従来の最先端手法よりも大幅に改善されている。
関連論文リスト
- An Adaptive Latent Factorization of Tensors Model for Embedding Dynamic Communication Network [15.577058568902272]
Dynamic Communication Network (DCN) は、様々な通信ノード間の時間的相互作用を記述する。
本稿では,適応時間依存型低ランク表現モデル(ATT)を提案する。
実世界のDCN4つの実験結果から,提案したATTモデルは予測誤差と収束ラウンドの両方において,最先端のモデルを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-08-29T14:40:32Z) - Spatial-Temporal Decoupling Contrastive Learning for Skeleton-based
Human Action Recognition [10.403751563214113]
STD-CLは、配列から識別的および意味的に異なる表現を得るためのフレームワークである。
STD-CLは、NTU60、NTU120、NW-UCLAベンチマークでしっかりと改善されている。
論文 参考訳(メタデータ) (2023-12-23T02:54:41Z) - Multilayer Multiset Neuronal Networks -- MMNNs [55.2480439325792]
本研究は,2層以上の類似性ニューロンを組み込んだ多層神経回路網について述べる。
また,回避すべき画像領域に割り当てられる反プロトタイプ点の利用についても検討した。
論文 参考訳(メタデータ) (2023-08-28T12:55:13Z) - Multi-Dimensional Refinement Graph Convolutional Network with Robust
Decouple Loss for Fine-Grained Skeleton-Based Action Recognition [19.031036881780107]
本稿では,CVSTA(Channel-Variable Space-Temporal Attention)と呼ばれるフレキシブルアテンションブロックを提案する。
CVSTAに基づくMDR-GCN(Multi-dimensional Refinement Graph Convolutional Network)を構築し,チャネルレベル,ジョイントレベル,フレームレベルの特徴の識別を改善する。
さらに,CVSTAの効果を著しく向上し,騒音の影響を低減させるロバスト・デデュプル・ロス(RDL)を提案する。
論文 参考訳(メタデータ) (2023-06-27T09:23:36Z) - Spatiotemporal Multi-scale Bilateral Motion Network for Gait Recognition [3.1240043488226967]
本稿では,光学的流れに動機づけられた両動方向の特徴について述べる。
動作コンテキストを多段階の時間分解能でリッチに記述する多段階の時間表現を開発する。
論文 参考訳(メタデータ) (2022-09-26T01:36:22Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。
MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-11-07T03:50:50Z) - Learning Multi-Granular Spatio-Temporal Graph Network for Skeleton-based
Action Recognition [49.163326827954656]
骨格に基づく行動分類のための新しい多言語時空間グラフネットワークを提案する。
2つの枝の枝からなるデュアルヘッドグラフネットワークを開発し、少なくとも2つの時間分解能を抽出する。
3つの大規模データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-08-10T09:25:07Z) - Exploring Modality-shared Appearance Features and Modality-invariant
Relation Features for Cross-modality Person Re-Identification [72.95858515157603]
クロスモダリティの人物再識別作業は、識別モダリティ共有機能に依存する。
初期の成功にもかかわらず、このようなモダリティ共有の外観機能は十分なモダリティ不変情報をキャプチャできない。
クロスモダリティの変動をさらに低減するために、新しいクロスモダリティ四重極損失が提案される。
論文 参考訳(メタデータ) (2021-04-23T11:14:07Z) - Temporal Graph Modeling for Skeleton-based Action Recognition [25.788239844759246]
複雑な時間的ダイナミクスを捉えるための時間拡張グラフ畳み込みネットワーク(TE-GCN)を提案する。
構築された時間関係グラフは、意味的に関連する時間的特徴間の接続を明示的に構築する。
2つの大規模データセットで実験を行う。
論文 参考訳(メタデータ) (2020-12-16T09:02:47Z) - On the spatial attention in Spatio-Temporal Graph Convolutional Networks
for skeleton-based human action recognition [97.14064057840089]
カルチャーネットワーク(GCN)は、スケルトンをグラフとしてモデル化することで、スケルトンに基づく人間の行動認識の性能を約束する。
最近提案されたG時間に基づく手法のほとんどは、ネットワークの各層におけるグラフ構造を学習することで、性能を向上させる。
論文 参考訳(メタデータ) (2020-11-07T19:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。