論文の概要: Leveraging Third-Order Features in Skeleton-Based Action Recognition
- arxiv url: http://arxiv.org/abs/2105.01563v2
- Date: Wed, 5 May 2021 00:43:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 13:00:51.778047
- Title: Leveraging Third-Order Features in Skeleton-Based Action Recognition
- Title(参考訳): スケルトンに基づく行動認識における3次特徴の活用
- Authors: Zhenyue Qin and Yang Liu and Pan Ji and Dongwoo Kim and Lei Wang and
Bob McKay and Saeed Anwar and Tom Gedeon
- Abstract要約: スケルトン配列は軽量でコンパクトであり、エッジデバイスでのアクション認識に理想的な候補である。
最近のアクション認識法は、特徴融合のためのグラフニューラルネットワークでこれらの表現を使用して、空間時間的キューとして3D関節座標から特徴を抽出します。
関節と体部の関係を強固に捉えるため、角度の3次的特徴を現代建築に融合させることを提案します。
- 参考スコア(独自算出の注目度): 26.349722372701482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Skeleton sequences are light-weight and compact, and thus ideal candidates
for action recognition on edge devices. Recent skeleton-based action
recognition methods extract features from 3D joint coordinates as
spatial-temporal cues, using these representations in a graph neural network
for feature fusion, to boost recognition performance. The use of first- and
second-order features, i.e., joint and bone representations has led to high
accuracy, but many models are still confused by actions that have similar
motion trajectories. To address these issues, we propose fusing third-order
features in the form of angles into modern architectures, to robustly capture
the relationships between joints and body parts. This simple fusion with
popular spatial-temporal graph neural networks achieves new state-of-the-art
accuracy in two large benchmarks, including NTU60 and NTU120, while employing
fewer parameters and reduced run time. Our sourcecode is publicly available at:
https://github.com/ZhenyueQin/Angular-Skeleton-Encoding.
- Abstract(参考訳): スケルトン配列は軽量でコンパクトであり、エッジデバイスでのアクション認識に理想的な候補である。
最近のスケルトンに基づく行動認識法では, 3次元関節座標から特徴を空間-時間的手がかりとして抽出し, 特徴融合のためのグラフニューラルネットワークで表現し, 認識性能を向上させる。
一階と二階の特徴、すなわち関節と骨の表現は高い精度をもたらすが、多くのモデルはまだ類似の運動軌跡を持つ作用によって混乱している。
これらの課題に対処するため,現代建築におけるアングルの形での3次特徴の融合を提案し,関節と身体部分の関係をしっかりと把握する。
一般的な時空間グラフニューラルネットワークとのこの単純な融合は、NTU60とNTU120を含む2つの大きなベンチマークにおいて、パラメータが少なく、実行時間を短縮しながら、新しい最先端の精度を実現する。
私たちのソースコードは、https://github.com/ZhenyueQin/Angular-Skeleton-Encodingで公開されています。
関連論文リスト
- Leveraging Neural Radiance Field in Descriptor Synthesis for Keypoints Scene Coordinate Regression [1.2974519529978974]
本稿では,Neural Radiance Field (NeRF) を用いたキーポイント記述子合成のためのパイプラインを提案する。
新たなポーズを生成してトレーニングされたNeRFモデルに入力して新しいビューを生成することで、当社のアプローチは、データスカース環境でのKSCRの機能を強化します。
提案システムは,最大50%のローカライズ精度向上を実現し,データ合成に要するコストをわずかに抑えることができた。
論文 参考訳(メタデータ) (2024-03-15T13:40:37Z) - Temporal-Viewpoint Transportation Plan for Skeletal Few-shot Action
Recognition [38.27785891922479]
Joint tEmporalとcAmera viewpoiNt alIgnmEntによる3Dスケルトンに基づく動作認識のためのFew-shot Learning Pipeline
論文 参考訳(メタデータ) (2022-10-30T11:46:38Z) - 3D Skeleton-based Few-shot Action Recognition with JEANIE is not so
Na\"ive [28.720272938306692]
We propose a Few-shot Learning pipeline for 3D skeleton-based action recognition by Joint tEmporal and cAmera viewpoiNt alIgnmEnt。
論文 参考訳(メタデータ) (2021-12-23T16:09:23Z) - Learning Multi-Granular Spatio-Temporal Graph Network for Skeleton-based
Action Recognition [49.163326827954656]
骨格に基づく行動分類のための新しい多言語時空間グラフネットワークを提案する。
2つの枝の枝からなるデュアルヘッドグラフネットワークを開発し、少なくとも2つの時間分解能を抽出する。
3つの大規模データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-08-10T09:25:07Z) - HAN: An Efficient Hierarchical Self-Attention Network for Skeleton-Based
Gesture Recognition [73.64451471862613]
骨格に基づくジェスチャー認識のための効率的な階層型自己認識ネットワーク(HAN)を提案する。
ジョイント・セルフアテンション・モジュールは指の空間的特徴を捉え、指の自己アテンション・モジュールは手全体の特徴を集約するように設計されている。
実験の結果,3つのジェスチャ認識データセットに対して,計算複雑性がはるかに低い競合的な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-06-25T02:15:53Z) - Revisiting Skeleton-based Action Recognition [107.08112310075114]
PoseC3Dは骨格に基づく行動認識の新しいアプローチであり、代わりに人間の骨格のベース表現としてグラフシーケンスを積み重ねる3Dヒートマップに依存している。
4つの挑戦的なデータセットにおいて、PoseC3Dは、スケルトン上で単独で使用し、RGBモダリティと組み合わせることで、常に優れたパフォーマンスを得る。
論文 参考訳(メタデータ) (2021-04-28T06:32:17Z) - Attention-Driven Body Pose Encoding for Human Activity Recognition [0.0]
本稿では,人間の行動認識のための新しいアテンションベースボディポーズコーディングを提案する。
濃縮されたデータは、3次元体の関節位置データを補完し、モデル性能を向上させる。
論文 参考訳(メタデータ) (2020-09-29T22:17:17Z) - Perceptron Synthesis Network: Rethinking the Action Scale Variances in
Videos [48.57686258913474]
ビデオアクション認識は、固定サイズの3Dカーネルを積み重ねたCNNによって部分的に解決されている。
データから最適なスケールのカーネルを学習することを提案する。
固定サイズのカーネルの袋からカーネルを生成するために,テキスト分割パーセプトロンシンセサイザーを提案する。
論文 参考訳(メタデータ) (2020-07-22T14:22:29Z) - MotioNet: 3D Human Motion Reconstruction from Monocular Video with
Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。
本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文 参考訳(メタデータ) (2020-06-22T08:50:09Z) - Disentangling and Unifying Graph Convolutions for Skeleton-Based Action
Recognition [79.33539539956186]
本稿では,マルチスケールグラフ畳み込みと,G3Dという空間時間グラフ畳み込み演算子を結合する簡単な方法を提案する。
これらの提案を結合することにより,MS-G3Dという強力な特徴抽出器を開発し,そのモデルが3つの大規模データセット上で従来の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-31T11:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。