論文の概要: Self-attention based anchor proposal for skeleton-based action
recognition
- arxiv url: http://arxiv.org/abs/2112.09413v1
- Date: Fri, 17 Dec 2021 10:05:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-20 22:39:04.750897
- Title: Self-attention based anchor proposal for skeleton-based action
recognition
- Title(参考訳): 自己注意に基づく骨格に基づく行動認識のためのアンカーの提案
- Authors: Ruijie Hou, Zhao Wang
- Abstract要約: 骨格列は、その軽量でコンパクトな特徴から、行動認識タスクに広く用いられている。
最近のグラフ畳み込みネットワーク(GCN)アプローチは骨格に基づく行動認識において大きな成功を収めている。
本研究では,人体の内部関係を包括的にモデル化する自己注意型骨格アンカー提案モジュールを提案する。
- 参考スコア(独自算出の注目度): 3.611872164105537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skeleton sequences are widely used for action recognition task due to its
lightweight and compact characteristics. Recent graph convolutional network
(GCN) approaches have achieved great success for skeleton-based action
recognition since its grateful modeling ability of non-Euclidean data. GCN is
able to utilize the short-range joint dependencies while lack to directly model
the distant joints relations that are vital to distinguishing various actions.
Thus, many GCN approaches try to employ hierarchical mechanism to aggregate
wider-range neighborhood information. We propose a novel self-attention based
skeleton-anchor proposal (SAP) module to comprehensively model the internal
relations of a human body for motion feature learning. The proposed SAP module
aims to explore inherent relationship within human body using a triplet
representation via encoding high order angle information rather than the fixed
pair-wise bone connection used in the existing hierarchical GCN approaches. A
Self-attention based anchor selection method is designed in the proposed SAP
module for extracting the root point of encoding angular information. By
coupling proposed SAP module with popular spatial-temporal graph neural
networks, e.g. MSG3D, it achieves new state-of-the-art accuracy on challenging
benchmark datasets. Further ablation study have shown the effectiveness of our
proposed SAP module, which is able to obviously improve the performance of many
popular skeleton-based action recognition methods.
- Abstract(参考訳): スケルトンシーケンスは、軽量でコンパクトな特性のため、アクション認識タスクに広く使われている。
近年のグラフ畳み込みネットワーク(GCN)アプローチは,非ユークリッドデータのモデリング能力に感謝して,骨格に基づく行動認識において大きな成功を収めている。
GCNは、様々な行動の区別に不可欠である遠方の関節関係を直接モデル化することなく、短距離関節依存関係を利用することができる。
したがって、多くのGCNアプローチは、より広い範囲の近隣情報を集約するために階層的なメカニズムを採用する。
動作特徴学習のための人体の内部関係を包括的にモデル化する,自己注意型骨格アンカー提案(SAP)モジュールを提案する。
提案するSAPモジュールは,既存の階層型GCNアプローチで用いられる固定対骨接続よりも,高次角情報を符号化することで,人体内固有の関係を探索することを目的としている。
角情報を符号化するルートポイントを抽出するSAPモジュールにおいて,自己アテンションに基づくアンカー選択法を設計する。
一般的な時空間グラフニューラルネットワーク(MSG3Dなど)とSAPモジュールを結合することにより、挑戦的なベンチマークデータセットに対して新たな最先端の精度を実現する。
さらなるアブレーション研究により提案するSAPモジュールの有効性が明らかとなり,多くの一般的な骨格に基づく行動認識法の性能向上が図られた。
関連論文リスト
- Multi-Scale Spatial-Temporal Self-Attention Graph Convolutional Networks for Skeleton-based Action Recognition [0.0]
本稿では,マルチスケール空間時間自己注意(MSST)-GCNという自己注意型GCNハイブリッドモデルを提案する。
適応トポロジを持つ空間自己保持モジュールを用いて、異なる身体部分間のフレーム内相互作用を理解するとともに、時間的自己保持モジュールを用いてノードのフレーム間の相関関係を調べる。
論文 参考訳(メタデータ) (2024-04-03T10:25:45Z) - Overcoming Topology Agnosticism: Enhancing Skeleton-Based Action
Recognition through Redefined Skeletal Topology Awareness [24.83836008577395]
グラフ畳み込みネットワーク(GCN)は長い間、骨格に基づく行動認識の最先端を定義してきた。
彼らはモデルの重みとともに隣接行列を最適化する傾向がある。
このプロセスは、骨接続データの段階的な崩壊を引き起こし、マッピングしようとしたトポロジとは無関係なモデルで終わる。
本稿では,骨の接続性をグラフ距離のパワーを利用して符号化する革新的な経路を提案する。
論文 参考訳(メタデータ) (2023-05-19T06:40:12Z) - Pose-Guided Graph Convolutional Networks for Skeleton-Based Action
Recognition [32.07659338674024]
グラフ畳み込みネットワーク(GCN)は、人体骨格を空間的および時間的グラフとしてモデル化することができる。
本研究では,高性能な人行動認識のためのマルチモーダルフレームワークとして,ポーズ誘導型GCN(PG-GCN)を提案する。
このモジュールの中核となる考え方は、トレーニング可能なグラフを使用して、スケルトンストリームから、ポーズストリームの機能を集約することで、より堅牢な機能表現能力を持つネットワークを実現することだ。
論文 参考訳(メタデータ) (2022-10-10T02:08:49Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - SpatioTemporal Focus for Skeleton-based Action Recognition [66.8571926307011]
グラフ畳み込みネットワーク(GCN)は骨格に基づく行動認識において広く採用されている。
近年提案されている骨格に基づく行動認識法の性能は以下の要因によって制限されていると論じる。
近年の注目機構に着想を得て,アクション関連関係情報を取得するためのマルチグラインド・コンテキスト集中モジュール MCF を提案する。
論文 参考訳(メタデータ) (2022-03-31T02:45:24Z) - Joint-bone Fusion Graph Convolutional Network for Semi-supervised
Skeleton Action Recognition [65.78703941973183]
本稿では,CD-JBF-GCNをエンコーダとし,ポーズ予測ヘッドをデコーダとして使用する新しい相関駆動型ジョイントボーン・フュージョングラフ畳み込みネットワークを提案する。
具体的には、CD-JBF-GCは、関節ストリームと骨ストリームの間の運動伝達を探索することができる。
自己教師型トレーニング段階におけるポーズ予測に基づくオートエンコーダにより、未ラベルデータから動作表現を学習することができる。
論文 参考訳(メタデータ) (2022-02-08T16:03:15Z) - Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。
MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-11-07T03:50:50Z) - HAN: An Efficient Hierarchical Self-Attention Network for Skeleton-Based
Gesture Recognition [73.64451471862613]
骨格に基づくジェスチャー認識のための効率的な階層型自己認識ネットワーク(HAN)を提案する。
ジョイント・セルフアテンション・モジュールは指の空間的特徴を捉え、指の自己アテンション・モジュールは手全体の特徴を集約するように設計されている。
実験の結果,3つのジェスチャ認識データセットに対して,計算複雑性がはるかに低い競合的な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-06-25T02:15:53Z) - Multi-Level Graph Encoding with Structural-Collaborative Relation
Learning for Skeleton-Based Person Re-Identification [11.303008512400893]
Skeletonベースの人物再識別(Re-ID)は、安全クリティカルなアプリケーションに優れた価値を提供する、新たなオープントピックである。
既存の方法は通常、手作りの特徴やモデル骨格のダイナミクスを体関節の軌跡から抽出する。
Re-IDの識別グラフ特徴を符号化するために,構造協調関係学習(MG-SCR)を用いたマルチレベルグラフ符号化手法を提案する。
論文 参考訳(メタデータ) (2021-06-06T09:09:57Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。