論文の概要: Self-Supervised 3D Action Representation Learning with Skeleton Cloud
Colorization
- arxiv url: http://arxiv.org/abs/2304.08799v1
- Date: Tue, 18 Apr 2023 08:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 15:46:24.768827
- Title: Self-Supervised 3D Action Representation Learning with Skeleton Cloud
Colorization
- Title(参考訳): スケルトンクラウドカラー化による自己教師付き3次元行動表現学習
- Authors: Siyuan Yang, Jun Liu, Shijian Lu, Er Meng Hwa, Yongjian Hu, Alex C.
Kot
- Abstract要約: 3Dスケルトンをベースとした人間の行動認識は近年注目を集めている。
既存の研究のほとんどは、多数のラベル付けされたアクションシーケンスを必要とする教師あり学習に焦点を当てている。
本稿では,骨格に基づく行動認識のための自己教師付き3次元行動表現学習について述べる。
- 参考スコア(独自算出の注目度): 64.48021936153872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Skeleton-based human action recognition has attracted increasing attention
in recent years. Most of the existing work focuses on supervised learning which
requires a large number of labeled action sequences that are often expensive
and time-consuming to annotate. In this paper, we address self-supervised 3D
action representation learning for skeleton-based action recognition. We
investigate self-supervised representation learning and design a novel skeleton
cloud colorization technique that is capable of learning spatial and temporal
skeleton representations from unlabeled skeleton sequence data. We represent a
skeleton action sequence as a 3D skeleton cloud and colorize each point in the
cloud according to its temporal and spatial orders in the original
(unannotated) skeleton sequence. Leveraging the colorized skeleton point cloud,
we design an auto-encoder framework that can learn spatial-temporal features
from the artificial color labels of skeleton joints effectively. Specifically,
we design a two-steam pretraining network that leverages fine-grained and
coarse-grained colorization to learn multi-scale spatial-temporal features.In
addition, we design a Masked Skeleton Cloud Repainting task that can pretrain
the designed auto-encoder framework to learn informative representations. We
evaluate our skeleton cloud colorization approach with linear classifiers
trained under different configurations, including unsupervised,
semi-supervised, fully-supervised, and transfer learning settings. Extensive
experiments on NTU RGB+D, NTU RGB+D 120, PKU-MMD, NW-UCLA, and UWA3D datasets
show that the proposed method outperforms existing unsupervised and
semi-supervised 3D action recognition methods by large margins and achieves
competitive performance in supervised 3D action recognition as well.
- Abstract(参考訳): 3dスケルトンに基づく人間の行動認識は近年注目を集めている。
既存の作業の多くは教師あり学習に重点を置いており、大量のラベル付けされたアクションシーケンスを必要とする。
本稿では骨格に基づく行動認識のための自己教師型3次元行動表現学習について述べる。
自己教師あり表現学習と,ラベルなしスケルトンシーケンスデータから空間的および時間的スケルトン表現を学習できる新しいスケルトンクラウドカラー化手法の設計について検討した。
我々は3次元スケルトン雲として骨格行動シーケンスを表現し、元の(注釈のない)スケルトンシーケンスの時間的および空間的順序に従って雲の各点を着色する。
色付きスケルトン点雲を活用することで、スケルトン関節の人工色ラベルから空間的特徴を効果的に学習できる自動エンコーダフレームワークを設計する。
具体的には、細粒度と粗粒度を利用した2段階事前学習ネットワークを設計し、マルチスケールの時空間特徴を学習すると共に、設計した自動エンコーダフレームワークを事前訓練して情報表現を学習するMasked Skeleton Cloud Repaintingタスクを設計する。
我々は,教師なし,半教師なし,完全教師なし,転送学習設定を含む,異なる構成でトレーニングされた線形分類器を用いて,スケルトンクラウドカラー化アプローチを評価した。
NTU RGB+D, NTU RGB+D 120, PKU-MMD, NW-UCLA, UWA3Dデータセットの大規模な実験により, 提案手法は既存の教師なしおよび半教師付き3D動作認識手法よりも大きなマージンで優れており, 教師付き3D動作認識における競争性能も向上していることが示された。
関連論文リスト
- Dynamic 3D Point Cloud Sequences as 2D Videos [81.46246338686478]
3Dポイントクラウドシーケンスは、現実世界の環境における最も一般的で実用的な表現の1つとして機能する。
textitStructured Point Cloud Videos (SPCV) と呼ばれる新しい汎用表現を提案する。
SPCVは点雲列を空間的滑らかさと時間的一貫性を持つ2Dビデオとして再編成し、画素値は点の3D座標に対応する。
論文 参考訳(メタデータ) (2024-03-02T08:18:57Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Contrastive Self-Supervised Learning for Skeleton Representations [2.528877542605869]
我々は,スケルトン点雲のセマンティクスをキャプチャする表現を学習するために,コントラッシブな自己教師付き学習手法であるSimCLRを用いている。
表現を事前訓練するために、既存の6つのデータセットを正規化し、4000万以上のスケルトンフレームを得る。
本研究では,3つの下流課題(骨格再構築,運動予測,行動分類)で学習した表現の質を評価する。
論文 参考訳(メタデータ) (2022-11-10T02:45:36Z) - Spatio-temporal Self-Supervised Representation Learning for 3D Point
Clouds [96.9027094562957]
ラベルのないタスクから学習できる時間的表現学習フレームワークを導入する。
幼児が野生の視覚的データからどのように学ぶかに触発され、3Dデータから派生した豊かな手がかりを探索する。
STRLは3Dポイントクラウドシーケンスから2つの時間的関連フレームを入力として、空間データ拡張で変換し、不変表現を自己指導的に学習する。
論文 参考訳(メタデータ) (2021-09-01T04:17:11Z) - Skeleton-Contrastive 3D Action Representation Learning [35.06361753065124]
本稿では,骨格に基づく行動認識に適した特徴空間の自己教師型学習を目指す。
提案手法は,PKUデータセットとNTUデータセットのスケルトンデータからの自己教師付き学習における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-08T14:44:59Z) - Skeleton Cloud Colorization for Unsupervised 3D Action Representation
Learning [65.88887113157627]
骨格に基づく人間の行動認識は近年注目を集めている。
我々は、ラベルのない骨格配列データから骨格表現を学習できる新しいスケルトン雲色化手法を設計する。
提案手法は,既存の教師なしおよび半教師付き3次元動作認識手法よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2021-08-04T10:55:39Z) - A Self-Supervised Gait Encoding Approach with Locality-Awareness for 3D
Skeleton Based Person Re-Identification [65.18004601366066]
3Dスケルトン配列内の歩行特徴による人物再識別(Re-ID)は、いくつかの利点を持つ新しい話題である。
本稿では、ラベルのない骨格データを利用して人物の歩行表現を学習できる自己教師付き歩行符号化手法を提案する。
論文 参考訳(メタデータ) (2020-09-05T16:06:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。