論文の概要: Contrastive Self-Supervised Learning for Skeleton Representations
- arxiv url: http://arxiv.org/abs/2211.05304v1
- Date: Thu, 10 Nov 2022 02:45:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:37:41.175171
- Title: Contrastive Self-Supervised Learning for Skeleton Representations
- Title(参考訳): 骨格表現のためのコントラスト型自己教師付き学習
- Authors: Nico Lingg, Miguel Sarabia, Luca Zappella and Barry-John Theobald
- Abstract要約: 我々は,スケルトン点雲のセマンティクスをキャプチャする表現を学習するために,コントラッシブな自己教師付き学習手法であるSimCLRを用いている。
表現を事前訓練するために、既存の6つのデータセットを正規化し、4000万以上のスケルトンフレームを得る。
本研究では,3つの下流課題(骨格再構築,運動予測,行動分類)で学習した表現の質を評価する。
- 参考スコア(独自算出の注目度): 2.528877542605869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human skeleton point clouds are commonly used to automatically classify and
predict the behaviour of others. In this paper, we use a contrastive
self-supervised learning method, SimCLR, to learn representations that capture
the semantics of skeleton point clouds. This work focuses on systematically
evaluating the effects that different algorithmic decisions (including
augmentations, dataset partitioning and backbone architecture) have on the
learned skeleton representations. To pre-train the representations, we
normalise six existing datasets to obtain more than 40 million skeleton frames.
We evaluate the quality of the learned representations with three downstream
tasks: skeleton reconstruction, motion prediction, and activity classification.
Our results demonstrate the importance of 1) combining spatial and temporal
augmentations, 2) including additional datasets for encoder training, and 3)
and using a graph neural network as an encoder.
- Abstract(参考訳): ヒトの骨格点雲は、他人の行動を自動的に分類し予測するためによく用いられる。
本稿では,スケルトン点雲のセマンティクスをキャプチャする表現を学習するために,コントラッシブな自己教師付き学習手法であるSimCLRを用いる。
この研究は、異なるアルゴリズム決定(拡張、データセット分割、バックボーンアーキテクチャを含む)が学習された骨格表現に与える影響を体系的に評価することに焦点を当てている。
表現を事前訓練するために、既存の6つのデータセットを正規化し、4000万以上のスケルトンフレームを得る。
本研究では,スケルトン復元,運動予測,活動分類という3つの下流課題を用いて,学習表現の質を評価する。
私たちの結果は
1)空間的及び時間的増補を組み合わせること。
2)エンコーダトレーニング用の追加データセットを含む。
3) グラフニューラルネットワークをエンコーダとして使用する。
関連論文リスト
- Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence
Pre-training [110.55093254677638]
我々はSkeleton Sequence Learning(SSL)という,効率的なスケルトンシーケンス学習フレームワークを提案する。
本論文では,SkeletonMAEという非対称なグラフベースのエンコーダデコーダ事前学習アーキテクチャを構築する。
我々のSSLは、さまざまなデータセットにまたがってうまく一般化し、最先端の自己教師型スケルトンベースのアクション認識手法よりも優れています。
論文 参考訳(メタデータ) (2023-07-17T13:33:11Z) - Self-Supervised 3D Action Representation Learning with Skeleton Cloud
Colorization [75.0912240667375]
3Dスケルトンをベースとした人間の行動認識は近年注目を集めている。
既存の研究のほとんどは、多数のラベル付けされたアクションシーケンスを必要とする教師あり学習に焦点を当てている。
本稿では,骨格に基づく行動認識のための自己教師付き3次元行動表現学習について述べる。
論文 参考訳(メタデータ) (2023-04-18T08:03:26Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Skeleton-Contrastive 3D Action Representation Learning [35.06361753065124]
本稿では,骨格に基づく行動認識に適した特徴空間の自己教師型学習を目指す。
提案手法は,PKUデータセットとNTUデータセットのスケルトンデータからの自己教師付き学習における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-08T14:44:59Z) - Skeleton Cloud Colorization for Unsupervised 3D Action Representation
Learning [65.88887113157627]
骨格に基づく人間の行動認識は近年注目を集めている。
我々は、ラベルのない骨格配列データから骨格表現を学習できる新しいスケルトン雲色化手法を設計する。
提案手法は,既存の教師なしおよび半教師付き3次元動作認識手法よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2021-08-04T10:55:39Z) - A Self-Supervised Gait Encoding Approach with Locality-Awareness for 3D
Skeleton Based Person Re-Identification [65.18004601366066]
3Dスケルトン配列内の歩行特徴による人物再識別(Re-ID)は、いくつかの利点を持つ新しい話題である。
本稿では、ラベルのない骨格データを利用して人物の歩行表現を学習できる自己教師付き歩行符号化手法を提案する。
論文 参考訳(メタデータ) (2020-09-05T16:06:04Z) - Unifying Graph Embedding Features with Graph Convolutional Networks for
Skeleton-based Action Recognition [18.001693718043292]
本稿では,人行動認識のためのグラフ畳み込みネットワークに15のグラフ埋め込み機能を組み込んだ新しいフレームワークを提案する。
我々のモデルは,NTU-RGB+D,Kineetics,SYSU-3Dという3つの大規模データセットで検証されている。
論文 参考訳(メタデータ) (2020-03-06T02:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。