論文の概要: Bootstrapped Representation Learning for Skeleton-Based Action
Recognition
- arxiv url: http://arxiv.org/abs/2202.02232v1
- Date: Fri, 4 Feb 2022 16:58:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-07 15:02:45.886856
- Title: Bootstrapped Representation Learning for Skeleton-Based Action
Recognition
- Title(参考訳): スケルトンベース行動認識のためのブートストラップ表現学習
- Authors: Olivier Moliner, Sangxia Huang, Kalle {\AA}str\"om
- Abstract要約: 本研究では3次元骨格に基づく行動認識のための自己教師付き表現学習について検討する。
本手法は, 線形評価と半教師付きベンチマークの両面において, 技術の現状を常に上回っている。
- 参考スコア(独自算出の注目度): 0.03222802562733786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we study self-supervised representation learning for 3D
skeleton-based action recognition. We extend Bootstrap Your Own Latent (BYOL)
for representation learning on skeleton sequence data and propose a new data
augmentation strategy including two asymmetric transformation pipelines. We
also introduce a multi-viewpoint sampling method that leverages multiple
viewing angles of the same action captured by different cameras. In the
semi-supervised setting, we show that the performance can be further improved
by knowledge distillation from wider networks, leveraging once more the
unlabeled samples. We conduct extensive experiments on the NTU-60 and NTU-120
datasets to demonstrate the performance of our proposed method. Our method
consistently outperforms the current state of the art on both linear evaluation
and semi-supervised benchmarks.
- Abstract(参考訳): 本研究では,3次元スケルトンに基づく行動認識のための自己教師あり表現学習について検討する。
骨格列データに基づく表現学習のためのBootstrap Your Own Latent(BYOL)を拡張し,2つの非対称変換パイプラインを含む新しいデータ拡張戦略を提案する。
また、異なるカメラで撮影された同じ動作の複数の視野角を利用するマルチビューポイントサンプリング手法も導入する。
半教師あり環境では、より広いネットワークからの知識蒸留によってさらに性能が向上し、ラベルなしのサンプルを再び活用できることを示す。
提案手法の性能を示すため,NTU-60およびNTU-120データセットについて広範な実験を行った。
本手法は, 線形評価と半教師付きベンチマークの両方において, 技術の現状を常に上回っている。
関連論文リスト
- Self-supervised Pretraining and Finetuning for Monocular Depth and Visual Odometry [7.067145619709089]
我々は,我々の自己教師型モデルが「鐘と笛なしで」最先端のパフォーマンスに到達できることを実証した。
全てのデータセットに対して,本手法は,特に深度予測タスクにおいて,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-06-16T17:24:20Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - Cross-Stream Contrastive Learning for Self-Supervised Skeleton-Based
Action Recognition [22.067143671631303]
自己教師型骨格に基づく行動認識は、対照的な学習の発展とともに急速に成長する。
骨格に基づく行動表現学習(CSCLR)のためのクロスストリームコントラスト学習フレームワークを提案する。
具体的には、CSCLRはストリーム内コントラストペアを利用するだけでなく、ストリーム間コントラストペアをハードサンプルとして導入し、より良い表現学習を定式化する。
論文 参考訳(メタデータ) (2023-05-03T10:31:35Z) - MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.07391711548269]
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Self-Supervised Monocular Depth Estimation with Self-Reference
Distillation and Disparity Offset Refinement [15.012694052674899]
自己教師付き単分子深度推定を改善するための2つの新しいアイデアを提案する。
我々は,教師が訓練の時期に合わせて更新したパラメータ最適化モデルを用いて,さらなる指導を行う。
我々は,高次特徴量と低次特徴量とのコンテキスト整合性を利用して,マルチスケールの相違オフセットを得る。
論文 参考訳(メタデータ) (2023-02-20T06:28:52Z) - Weighted Ensemble Self-Supervised Learning [67.24482854208783]
組み立ては、モデルパフォーマンスを高めるための強力なテクニックであることが証明されている。
我々は,データ依存型重み付きクロスエントロピー損失を許容するフレームワークを開発した。
提案手法は、ImageNet-1K上での複数の評価指標において、両者に優れる。
論文 参考訳(メタデータ) (2022-11-18T02:00:17Z) - SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video
Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。
マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。
モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文 参考訳(メタデータ) (2022-07-16T19:25:41Z) - Contrastive Learning from Demonstrations [0.0]
これらの表現は、ピック・アンド・プレイスを含むいくつかのロボット作業の模倣に適用可能であることを示す。
我々は、タスク関連情報を強化するためにコントラスト学習を適用することで、最近提案された自己教師付き学習アルゴリズムを最適化する。
論文 参考訳(メタデータ) (2022-01-30T13:36:07Z) - Self-supervised Co-training for Video Representation Learning [103.69904379356413]
実例に基づく情報ノイズコントラスト推定訓練に意味クラス正の付加を施すことの利点について検討する。
本稿では,インフォネッションNCEの損失を改善するための,自己指導型協調学習手法を提案する。
本研究では,2つの下流タスク(行動認識とビデオ検索)における学習表現の質を評価する。
論文 参考訳(メタデータ) (2020-10-19T17:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。