論文の概要: Prototypical Contrast and Reverse Prediction: Unsupervised Skeleton
Based Action Recognition
- arxiv url: http://arxiv.org/abs/2011.07236v1
- Date: Sat, 14 Nov 2020 08:04:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 13:36:51.803517
- Title: Prototypical Contrast and Reverse Prediction: Unsupervised Skeleton
Based Action Recognition
- Title(参考訳): プロトタイプコントラストと逆予測:教師なし骨格に基づく行動認識
- Authors: Shihao Xu, Haocong Rao, Xiping Hu, Bin Hu
- Abstract要約: PCRP(Prototypeal Contrast and Reverse Prediction)と呼ばれる新しいフレームワークを提案する。
PCRPは逆逐次予測を生成し、低レベル情報と高レベルパターンを学習する。
また、アクションプロトタイプを作成して、シーケンス間で共有されるセマンティックな類似性を暗黙的にエンコードする。
- 参考スコア(独自算出の注目度): 12.463955174384457
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we focus on unsupervised representation learning for
skeleton-based action recognition. Existing approaches usually learn action
representations by sequential prediction but they suffer from the inability to
fully learn semantic information. To address this limitation, we propose a
novel framework named Prototypical Contrast and Reverse Prediction (PCRP),
which not only creates reverse sequential prediction to learn low-level
information (e.g., body posture at every frame) and high-level pattern (e.g.,
motion order), but also devises action prototypes to implicitly encode semantic
similarity shared among sequences. In general, we regard action prototypes as
latent variables and formulate PCRP as an expectation-maximization task.
Specifically, PCRP iteratively runs (1) E-step as determining the distribution
of prototypes by clustering action encoding from the encoder, and (2) M-step as
optimizing the encoder by minimizing the proposed ProtoMAE loss, which helps
simultaneously pull the action encoding closer to its assigned prototype and
perform reverse prediction task. Extensive experiments on N-UCLA, NTU 60, and
NTU 120 dataset present that PCRP outperforms state-of-the-art unsupervised
methods and even achieves superior performance over some of supervised methods.
Codes are available at https://github.com/Mikexu007/PCRP.
- Abstract(参考訳): 本稿では,スケルトンに基づく行動認識のための教師なし表現学習に着目した。
既存のアプローチは通常、逐次予測によって行動表現を学習するが、意味情報を完全に学習することができない。
そこで本研究では,低レベル情報(各フレームの身体姿勢など)と高レベルパターン(動き順など)を学習するために逆逐次予測を生成するだけでなく,動作プロトタイプを考案し,シーケンス間で共有される意味的類似性を暗黙的にエンコードする手法を提案する。
一般に,動作プロトタイプを潜在変数とみなし,PCRPを期待最大化タスクとする。
具体的には、(1)エンコーダから符号化されたアクションをクラスタリングすることでプロトタイプの分布を決定するためのEステップ、(2)提案したProtoMAE損失を最小化してエンコーダを最適化するMステップを反復的に実行し、同時に割り当てられたプロトタイプにエンコードされたアクションをプルし、逆予測タスクを実行する。
N-UCLA、NTU 60、NTU 120データセットの大規模な実験では、PCRPは最先端の教師なし手法よりも優れており、教師なし手法よりも優れたパフォーマンスを達成している。
コードはhttps://github.com/Mikexu007/PCRPで入手できる。
関連論文リスト
- Sparse Prototype Network for Explainable Pedestrian Behavior Prediction [60.80524827122901]
Sparse Prototype Network (SPN) は,歩行者の将来の行動,軌道,ポーズを同時に予測するための説明可能な手法である。
モノセマンティリティとクラスタリングの制約によって規則化されたプロトタイプは、一貫性と人間の理解可能な機能を学ぶ。
論文 参考訳(メタデータ) (2024-10-16T03:33:40Z) - Multistep Inverse Is Not All You Need [87.62730694973696]
実世界の制御環境では、観測空間は不要に高次元であり、時間関連ノイズにさらされることが多い。
したがって、観測空間を制御関連変数のより単純な空間にマッピングするエンコーダを学ぶことが望ましい。
本稿では,多段階逆予測と遅延フォワードモデルを組み合わせた新しいアルゴリズムACDFを提案する。
論文 参考訳(メタデータ) (2024-03-18T16:36:01Z) - Refine, Discriminate and Align: Stealing Encoders via Sample-Wise Prototypes and Multi-Relational Extraction [57.16121098944589]
RDAは、事前訓練されたエンコーダを盗むために、以前の取り組みで普及した2つの主要な欠陥に対処するために設計された先駆的なアプローチである。
これは、サンプルの様々な視点に対してターゲットエンコーダの表現を統一するサンプルワイドプロトタイプによって達成される。
より強力な有効性を得るために、我々はサロゲートエンコーダを訓練し、ミスマッチした埋め込み-プロトタイプペアを識別するマルチリレーショナル抽出損失を開発する。
論文 参考訳(メタデータ) (2023-12-01T15:03:29Z) - Sub-action Prototype Learning for Point-level Weakly-supervised Temporal
Action Localization [11.777205793663647]
PWTAL(Point-level weak-supervised temporal action Localization)は、アクションインスタンスごとに単一のタイムスタンプアノテーションでアクションをローカライズすることを目的としている。
既存の手法では、ラベルの空間性を緩和するために密度の高い擬似ラベルをマイニングする傾向があるが、潜在的サブアクションの時間構造を見落とし、性能が劣る。
サブアクションプロトタイプクラスタリング(SPC)と順序付きプロトタイプアライメント(OPA)を組み合わせた新しいサブアクションプロトタイプ学習フレームワーク(SPL-Loc)を提案する。
論文 参考訳(メタデータ) (2023-09-16T17:57:40Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - A Prototypical Semantic Decoupling Method via Joint Contrastive Learning
for Few-Shot Name Entity Recognition [24.916377682689955]
名前付きエンティティ認識(NER)は、わずかにラベル付きインスタンスに基づいて名前付きエンティティを識別することを目的としている。
連立コントラスト学習(PSDC)を用いた数発NERのためのプロトタイプセマンティックデカップリング手法を提案する。
2つの数ショットのNERベンチマークによる実験結果から、PSDCは全体の性能において従来のSOTA法よりも一貫して優れていたことが示されている。
論文 参考訳(メタデータ) (2023-02-27T09:20:00Z) - Few-Shot Segmentation via Rich Prototype Generation and Recurrent
Prediction Enhancement [12.614578133091168]
本稿では,プロトタイプ学習パラダイムを強化するために,リッチプロトタイプ生成モジュール (RPGM) と繰り返し予測拡張モジュール (RPEM) を提案する。
RPGMはスーパーピクセルとK平均クラスタリングを組み合わせて、補完的なスケール関係を持つリッチなプロトタイプ機能を生成する。
RPEMは、リカレントメカニズムを使用して、ラウンドウェイ伝搬デコーダを設計する。
論文 参考訳(メタデータ) (2022-10-03T08:46:52Z) - Concept-level Debugging of Part-Prototype Networks [27.700043183428807]
Part-Prototype Networks (ProtoPNets) は、透明性を損なうことなくブラックボックスモデルと同じ性能を実現するために設計された概念ベースの分類器である。
本稿では,ProtoPNetのコンセプトレベルデバッガを提案する。
論文 参考訳(メタデータ) (2022-05-31T13:18:51Z) - Consistency Regularization for Deep Face Anti-Spoofing [69.70647782777051]
顔認証システムでは、顔認証(FAS)が重要な役割を担っている。
このエキサイティングな観察によって、異なる視点の特徴整合性を促進することが、FASモデルを促進するための有望な方法かもしれないと推測する。
FASにおけるEPCR(Embeddding-level and Prediction-level Consistency Regularization)とEPCR(Embeddding-level Consistency Regularization)を併用した。
論文 参考訳(メタデータ) (2021-11-24T08:03:48Z) - Prototypical Contrastive Learning of Unsupervised Representations [171.3046900127166]
原型コントラスト学習(Prototypeal Contrastive Learning, PCL)は、教師なし表現学習法である。
PCLは暗黙的にデータのセマンティック構造を学習された埋め込み空間にエンコードする。
PCLは、複数のベンチマークで最先端のインスタンスワイド・コントラスト学習法より優れている。
論文 参考訳(メタデータ) (2020-05-11T09:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。